第1章 人工智能产业发展综述

作为新一轮科技革命和产业变革的战略核心,人工智能产业可大致分为两个基本组成部分:核心产业部门和融合产业部门。核心部门主要包括基础支撑层、通用技术层研发和生产企业,是人工智能产业发展的基础技术和核心技术的供应方;融合产业部门则由运用人工智能技术赋能传统产业的应用层企业构成。随着近几年AI芯片算力的大幅提升、算法模型的不断进化,人工智能核心技术广泛应用于金融、安防、零售、医疗、教育、交通等行业具体场景,而不断完善的数据和产业智能化需求又强力驱动算力、算法、核心AI技术的进步和落地应用。

近年来,AI产业各项核心技术持续取得进展。

在AI芯片方面,英伟达推出旗舰计算GPU新品A100,其AI训练峰值、AI推理峰值均较上一代Volta架构GPU Tesla V100提升为原来的20倍;IBM研发出兼顾高精度学习和低精度推理的深度学习芯片,可执行卷积神经网络、多层传感器和长短期记忆等三种深度学习模式。

在深度学习方面,谷歌开源了可用于语音识别或图像识别等任务的深度学习框架TensorFlow;脸书研发了用于自然语言处理的深度学习框架Pytorch;DeepMind开发的FermiNet可近似计算薛定谔方程,为深度学习在量子化学领域应用奠定了基础;百度发布基于飞桨的生物计算平台PaddleHelix。

在自然语言处理和智能语音方面,DeepMind联合多家大学与脸书共同提出新的测试标准SuperGLUE,可更好地测试NLP模型;微软DeBERTa模型和谷歌T5+Meena模型在最新的SuperGLUE测试上首次取得超越人类水平的成绩;英伟达开源了MeMo及Quartz.Net框架,使端到端自动语音识别系统模型训练更高效;OpenAI陆续发布了GPT、GPT-2和GPT-3等自然语言处理的模型,其中GPT-3参数规模达1700亿个,可以写小说、编剧本,甚至生成计算机代码等,被称为“万能语言模型”;百度的DuerOS 3.0全面升级了情感语音播报、声纹识别等自然语言交互技术;微软研发的机器翻译系统首次在通用新闻翻译中达到人类专业水平。

在计算机视觉方面,臻迪融合声呐及视觉传感器,使水下机器人实现自主导航及智能识别;日本电信巨头NTT East和初创公司Earth Eyes共同研发了一款“AI Guardman”新型人工智能安全摄像头,能够帮助日本的店主识别潜在的商店扒手;三星发布能将面部图像转为视频序列的系统,使图片可直接生成对抗网络来创建深层的伪造视频。