您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国信通院]:人工智能发展白皮书-技术架构篇(2018年) - 发现报告
当前位置:首页/行业研究/报告详情/

人工智能发展白皮书-技术架构篇(2018年)

人工智能发展白皮书-技术架构篇(2018年)

人工智能发展白皮书 技术架构篇 (2018年) 中国信息通信研究院 中国人工智能产业发展联盟 2018年9月 版权声明 本白皮书版权属于中国信息通信研究院和中国人工智能产业发展联盟,并受法律保护。转载、摘编或利用其它方式使用本白皮书文字或者观点的,应注明“来源:中国信息通信研究院和中国人工智能产业发展联盟”。违反上述声明者,编者将追究其相关法律责任。 前言 人工智能是一种引发诸多领域产生颠覆性变革的前沿技术,当今的人工智能技术以机器学习,特别是深度学习为核心,在视觉、语音、自然语言等应用领域迅速发展,已经开始像水电煤一样赋能于各个行业。世界各国高度重视人工智能发展,美国白宫接连发布数个人工智能政府报告,是第一个将人工智能发展上升到国家战略层面的国家,除此以外,英国、欧盟、日本等纷纷发布人工智能相关战略、行动计划,着力构筑人工智能先发优势。我国高度重视人工智能产业的发展,习近平总书记在十九大报告中指出,要“推动互联网、大数据、人工智能和实体经济深度融合“,从2016年起已有《“互联网+人工智能三年行动实施方案》、《新一代人工智能发展规划》、《促进新一代人工智能产业发展三年行动计划(2018-2020年)》等多个国家层面的政策出台,也取得了积极的效果,我国逐渐形成了涵盖计算芯片、开源平台、基础应用、行业应用及产品等环节较完善的人工智能产业链。 2018 人工智能发展白皮书是中国信息通信研究院、中国人工智能产业发展联盟首次联合发布。本篇为技术架构篇,从产业发展的角度,选择以深度学习算法驱动的人工智能技术为主线,分析作为人工智能发展“三驾马车”的算法、算力和数据的技术现状、问题以及趋势,并对智能语音、语义理解、计算机视觉等基础应用技术进行分析,并提出了目前存在的问题和技术的发展趋势。后续我院与中国人工智能产业发展联盟将继续发布人工智能应用、产业和政策方面研究成果。 目录 一、 人工智能技术发展概述......................................... 1 (一) 人工智能技术流派发展简析 ................................. 1 (二) 深度学习带动本轮人工智能发展 ............................. 2 二、 基于深度学习的人工智能技术现状............................... 3 (一) 基于深度学习的人工智能技术体系综述 ....................... 3 1. 基础硬件层................................................... 4 2. 深度神经网络模型编译器....................................... 4 3. 软件框架层................................................... 4 4. 基础应用技术................................................. 5 (二) 算法发展趋势 ............................................. 5 1. 算法的设计逻辑............................................... 5 2. 算法的主要任务............................................... 6 3. 新算法不断提出............................................... 7 (三) 软件框架成为技术体系核心 ................................. 8 1. 开源软件框架百花齐放各具特点................................. 8 2. 巨头以开源软件框架为核心打造生态............................ 11 (四) 编译器解决不同软硬件的适配问题 .......................... 12 1. 深度学习网络模型编译器解决适应性问题........................ 13 2. 中间表示层解决可移植性问题.................................. 14 3. 未来亟需模型转换及通用的模型表示............................ 15 (五) AI计算芯片提供算力保障.................................. 16 1. 深度学习对AI计算芯片的需求................................. 16 2. 典型AI计算芯片的使用现状................................... 16 (六) 数据为算法模型提供基础资源 .............................. 19 (七) 高性能计算服务器和服务平台快速发展 ...................... 20 1. GPU服务器 .................................................. 20 2. 以服务的形式提供人工智能能力成为趋势........................ 21 三、 基于深度学习的基础应用技术现状.............................. 22 (一) 智能语音技术改变人机交互模式 ............................ 23 1. 智能语音技术概述............................................ 23 2. 智能语音产品和服务形态多样.................................. 23 (二) 计算机视觉技术已在多个领域实现商业化落地 ................ 24 1. 计算机视觉概述.............................................. 24 2. 计算机视觉技术应用领域广阔.................................. 26 (三) 自然语言处理成为语言交互技术的核心 ...................... 27 1. 自然语言处理技术现状........................................ 27 2. 自然语言处理技术的应用方向.................................. 28 四、 问题和趋势展望.............................................. 28 (一) 主要问题 ................................................ 28 (二) 趋势展望 ................................................ 30 中国信息通信研究院&中国人工智能产业发展联盟 人工智能发展白皮书-技术架构篇(2018) 1 一、 人工智能技术发展概述 (一) 人工智能技术流派发展简析 让机器实现人的智能,一直是人工智能学者不断追求的目标,不同学科背景或应用领域的学者,从不同角度,用不同的方法,沿着不同的途径对智能进行了探索。其中,符号主义、连接主义和行为主义是人工智能发展历史上的三大技术流派。 符号主义又称为逻辑主义,在人工智能早期一直占据主导地位。该学派认为人工智能源于数学逻辑,其实质是模拟人的抽象逻辑思维,用符号描述人类的认知过程。早期的研究思路是通过基本的推断步骤寻求完全解,出现了逻辑理论家和几何定理证明器等。上世纪70年代出现了大量的专家系统,结合了领域知识和逻辑推断,使得人工智能进入了工程应用。PC机的出现以及专家系统高昂的成本,使符号学派在人工智能领域的主导地位逐渐被连接主义取代。 连接主义又称为仿生学派,当前占据主导地位。该学派认为人工智能源于仿生学,应以工程技术手段模拟人脑神经系统的结构和功能。连接主义最早可追溯到1943年麦卡洛克和皮茨创立的脑模型,由于受理论模型、生物原型和技术条件的限制,在20世纪70年代陷入低潮。直到1982年霍普菲尔特提出的Hopfield神经网络模型和1986年鲁梅尔哈特等人提出的反向传播算法,使得神经网络的理论研究取得了突破。2006年,连接主义的领军者Hinton提出了深度学习算法,使神经网络的能力大大提高。2012年,使用深度学习技术的AlexNet模型在ImageNet竞赛中获得冠军。 人工智能发展白皮书-技术架构篇(2018) 中国信息通信研究院&中国人工智能产业发展联盟 2 行为主义又称为进化主义,近年来随着AlphaGo取得的突破而受到广泛关注。该学派认为人工智能源于控制论,智能行为的基础是“感知—行动”的反应机制,所以智能无需知识表示,无需推断。智能只是在与环境交互作用中表现出来,需要具有不同的行为模块与环境交互,以此来产生复杂的行为。 在人工智能的发展过程中,符号主义、连接主义和行为主义等流派不仅先后在各自领域取得了成果,各学派也逐渐走向了相互借鉴和融合发展的道路。特别是在行为主义思想中引入连接主义的技术,从而诞生了深度强化学习技术,成为AlphaGo战胜李世石背后最重要的技术手段。 (二) 深度学习带动本轮人工智能发展 深度学习已经在语音识别、图像识别等领域取得突破。深度学习全称深度神经网络,本质上是多层次的人工神经网络算法,即从结构上模拟人脑的运行机制,从最基本的单元上模拟了人类大脑的运行机制。深度学习已经开始在计算机视觉、语音识别、自然语言理解等领域取得了突破。在语音识别领域,2010年,使用深度神经网络模型的语音识别相对传统混合高斯模型识别错误率降低超过20%,目前所有的商用语音识别算法都基于深度学习。在图像分类领域,目前针对ImageNet数据集的算法分类精度已经达到了95%以上,可以与人的分辨能力相当。深度学习在人脸识别、通用物体检测、图像语义分割、自然语言理解等领域也取得了突破性的进展。 中国信息通信研究院&中国人工智能产业发展联盟 人工智能发展白皮书-技术架构篇(2018) 3 海量的数据和高效的算力支撑是深度学习算法实现的基础。深度学习分为训练(training)和推断(inference)两个环节。训练需要海量数据输入,训练出一个复杂的深度神经网络模型。推断指利用训练好的模型,使用待判断的数据去“推断”得出各种结论。大数据时代的到来,图形处理器(Graphics Processing Unit,GPU)等各种更加强大的计算设备的发展,使得深度学习可以充分利用海量数据(标注数据、弱标注数据或无标注数据),自动地学习到抽象的知识表达,即把原始数据浓缩成某种知识。当前基于深度学习的人工智能技术架构如图1所示。 图1 基于深度学习的人工智能技术应用架构图 二、 基于深度学习的人工智能技术现状 (一) 基于深度学习的人工智能技术体系综述 人工智能发展白皮书-技术架构篇(2018) 中国信息通信研究院&中国人工智能产业发展联盟 4 当前,基于深度学习的人工智能算法主要依托计算机技术体系架构实现,深度学习算法通过封装至软件框架1的方式供开发者使用。软件框架是整个技术体系的核心,实现对人工智能算法的封装,数据的调用以及计算资源的调度使用。为提升算法实现的效率,其编译器及底层硬件技术也进行了功能优化。具体架构请见图1中的基础硬件层、深度神经网络模型编译器及软件框架三层。 本章所探讨的人工智能技术体系主要包含三个维度,一是针对人工智能算法原理本身的探讨,二是对算法实现所依托的技术