您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[清华大学]:云计算和人工智能产业应用白皮书 - 发现报告
当前位置:首页/行业研究/报告详情/

云计算和人工智能产业应用白皮书

信息技术2018-09-30清华大学喵***
云计算和人工智能产业应用白皮书

云计算和人工智能产业应用 白皮书 2018 清华大学互联网产业研究院2018.09 《云计算和人工智能产业应用白皮书2018》 编写委员会 顾问: 陈国良 林垂宙 赵春江 陈升 何宝宏 主编: 朱岩 副主编: 王晓辉 沈寓实 邢春晓 区海鹰 编辑: 王耀羚 编委会: 王耀羚 邓丽凤 李媛婷 张大鹏 林之恒 王崇鲁 王卓然 陈思恩 邵长钰 蒋立乾 陈李江 李明强 孙卓夫 赵红燕 刘 非 马颢纯 主编单位: 清华大学互联网产业研究院 联合编写单位: 中国云体系产业创新战略联盟 青岛金融科技研究院 支持单位: 工业和信息化部中国信息通信研究院 参编单位:平安科技(深圳)有限公司北京世纪互联宽带数据中心有限公司三角兽(北京)科技有限公司科技谷(厦门)信息技术有限公司北京轻元科技有限公司北京航天智芯科技发展有限公司北京阿凡题科技有限公司广州图普网络科技有限公司 I 序言 中国科学院院士 陈国良 我们正处于一个飞速而突破性的数字转型时期,这是由巨大的市场转型动力——即人工智能、云计算与大数据分析推动的。物联网是大数据的网络载体,是互联网应用的拓展。物联网与其说是一个网络,不如说是一个项目和应用程序。因此,应用创新是物联网发展的核心,以用户体验为核心的创新是物联网发展的灵魂。近年来,随着互联网和移动互联网的蓬勃发展,大数据、云计算、人工智能、物联网等新技术也迎来了广阔的发展空间。未来三十年,云计算、大数据、人工智能,都会成为基本的公共服务,各行各业都会经受巨大的变化。 云计算如同人类的大脑,是物联网的神经中枢。云计算是基于Internet的相关服务的增长、使用和交付模型,通常涉及在Internet上提供动态可调节的、一般是虚拟化的资源。目前,国内云计算市场已形成以阿里云、电信云、腾讯云、金山云等几大企业领跑,众多中小云计算服务商跟跑的局面,云计算正处于一个高速发展期。2017年4月,工信部印发《云计算发展三年行动计划(2017-2019)》,提到2019年要将中国云计算产业规模从2015年的1500亿元扩大至4300亿元。 2018年,多云格局将继续维持与强化,中国云计算市场的热潮不会减退只会增强,年复合增长率预期仍旧会保持在30%以上。截至目前,参照系优质企业数据库共收录云计算行业相关企业255家,涵盖上游基础类产品、中游终端集成和下游系统集成Iaas、Paas、Saas三大关键产业链。 大数据相当于人脑从小学到大学存储和记忆的大量知识,只有通过消化、吸收和重构,这些知识才能创造出更大的价值。大数据技术的战略意义不在于掌握海量的数据信息,而在于对这些有意义的数据的专业处理。换句话说,如果将大数据比作一个行业,那么这个行业盈利能力的关键在清华大学互联网产业研究院 II 于提高数据的“处理能力”,通过“处理”实现数据的“增值”。 从技术上讲,大数据和云计算之间的关系就像硬币的两面一样密不可分。大数据不能由一台计算机处理,必须是分布式的。它以分布式数据挖掘为特色,用于海量数据,但必须依赖云计算的分布式处理、分布式数据库和云存储以及虚拟化技术。 人工智能我们可以做一个比喻:一个人吸收了大量的人类知识(数据),不断深入学习,并最终演变成一个优秀的人的过程。人工智能与大数据密不可分,也是基于云计算平台完成的深度学习进化。目前,人工智能在业界还处于那种“真正的”人工智能的早期阶段,或者说是所谓的“弱人工智能”,比如谷歌的AlphaGo机器人战胜了世界围棋冠军,就展示了人工智能的无穷潜能;而像终结者这样的机器人应该被认为是“强人工智能”。人工智能通常与制造业结合在一起,所以当涉及到人工智能的时候,它通常会涉及到各种制造业产生的数据。 清华大学互联网产业研究院与中国云体系产业创新战略联盟联合编写的《云计算和人工智能产业应用白皮书2018》(以下简称“本白皮书”)就在这三个方面上均进行了深入的思考与研究。在技术层面翔实介绍了2017年人工智能技术爆炸式发展所带来的最新技术方向,在技术领域的实效性上取得了更具参考和借鉴价值的优势;在应用层面,本白皮书则在多个方面深入浅出,探讨了在对个垂直细分领域,如智能驾驶、智慧医疗等的差异化技术发展与具体案例应用。 除此之外,本白皮书还在高屋建瓴的宏观角度,如产业布局、顶层设计等角度做了不少对比分析,力争让相关决策者能够做到“一书在手,胜过连篇累牍”,是不可多得的全方位多角度研究人工智能行业的白皮书资料。 在我看来,人工智能和机器学习的影响远远超出了一般的技术领域。越来越多的企业开始依赖人工智能来开发高级的应用程序,它带来了至少中国云体系产业创新战略联盟 青岛金融科技研究院 III 三大优点——降低成本、提高效率和推动重大突破。人工智能技术是强大的,是有形的,是任何组织与个人都能可以利用的优势。毫无疑问,它们正在推动新技术产业转型升级趋势的爆炸性增长。 1. 降低成本 人们很容易将自动化理解为是机械化重复任务的解药。商业化伊始阶段,人类常常是完成某些工作的唯一途径。然后,机器开始将体力劳动自动化。今天,机器学习能够自动化越来越多的脑力劳动,允许人们将他们宝贵的时间和才能应用到业务的其他领域。 如果一个任务可以被严谨地分解成多个子任务,并且这些子任务可以在一秒钟或更短的时间内完成,那么即使不是今天,也会在不久的将来很可能实现自动化。比如诊断安全录像,甚至医学影像,并在这些图像上识别特定的元素,就可以交给机器去完成;比如阅读文档以在多个文档中找到相同的信息等等。 2. 提高效率 我认为效率的提高代表着是员工的自我超越。想想最普遍的人工智能例子:语音识别。不管是Siri还是亚马逊的Alexa,每天都会有大量的生活资讯互动。布克兄弟、三井集团、We Wo r k、Vonage和第一资本都已经在使用Alexa进行业务。DXC公司据此分析指出,在未来的一天,“办公室语音助理将采用语音生物认证,识别每个扬声器,并生成会议记录和翻译”。 目前人工智能技术在许多个人和商业用例中,类似于这样的语音助理当然不会取代任何人的工作,但它们为已经存在的工作增加了价值和效率。 3. 推动重大突破 突破永远发生在有技术支撑我们发现现有领域盲点的时候。对许多研究机构来说,人工智能和机器学习可以在看似陷入理论僵局的领域,或者清华大学互联网产业研究院 IV 在尚未形成完整体系的领域,使人们克服这些盲点。在医学领域,这就意味着可以提早分析病人的风险或使一种新的治疗产品进入市场。在制造业,这就意味着在产品缺陷发生之前就预测加以防范。 或者可以想象一下,我们能够从公司浩如烟海的文件中挖掘出更深层的关联,从而立即发现一种模式和趋势。这对于在企业生产过程中审查合同的法律团队,或者对于在大量影像研究中寻找病理规律的医学研究人员来说,有多重大的意义。 也许这很简单,那就是从数据开始。成功的人工智能和深度学习总是建立在数据驱动的策略上——如果没有大量可操作的数据,就没有深度学习。“可操作”是这里的关键字,根据目前不少企业访谈的结果看,许多急于从事人工智能项目的领导者发现,他们的数据其实并不像最初设想的那么易访问、丰富、可理解或可维护。 本白皮书编写的宗旨,就是希望能够做一个综合性的研究工作,全局地、系统地向我们的人民群众介绍人工智能的基本概念,向相关的技术研究人员展示落地的案例,以及向发展改革与转型的决策人士建言献策。清华大学互联网产业研究院联合中国云体系产业创新战略联盟,广泛联系了相关的领袖企业和颇有研究见地的高精尖专家,在精心整理之后,集百家之所长,汇四方之宏图,完成了本白皮书,我觉得非常值得大家仔细一读。 诚然,本白皮书也必然有其谬误与不足之处,但是希望白皮书能够举一隅而反三隅,抛砖引玉,引起全社会在人工智能相关领域的关注,激发起全民创业、万众创新的干劲与热情,这也是我们所希望看到的,也是激励我们不断开拓进取的磅礴力量。 作为中国云体系产业创新战略联盟的专家,这次我很荣幸受邀担任本白皮书编委会的顾问。相信本白皮书的发布正逢其时,必将对学界和产业界起到积极的引领促进作用。 中国云体系产业创新战略联盟 青岛金融科技研究院 V 中国科学院院士 中国云体系产业创新战略联盟专家委员 清华大学互联网产业研究院 VI 序言 瑞典皇家工程科学院院士 林垂宙 人工智能(AI)、大数据(Big Data)和云计算(Cloud Computing)正在出现“三位一体”式的深度融合,构成“ABC金三角”。三者是独立的、互补的、相辅相成的。大数据的开发和应用离不开云计算的强大支持。云计算的发展和大数据的积累是人工智能快速发展的基础,是实现实质性突破的关键。大数据和人工智能的进步也将拓展云计算应用的深度和广度。现在是人工智能、大数据、云计算发展的黄金时期。 人工智能之所以如此火爆,在很大程度上要归功于AlphaGo。AlphaGo击败了顶尖的人类围棋选手李世石和柯洁,让世界认识到人工智能的力量。AlphaGo能否代表智能计算的发展方向尚存争议,单其的确它象征着计算机技术已经进入了人工智能时代,其特征是大数据、大计算、大决策三位一体,其智能程度正在接近人类。 人工智能诞生于1956年的达特茅斯会议,逻辑主义学派的先驱西蒙和纽厄尔就乐观地预测计算机能够在十年内完成四项人工智能任务,即战胜国际象棋大师、发现和证明有意义的数学理论、谱写优美的乐曲和实现大多数心理学理论。但事实是,逻辑主义长期无法突破重要人工智能问题,第一次人工智能浪潮渐渐冷淡下来。 1970年代,连接主义兴起,掀起了第二次人工智能浪潮。这一时期最主要的成就是发明了感知器算法解决多层神经网络的训练问题。但是人们很快发现彼时网络的深度不能很高,只能解决非常简单的问题。到了1990年代,人工智能领域再次陷入低潮。 到了21世纪,随着云计算的诞生和数据量的增加,深层神经网络的训练成为可能,引领了连接主义的复兴;同时,以强化学习为代表的行为主义也在兴起。在这两个因素影响下,人工智能领域再次复苏,谷歌的中国云体系产业创新战略联盟 青岛金融科技研究院 VII AlphaGo就是这个时期的代表成就。 人工智能的训练过程,离不开大数据的高维度数据样本。大数据,是对海量信息的处理、优化和分类。从广义上讲,它不仅仅是掌握海量的数据信息,而是对各种意义的数据进行专业、系统的处理。狭义上讲,大数据与云计算密不可分,大数据不能由一台计算机处理,它必须由分布式体系结构处理,大数据本身就是新兴的分布式数据挖掘。大数据的处理技术必须依赖于云计算的分布式数据和处理以及云计算的虚拟化处理技术。 处理这些大量的数据,则必须有分布式的云网络技术的支持。云计算,是一种基于互联网技术支持的信息使用和传递模式,是一种通过互联网提供动态信息的虚拟资源计算。云计算可以提供方便、快捷、有效的网络信息。云计算是一个生动的比喻,人们用“云”的形象来表达网络信息的传播。云计算的计算能力甚至可以达到每秒10万亿次。这种计算能力可以模拟真实世界中的核爆炸,银行的转账流水也可以瞬间计算完成。 虚拟化为云计算的实现提供了很好的技术支持,云计算可以看作是虚拟化技术应用的结果。在过去的几年里,有许多云计算研发团队如谷歌、微软、亚马逊、EMC、百度、阿里巴巴、华为等知名IT公司推出了云计算解决方案;与此同时,国内外学术界也就云计算的相关理论和关键技术展开了研究。 特别是我们的政府也已经开始关注云计算的发展,大力发展云计算相关的研发。2010年10月18日,国家发改委、工信部联合发布《关于做好云计算服务创新发展试点示范工作的通知》。结合国家创新型城市建设,在北京、上海、杭州、无锡、深圳五个城市开展了云计算试点工作。云计算也是国家新一个五年规划的重点项目,国家政策的支持和地方政府的关注将加快云计算产业的发展。这一切都表明,云计算应用已经全面进入中国市场。 清华大学互联网产业研究院 VIII 综上所述,云计算发展的关键利益主要来自IT基础设施、系统集成和SaaS,这促使着国内外对云计算及其虚拟化关键技术的研究非常活跃,已经开发出了一些相关