您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [景顺长城]:重塑与创造:2024Al洞察报告 - 发现报告

重塑与创造:2024Al洞察报告

文化传媒 2024-02-29 景顺长城 华仔
报告封面

从围棋高手AlphaGo到万能助理ChatGPT,AI(人工智能)产业在不断发展和突破。现在,AI不仅能快速理解和生成人类的语言,还可以在内容创作、软件开发、教育办公等多种场景中发挥关键作用。工业革命时代的机械与流水线提升了“体力劳动“的效率,而今AI大模型提高了”脑力劳动“的效率,带来新一轮席卷各行业的“AI+”技术革命。 前言 人类从书本与实践中不断提升自我,AI也在利用海量数据与外界反馈,不断地进化和迭代。如今,AI大模型已经基本学习了人类所有的书籍与科学知识,对于细分领域的专业问题也能快速理解和掌握。畅想未来,AI将成为高度自主和智能的“机器大脑”,在工业制造、自动驾驶、科技研发甚至太空探索中,创造巨大的经济价值。 AI大模型不仅重塑了生产力,还将赋予人类“超能力“。每个人的时间与精力是有限的,而AI大模型可以扩展人的能力半径。戴上具备AI能力的可穿戴设备,每个人都可以掌握新的语言和科学知识,提升记忆力和效率。使用AI手机和电脑,每个人都可以进行艺术设计、开发程序,或者制作电影和小游戏。在不久的将来,在漫画、应用、电影、游戏等各种领域,内容创作的数量可能井喷,创造出类似抖音的UGC超级平台。 与此同时,全球科技企业正在构建超大规模的AI算力集群,让“智力“资源像水电一样流向千行百业。随着AI大模型的进化与发展,芯片、存储、通信互联等算力产业链都将持续升级。而在美国制裁的背景下,国产AI芯片和生态系统将迎来史无前例的机会,带动设计、制造和先进封装全产业链的加速成长。 我们认为,AI+革命已经到来。当下的AI一定不够完美,从研究成果到商业应用的转化也是一条漫长而艰险的道路。市场的质疑在当下看似都很有道理。但是,科技产业的发展永远是非线性的,我们往往容易高估一项新技术的短期影响,却又低估它五年、十年带来的巨变。AI的发展也一定不是一蹴而就的,它将经历多个浪潮,多次革命和多次至暗时刻,带来不断出现的新的投资机会。我们期待着它的蝶变。 目 录CONTENTS 一、综述01 1.1AI+产业的十大预测1.2AI的寒武纪大爆发1.3AI产业链:模型层是大脑,算力层是粮草,应用层是执行单位020204 二、模型层:大模型向多模态与AI Agent进化05 2.2.1 大模型进化方向1:多模态,感知理解升级+拓展人机交互形式2.2.2 大模型进化方向2:AI Agent,像人一样规划、反思、使用工具的AI程序0708 2.3大模型的竞争格局09 2.3.1 海外大模型:马拉松淘汰赛,公有模型走向寡头格局2.3.2 中国大模型:与海外约1年代差,持续追赶海外进程0909 三、应用层(软件):生产力场景实现降本增效,泛娱乐场景提升交互体验1 1 3.1AI商业价值的载体:生产力应用与泛娱乐应用3.2生产力场景:AI实现降本增效3.3泛娱乐场景:AI提升交互体验3.3.1 游戏内容:AI NPC让游戏情节具有更多的可能性,为用户创造新奇的体验3.3.2 游戏形态:AI UGC实现游戏制作去厂商化,有望出现游戏平台的“抖音时刻”3.3.3 不止于游戏,各类数字创作领域都可能诞生新的超级平台121314161412 四、应用层(硬件):软件推动硬件创新,下一代智能终端渐行渐近17 4.1AI终端:端侧AI部署有利于降低边际推理成本18 4.2PC/手机为当下最佳AI端侧载体18 4.3MR:解放双手,下一代智能终端的雏形?19 4.3.1 MR在2024横空出世4.3.2 AI和3D建模将提升内容生产效率4.3.3 MR带动消费电子投资机遇192021 4.4AI赋能感知和决策,加速智能汽车技术升级21 4.4.1 智能汽车产业发展的奇点即将到来4.4.2 中国汽车产业链是智能化浪潮中最具备竞争力的产业链4.4.3 中国汽车产业链在智能化浪潮中酝酿巨大投资机会222324 4.5AI的突破是机器人进化的里程碑24 4.5.1 智能机器人的落地节奏4.5.2 降本路径不仅仅依靠规模效应,更有赖于中国供应链的参与2526 五、算力层:推理需求爆发在即,国产替代加速前行28 5.1算力投资:AI应用爆发的必要条件和先行指标29 5.2全球算力:推理需求驱动算力投资快速成长30 5.2.1 算力需求:AI成为全球算力投资增长的核心驱动5.2.2 供应链:AI重塑价值分配,算力芯片为核心,通讯/存储部件配套升级3031 5.3国产替代:需求旺盛但成熟供给不足,外部制裁迎国产历史机遇33 5.3.1 供需缺口:国内算力需求已达到全球第二,但上游核心芯片对外依赖严重5.3.2 产业追赶:围绕算力芯片,设计-制造-封装全产业链加速成长3334 六、附录36 (1) 训练侧算力需求匡算(2) 推理侧算力需求匡算3738 1.1 AI+产业的十大预测 AI将带来一场席卷各行各业的技术革命 AI重塑机器人大脑,产业链迎来新机遇 1.2 AI的寒武纪大爆发 AI(人工智能)是指能够让机器变得和人一样聪明的技术、方法和工程。AI学科1950年就已经诞生,我们一直在让机器学会看图、下围棋等专业技能,但直到2022年末 Chat GPT 3.5的发布,才真正点燃了AI在全民普及的热情,仅仅2个月时间,用户数就增长过亿。 为什么此次AI会出现爆发?本质在于本轮AI不再是狭窄专用领域的人工智能,机器终于变成了一个通才,成为通用人工智能,即可以像人一样在一切领域里无差别地学习和与人类交互。AI开始介入了人们生产、生活的方方面面。 AI将是一场席卷各行各业的技术革命。我们认为只有提升社会生产效率的技术创新才能称之为技术革命。例如1860年的工业革命,它通过机械化大生产代替手工劳作,大幅降低了体力劳动的成本,在短短不到200年间缔造的财富就超越了过去3000年农业社会的总和。1950年后又出现了信息技术革命,它大幅降低了计算成本,改变了信息传播和分发的方式,孕育出巨型互联网公司,社会财富又达到了空前的高度。而今AI的革命则降低了脑力劳动的成本,使人类从简单的数字工作中解放出来,我们期待它带来新的市场机会和财富变革。 我们当前处在AI革命的第二浪。过去一年AI已经经过一波热炒,市场认为当前AI所有的能力都已被充分挖掘,缺乏新的亮点。但AI的发展是多层次、多浪潮的。按照基础大模型的能力去划分,我们现在处在人工智能的第二个阶段,后面还有多模态、AI Agent到混合现实,再到具身智能等种种的突破可以期待。面对AI这样席卷各行各业的重大革命,我们不应该过度关注短期,而忽视了产业长期的进展和应用潜力。 1.3 AI产业链:模型层是大脑,算力层是粮草,应用层是执行单位 AI产业链整体可以概括为三个层次,模型层、算力层、应用层。模型层好比AI的大脑;算力层好比AI的粮草和营养补给;应用层则是AI的执行机构。我们判断在2024年,国内模型层将成为大宗品,需要和应用场景相结合才能创造差异化。应用层AI将重塑生产效率和交互体验,其中软件和硬件将交替推动创新。而算力层将从训练逐步向推理过渡。 二、模型层:大模型向多模态与AI Agent进化 大模型是AI最核心的大脑部分,它在人类海量的数据中学习知识与规律,不断进化和迭代,变得越来越“聪明”。长期看,大模型发展的终局是人工通用智能(AGI),它将具备高度自主性,像人一样自发地创造和完成一切任务。而短期看,下一代的大模型将向多模态与AI Agent进化。 2.1 大模型是什么?模型是如何发展至今的? 大语言模型的核心任务是根据提示词和已有文本,不断预测下一个“合理“的字符 为什么预测下一个合理字符的能力代表智能呢?假设我们让大语言模型阅读一本侦探小说,让模型预测”犯人是谁“,如果模型可以准确生成犯人的身份,就代表模型理解了案件中的全部信息并作出了正确的推理。 大模型底层是深度学习网络,可以像海绵一样吸收知识,并对知识进行无损压缩。GPT-3在预训练阶段吸收了45TB的人类数据,包括网页、代码、科学与书籍等。 大模型发展至今经历了从量变到质变的过程。 ①量变:大模型的能力提升会遵循“规模法则”,随着数据量、算力、参数量提升,大模型的压缩损失率持续降低,模型能力持续提升。 ②质变:当模型体量足够大时,模型会出现类似人类“开悟”般的涌现能力,经过思维链提示后(一步步思考),模型推理能力随模型规模扩大显著提升。 2.2 下一代大模型的进化方向 2.2.1 大模型进化方向1:多模态,感知理解升级+拓展人机交互形式 多模态指文字、图片、音频、视频等多种数据类型;多模态大模型不仅可以像人类一样看和听,理解视觉、音频等信息背后的规律,完成复杂的推理,还可以生成图片、视频、音频、3D等多模态内容。 多模态大模型将带来哪些改变? 提 高 泛 娱 乐 、商 业 等场景内容创作效率 拓展落地场景提升AI渗透率 感知交互升级带动终端硬件革新 多模态大模型可以处理视觉提示,例如我们在图片中圈出物体,模型可以对圈出的部分针对性分析这种能力未来可以适配触屏、眼动追踪、手势追踪等人机交互形式;另一方面,多模态大模型可以对物理世界建模,优化自动驾驶、机器人感知控制技术 语言大模型最大的应用场景是教育、办公;多模态大模型将具备图像、视频分析与推理能力,可应用于泛娱乐、交通(自动驾驶)、工业(检测与自动化)、安防(城市管理)等场景 多模态大模型的图像、视频、3D生成能力可以广泛应用于影视、音乐、游戏等泛娱乐场景 的 内 容 创 作,同 时 加 速 广告、电商等商业场景的营销创意效率 2.2.2 大模型进化方向2:AI Agent,像人一样规划、反思、使用工具的AI程序 AI Agent相对语言大模型最大的改进是增加自主行动能力,在实现目标过程中无需人类干预。从结构上,AI Agent=大模型+记忆+规划+工具使用: 大模型储存知识、更新知识的成本高;为大模型增加记忆库,可以实现低成本的数据更新。 记 忆 当大模型遇到新的复杂目标时,模型可以像AlphaGo下象棋一样,将目标一步步拆解,穷尽不同策略下可能出现的结果,选择最优的行动策略;另外,当模型生成错误的代码时,模型可以利用反思机制分析错误的原因,不断修改生成的代码,直到实现目标。 规 划 AI Agent在遇到自身难以解决的问题时,会像人一样选择合适的外部工具,通过上网搜索、操作应用、使用专用AI模型解决问题。 工具使用 AI Agent来带更多自主能动的交互体验: AI Agent还可以构建“西部世界 ”式 的 游 戏 ,斯 坦 福 利 用AI Agent的记忆和规划能力,构建了虚拟小镇,镇上的AI居民会像人一样规划每天的生活,并在小镇上随机触发新的事件与活动 OpenAI在23年11月开发者大会上推出使用AI Agent构建的GPTs平台,不会编程的用户也可以自己制作个性化的AI应用了 通用机器人可以变得更加智能,不需要人教也可以理解和学习更多的技能 2.3 大模型的竞争格局 2.3.1 海外大模型:马拉松淘汰赛,公有模型走向寡头格局 公有大模型每一代升级,竞争门槛将持续提升,参与者会持续减少,走向寡头格局,源于: O p e n A I G PT- 1 到GPT-4,模型的参数量、数据量持续提升 算力规模决定模型的升级迭代效率,大模型训练时长与总算力呈反比,因此具有更高资本优势和算力资源的公司,越有机会领先发布模型更新 AI应用具有显著的先发优势,因为先发者可以 最 下 你 收 集 数 据 。ChatGPT作为最早发布的大模型应用,截至23年10月月活已超过2亿,而之后发布的竞品月活最多在千万级 2.3.2 中国大模型:与海外约1年代差,持续追赶海外进程 中国大模型起步慢于海外,目前能力上与海外约1年代差。首先,海外大模型开源推动了技术的扩散;其次,科学家与工程师的人员流动也会加速技术的扩散,预计中国的AI人才在未来几年会持续扩充,追赶海外成为可能。需要关注的是,当