AI智能总结
目录 Summary 季度洞察 u研究背景与主要观点u数据速览 研究背景与主要结论 AIGC产业历经上半年“百模大战”的军备竞赛,应用层生态的“百花齐放”,第三季度以来,站在了从“玩具”到“工具”快速迭代的关键时期,主战场大模型市场格局发生深刻变化,行业关注焦点也普遍转移到了困扰人工智能发展的“终极命题”——应用与商业化落地。与上一波深度学习的浪潮不同,本次AIGC研发范式的变革从根本上大幅提升数据生产速率,同时降低使用者和开发者的使用门槛,从需求侧推动“智慧飞轮”,有望对千行百业产生深远影响。 基于此,本报告主要围绕产品体验和价值创造两大生成式AI第二阶段的特征,全面扫描第三季度AIGC产业的政策、技术、市场、资本发展趋势。一方面帮助期待应用大模型技术的企业、期待投资大模型企业的投资者建立客观认知;另一方面,研判目前市面上大模型的产品化、生态构建等能力,洞察应用场景机遇,展望行业落地的潜在方向。 主要发现如下: 由于大模型带来的革命类似但有别于互联网,因此,传统的互联网思维不足以覆盖AIGC的发展路径。 大模型落地面临挑战与机遇,行业共同关注放大模型能力的有效途径。当大模型参数量普遍达到一定水平,在边际效用递减的规律下,将有更多的方式来提升模型的能力和效用,比如微调、提示工程、搜索增强生成、AI Agent等技术手段。AI Agent是挖掘大模型潜力的关键环节,但不是终点,也不可独立运作。开源模型迅猛发展,产品向终端延伸,结合更多AI应用技术,有利于推动应用场景多元化发展。 由于政策面向C端设置准入门槛,标准体系覆盖多个行业,涵盖模型行业能力、模型工程化性能、模型算力网络、模型安全可靠等方面,数据、算法、模型、安全因素重要性凸显,意味着“百模大战”回归理性,行业格局迈入整合阶段。 由于整体经济环境仍处于下行期,行业示范效应尚不明显,大模型应用落地路径处于探索阶段,投资相对谨慎。 进入第三季度以来,国内AIGC创投市场CVC融资事件占比显著提升,下一阶段,国资有望发挥更大作用。 政策变革 u政策准入u政策支持 国产大模型面向C端建立准入机制,应用发展迎来新拐点(1/2) •政策方面,8月15日,我国首份生成式人工智能监管性文件正式实施;8月31日,首批通过备案的人工智能大模型名单出炉,意味着其生成式AI产品可以正式面向公众开放注册、提供服务,此前的大模型产品多采用邀请注册制,仅开放给企业合作伙伴使用。•面向C端的对话式应用产品吹响了号角,带动B端产业大模型陆续落地变现,“百模大战”的风已经吹向了“百模应用之争”。 国产大模型面向C端建立准入机制,应用发展迎来新拐点(2/2) 中央专项债支持,地方引导基金为AI产业发展注入活水 创业邦睿兽分析的数据显示,中国AIGC投融资事件占人工智能投融资事件总数的比重、中国AIGC金额总数占人工智能投融资获投金额的比重呈上升趋势,尤其是 2023年H1尤为显著,2023年上半年 AIGC事件数占AI赛道的比重为 23.9%,远高于前几年。但就上半年数据,AIGC行业融资事件和融资金额涨幅不明显,主要与经济下行的大环境有关。 地方政府AI引导基金进展情况 因此,为增强民间资本投资信心,2023年专项债投向新增两大领域,分别是新能源和新基建,其中新基建包括数据中心、人工智能基础设施。今年以来,新型基础设施建设步伐加快,上半年新基建投资同比增长16.2%。步入下半年,广西、贵州、河南、福建等多地就推进新基建作出新的部署,进一步释放出新基建提速的信号。 Q3人工智能地方引导基金除上海相对活跃外,其他还未充分释放。 技术发展 u技术迭代u技术趋势 技术迭代一: 多模态大模型DALL·E 3带来产业冲击 背景:多模态大模型(MLLM)是将文本、图像、音频和视频等多模信息结合起来训练的模型。相比LLM(大语言模型),MLLM更符合人类感知世界的方式。多模态输入的支持,使用户可以用更灵活的方式与智能助手进行交互,继而利用强大的大模型作为大脑来执行多模态任务。 9月21日,OpenAI宣布生成式AI艺术平台DALL-E的第三个版本——DALL·E 3已经进入研究预览阶段,并将于10月初面向ChatGPT Plus和企业用户上线。另外ChatGPT-4V的推出为其增加了视觉智能,使其不再局限于文字处理,还能识别、理解、分析和预测图片信息。 影响:DALL·E 3的出现不仅再次冲击艺术界的绘画产业,也同时给电商、设计等行业产生了实质性的影响。但同时,安全和版权保护等社会问题也尤为值得关注。 对标产品:昆仑万维天工大模型Skywork-MM、MiniMax多模态大模型矩阵等。 技术迭代: 1)DALL·E 3能更好地捕捉细微差异的语义描述,实现了提示词的完美遵循,还能高效避免混淆详细请求中的元素,在画面呈现方面有了明显进步。 2)文生图模型与 ChatGPT 的结合,极大地弱化了提示工程的约束。 技术迭代二:长文本技术增强产品用户体验 背景:在LLM中,“上下文长度”是指大语言模型在生成预测时考虑的输入文本的长度。对大模型而言,具备更长文本的建模能力意味着模型可以观察到更长的上下文,可以避免因观察窗口限制导致重要信息的丢失。大模型应用效果通常取决于两个核心指标,一是模型参数量,决定了大模型的“计算”能力;二是上下文长度,决定了大模型的“内存”能力,即长文本可以通过提供更多上下文和细节信息,来辅助模型判断语义,进一步减少歧义,并且基于所提供事实基础上的归纳、推理也更加准确。 7月18号,斯坦福大学发布了新型注意力算法FlashAttention-2 ,更好的并行化和工作分区,比标准Attention提速5-9倍,极大加速了现有模型的训练和推理。9月21号,香港中文大学联合MIT推出微调方法LongLoRA。两项研究成果能在资源受限的情况下,极大扩展大模型的上下文。 影响:在诸如金融、法律和科研等特定行业或场景,需要对长篇幅文档进行分析、归纳抽取、多文档信息对比以及关键信息总结。因此,长文本建模能力是大模型目前行业应用能顺利落地的前提条件。 对标产品:月之暗面Kimi Chat等。 技术展望: 国内外对于文本长度的探索还远没有达到“临界点”,在通往未来Agent和AI原生应用的道路上,长文本依然扮演着重要的角色。Agent任务运行需要依靠历史信息进行新的规划和决策,AI原生应用需要依靠上下文本来保持连贯、个性化的用户体验,这也是月之暗面、OpenAI等一众大模型公司在当下聚焦长文本技术的原因所在。 技术迭代三:Llama2掀起大模型市场新格局 背景:LLaMA(LargeLanguage Model MetaAl) 是Meta发布的一款开源大型语言模型。该模型仅使用公开数据集进行训练,确保了其与开源协议的兼容性和可复现性,LLaMA已成为AI社区中最受欢迎的开源模型之一。然而,由于其开源协议的限制,LLaMA仅限于学术研究使用,不能进行免费的商业用途。 7月19日,Meta在官网发布了开源大语言模型—Llama 2。 影响:对上游,Meta与微软云服务Azure合作,向全球开发者首发基于Llama 2模型的云服务,与高通合作,打破市场上英伟达、AMD处理器对AI产业的垄断。对下游,通过“模型基座+迁移学习+微调”的垂类AI模型开发范式,使得更多的企业和个人开发者可以快速加入到AIGC热潮中,也极大地加速了行业AI应用开发效率,弱化和颠覆OpenAI等公司在新兴的生成式人工智能软件市场中建立的早期主导地位。Llama2推动了国内大模型的开源进程和商业化变革。 对标产品:百川智能部分模型、智谱AI GLM-130B开源双语预训练语言模型等。 技术迭代: (1)相比于 Llama 1,Llama 2的预训练语料库增加40%,提升到2万亿Tokens;(2)9月Llama2 long已达32,768个token;(3)采用了分组查询注意力机制,对文本语义的理解更强;(4)Llama 2 70B 在MMLU和GSM8K上接近 GPT-3.5。 技术迭代四:AI Agent深入挖掘大模型潜力 背景:Agent(智能体)指在一定的环境中体现出自治性、反应性、社会性、预动性、思辨性(慎思性)、认知性等一种或多种智能特征的软件或硬件实体。Agent = 大模型+记忆+主动规划+工具使用。AI Agent能够理解、规划、执行、自我调整,解决更复杂的问题。相比LLM,AI Agent能独立思考、调用工具去逐步完成给定目标的能力;和RPA的区别在于能够处理未知环境信息。 7月26日,亚马逊推出Amazon Bedrock Agents,可以自动分解企业AI应用开发任务;8月初,AI独角兽Inflection在开发私人AI助理等(另,10月底GPT-4重磅更新,推出了整合了画图、插件、代码等所有工具的All Tools功能。) 影响:研发侧,由于AI Agent需要主动感知感知环境信息,多模态大模型成为新的行业热点之一,同时Agent能自主调用工具,其改变了以往的软件研发方式和生态应用方式;应用侧,为企业和个人提供更加个性化、可定制的AI伙伴。 对标产品:联汇科技OmBot欧姆智能体、实在智能TARS-RPA-Agent等。 技术趋势一:拥抱开源精神,国产模型的崛起已成燎原之势 •国产模型已成为大语言模型阵营中的中坚力量。虽然国产模型起步较晚,并且在GPU高端芯片中遭受国外穷追围堵,但在国家大力扶持和头部厂商的推动下,国产模型的崛起已成燎原之势。•同时,在智源研究院等诸多顶尖的人工智能科研院所的带领下,国内部分头部大模型创业企业、有云端业务基础的互联网大厂积极推动开源生态体系的构建。 由图可知,2~3月大模型市场整体还处于萌芽阶段,4~7月是国产大模型集中爆发的阶段。7月,应用层医疗(京医千询)、教育(子曰)、旅游(问道)等产业级大模型以及赤兔等企业服务大模型密集发布。8月~9月大模型发布数量有所减少,但在产品功能上呈现出差异化特征,比如,MiniMax ABAB 大模型擅长数据增强和数据压缩,云雀大模型擅长多媒体内容生成和内容理解等。通过拓展纵深,不断挖掘大模型应用潜力,渗透千行百业。 来源:创业邦整理 技术趋势二:大模型产品向终端延伸,推动应用场景多元化发展 •大模型开源、多模态、Agent等技术趋势下将产生全新的、个性化的、人性化的人机交互体验。•未来大模型部署在手机、PC、汽车、人形机器人等终端,能够缓解云端AI在成本、能耗、性能、隐私、安全和个性化等方面存在的问题,也将拓宽自动驾驶、智慧教育、智慧家居等场景的多元化应用,但如何在端侧轻量部署,实现软硬件深度融合仍是难点问题。 技术趋势三:安全性成为国内关注的焦点问题 由于政策的准入要求,以及政企客户落地应用的必然要求,安全性成为国内关注的焦点问题。业内对安全性的担忧主要集中在以下方面:1.合法合规;2.数据安全;3.算法安全:具有不可控性,容易出现幻觉;难以解释,参数规模大。安全问题的明确和解决有利于降低大模型风险。 数据来源:以“AIGC”、“安全”为检索词在知网搜索的国内论文结果。从今年年初ChatGPT爆红以来,国内相关论文发布数量日益提升,在Q3达到最高点,可见AIGC安全性已成为学术关注的焦点问题。 技术趋势四:企业私有化部署大模型综合成本持续降低 大模型的应用落地成本,主要包含数据成本、模型成本和应用开发成本三个维度,其中模型成本包含授权成本、算力成本等。Q3阶段,随着Llama2带动了国内模型的商用免费化,且MaaS作为一种新型商业模式逐渐被市场接受,授权成本过高的壁垒正在消失。尤其通过QLoRA微调和GPTQ量化,中小企业也可以上手千亿级模型,很大程度上降低了模型的算力成本。企业私有化部署综合成本持续降低有利于增加大模型对B端市场的渗透。 大模型应用落地成本预估: 大模型应用落地成本构成: API调用(小微企业) 数 据