执行摘要 简介 过去十年,是人工智能从实验室走向产业化的十年。AI技术革命掀起的产业浪潮,势不可挡地席卷了全球的各行各业。作为现今最为活跃的创新领域,人工智能在迅速融入细分场景的同时也在不断地重塑传统行业模式,为经济社会输出独一无二的未来价值。 的小模型,才能高效地实现丰富场景的大模型应用。这就再次点明了AI基础软件工具链的重要性。 随着AI基础软件不断发展,近年来大模型落地应用呈现加速态势。在开发层面,AI基础软件可帮助提供大模型能力萃取;在训练层面,其提供了硬件层之上的高效大模型分布式训练框架;在运维层面,其作为企业的基础设施,可增强企业管理、上线模型的能力。 大模型是人工智能迈向通用智能的里程碑技术。业内人士认为,在基于数据的互联网时代和基于算力的云计算时代之后,将进入基于大模型的AI时代。大规模数据集和模型训练算力等领域取得的突破性进展,离不开AI基础软件的底层支撑。尽管大模型当前表现优异,但对于各行业使用者来说,实际应用于业务场景仍然存在较高的技术和成本门槛。当前大模型的参数标准并不统一,相对于参数级,模型的效果且是否能够支持快速迭代对于用户实际应用来说更为重要。用户能够在一个白盒大模型基础上快速地、低成本地微调和迭代出客制化AI基础软件产业协同发展图 本报告旨在明晰AI基础软件框架的基本概念和分类,通过对行业发展历程及产业链的梳理探究行业核心驱动因素,剖析当下AI基础软件行业市场趋势,并基于应用、产品及生态三大关键维度构建厂商竞争力体系,评估主流玩家的核心竞争优势及综合壁垒,形成对中国市场AI基础软件框架发展情况的客观评价,并为行业未来发展提供参照建议与关键启发。 关键发现点 产学研用融合创新共同体的成型。中国具备全球领先的视觉、自然语言处理、语音识别等智能任务的工程实现水平,人工智能原创技术创新正处于活跃期。大模型的技术突破结合2023年各省发布的支持政策,将引导行业形成连通企业、高校、研究院所、政府等创新主体的共同体生态。其二,大模型应用逐步落地,将带来行业发展新需求。作为模型生态系统的中坚力量,AI基础软件将会成为大模型应用落地的最主要的效率支撑,并通过大模型+小模型的方式,形成模型训练新范式。基础软件的重要性具体表现有三点:一是基础软件工程化的易用性、完备性;二是AI基础软件要与场景结合,能够进行完备的运维过程;三是需要具备安全可信保障条件。 在人工智能技术迭代的过程中,AI基础软件行业整体格局将逐步成型。科技巨头生态体系建设叠加中国肥沃的政策和技术土壤,将为业内厂商提供前所未有的发展机遇。本报告将从行业宏观环境洞察市场需求,从技术规律把握未来趋势,进而识别出在AI浪潮之下领先的AI基础软件厂商,并对其综合竞争实力进行分析: •驱动因素:随着上游硬件、算力升级以及数据量增加,AI基础软件行业下一阶段的驱动因素主要包含三个层面。其一,在全球AI政策环境持续优化的趋势下,中国对大模型技术的宏观战略规划将为行业提供肥沃的成长土壤。北京市政府已明确出台政策,加快建设算力中心,支撑多模态大模型、科学计算大模型等研发。其二,下游大模型加速渗透应用场景和规模化应用将为行业带来曙光。从2023年AI预训练大模型的应用来看,大模型已开始在工业质检、智慧交通、时尚设计等多个行业中落地,其距离实现预训练大模型规模化商业化应用仍有一定的距离。其三,头部科技企业加速布局和产业生态体系垂直整合,将为不同厂商提供多元化的战略切入点。目前,业内已形成算力、基础软件、平台和服务纵向一体化的共识,从而为云服务企业、AI头部企业及AI芯片巨头提供了多环节的战略布局思路。相关头部AI企业,有望引领本轮生态体系建设。 •竞争格局:在竞争格局渐趋明晰的过程中,相关厂商需要跨越技术、人才、资金和品牌四方壁垒,在技术实力、生态规模和功能体验三大成功要素上展开角逐。 •市场趋势:在核心驱动因素的催化下,中国AI基础软件行业展现出三大主要趋势,并在这个过程中逐步明晰竞争格局。其一,中国原创技术创新突破加之人工智能政策导向,将推动市场 章节一中国AI基础软件发展背景 AI2.0时代到来开启巨大的平台型机会 关键发现 •AI2.0是由大数据、云计算和人工智能技术等多种技术的融合所构成的,是一个巨大的平台式机会,将会在未来为各行业提供更加深入和全面的解决方案。随着AI2.0时代的到来,基础模型不再需要人工标注数据,也可以自行学习和阅读海量的文本。而且模型通过微调就能以低成本训练适应不同领域的任务。•其中,AI2.0相关的应用、平台和基础设施,将会成为包括产业及投资在内的热点。AI基础软件作为AI大模型训练、管理、应用的重要平台将会在AI2.0的长风中顺势演化出巨大的产业机会。 “AI1.0就像是发明电,AI2.0就是电网。AI2.0时代的来临,首先它是巨大的平台式机会,这个机会将比移动互联网大十倍,而且它是中国的第一次机会。” “自1980年首次看到图形用户界面(graphicaluserinterface)以来,OpenAI的GPT人工智能模型是我所见过的最具革命性的技术进步。” ——比尔盖茨 ——创新工场李开复 来源:弗若斯特沙利文 庞大的数据基础为国内AI大模型发展提供根基 数据量的爆发为人工智能的发展注入燃料 n#$)Cù3âän67#$ûü†°C34}¢467#$ûü5*Cûü£§v•¶C#$)íhiß®jphihßj,©hèq™´¨≠ÆØØ∞±≤≥¥phqèμμ™´,o;íhihxj∂p®xèx™´,L∑∏π∫ªs,ZºOΩæø^ù3¿≥¥v¡¬0#$Cù√¿≥¥,ƒ°}≈∆«{»…À…}~ÃÕ#$CŒœ–í—“≥%vÃ-67#$ûü†°”On‘0C’÷Œœ,âän†°C34vK◊,#$ù√–âän#$ûüÿ5*Ÿ⁄¤úŸ‹°úCûüv›fi,fl«î‡·2C#$‚fi„‰ú#$E„‰ú#$ÂÊ,#$ûüÿ[åŒN5*î‡C#$»…}~ûüv !"#$%&'()#$*+,-./012345*67 !"#$89:;<=>?@AB"C#$,DEFGHIJB,KL"-012#$CMNOP,QRS02#$STU,B"!"#$C"VWX,YZ[\]^./_`abc12deIfg,hihij,./B"C!"#$klm:nFG#$,o;phiqijLrstu0vo;phihwj,xiyz{|3./}~ÄÅC#$LÇ8!"B"C,!"#$ÉÑÖÜ./C#$áà,âä@Aãåçéhèiêëvíìêë,!"#$îï[\ñó./12,9:#$òF./[\ô"öõbc}rúv 章节二中国AI基础软件市场概览 AI基础软件市场定义与解读 关键发现 •AI基础软件包含一系列企业级AI应用所需的平台软件产品及解决方案,是为大模型应用落地的最主要的效率支撑,AI基础软件的发展决定了人工智能发展的深度、高度、广度,其催化大模型应用快速发展,推动政府和企业AI规模化应用。 AI基础软件定义与解读 •AI2.0时代的到来,让各行业对大模型应用的需求日渐提升,对大模型对于业务的支撑力也更为重视,但大多数企业都会工程、技术等能力不足的问题。AI基础软件作为AI基础设施的重中之重,为企业客户提供全方位的AI调度以及模型服务,包含机器学习平台等一站式模型平台,以及数据智能平台、实时决策中心、数据湖、数据仓库等服务于AI的数据平台,从而降低各行业客户训练自己人工智能模型的门槛,实现降本增效。 蓬勃的AI大模型市场为AI基础软件发展注入动力 中国AI模型的演进历程,2023年 •在数据层面,模型训练数据的质量和规模对模型迭代的效果至关重要,尤其是目前内外数据共享和数据共创、数据类别不均衡、极端场景数据缺失等问题,呼唤业内对AIGC结构化数据合成领域的技术探索 •在技术层面,生成式AI模型的推理能力愈发重要,同时对AI的可信度、可解释度的需求也在提升,呼唤自动机器学习、深度学习、因果学习等领域的基础软件性能提升 •在商业模式层面,随着大模型的逐渐成熟,通用大模型+行业小模型会成为越来越多企业采用的落地模式,因此,帮助企业自建AI模型的AI基础软件成为大势所趋来源:弗若斯特沙利文 利好的政策为AI基础软件市场提供制度保障 国家指导政策推动AI基础软件发展 2022年国家新一代人工智能开放创新平台15个 数据优势 加快数字化发展,建设数字中国,同时打造数字经济新优势,充分发挥海量数据和丰富应用场景优势。同时指出要加强关键数字技术创新应用:聚焦高端芯片、操作系统、人工智能关键算法、传感器等关键领域;建设重 q国家积极布局人工智能产业 点行业人工智能数据集,发展算法推理训练场景——— 算法推理 《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》 在国家监管层面,中国积极布局人工智能产业,竞跑“未来赛道”。随着各行业、各领域对人工智能需求的日益增长,与实体经济深度融合的新模式不断涌现,形成了具有中国特色的研发体系和应用生态,引领着经济社会各领域从数字化、网络化向智能化跃升。以“大模型”为代表的技术爆发,加速了人工智能产业的发展。 来源:第十三届全国人大四次会议 支持人工智能算法库、工具集等研发。加快发展新型机器学习、生物特征识别、自然语言理解、新型人机交互、智能控制与决策等产品和服务。推动人工智能开放平台建设。推进面向行业企业智能服务应用。面向金融、电信、能源等行业,推动智能信息技术服务平台的建设应用,构建智能服务体系。 智能服务 平台建设 ———《“十四五”软件和信息技术服务业发展规划》 如何抓住这一轮技术变革的浪潮,促进区域以及产业发展,北京、上海、深圳等地纷纷出台相关政策举措。北京更是闻风而动,一天之内发布两项政策,冲刺“人工智能第一城”。 来源:中华人民共和国工业和信息化部 北京市出台政策促进大模型研发 最新地方政策文件中均重点提到了算力端发展,加大算力基础设施的投资力度,同时强调了人工智能的高质量发展,拓展AI创新应用场景的深度与广度。国家及地方出台的多项AI产业支持政策将给产业发展带来助推力,更进一步推动数字经济与实体经济的融合发展。 算力中心 将新增算力建设项目纳入算力伙伴计划,加快推动海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心,形成规模化先进算力供给能力,支撑千亿级参数量的大型语言模型、大型视觉模型、多模态大模型、科学计算大模型等研发.———《北京市促进通用人工智能创新发展的若干措施》 大模型赋能 2022年国 家 人工 智 能创 新 应用 先 导区 8个 开源演进为AI基础软件市场提供良好的生态土壤 1991年,LinusTorvalds在Minix和GUN成果的基础上开发了Linux操作系统(Linux0.01)。 从中国开源发展阶段的维度看开源发展的变化:围绕产品操作系统及其生态,解决“缺芯少魂”短板;围绕基于开源的深度信息技术(大数据、云原生、区块链、人工智能等)发展与应用,为第四次世界工业革命做准备;围绕开发/编制开源软件供应链以保障其安全,并保障其上游的网络安全,国家关键基础设施的安全。 1999年至今,中国开源已经发展了32年。这32年的开源发展大致可以分为三个阶段:第一阶段,主要围绕企业产品的操作系统及其生态建设;第二阶段,主要结合研发基于开源的深度信息技术(如大数据、云原生、区块链、人工智能等)及其应用;第三阶段,在经济双循环基础上规范建设或改造我国的供应链并主要在促进产业链、供应链数字化的基础上,采用取代物料表格式样的开源代码,保障其安全。 1999年,中科红旗、中软网络在引进RedHat公司Linux发行版的基础上,分别推出了最早的Linux中文版本。 开源对AI基础软件的意义 中国开源发展现状 q降低AI基础软件的开发门槛 开源代码通常是免费提供的,企业和个人可以不用支付高昂的许可费,降低了获取成本。开源的文档使得开发者可以更容易地学习和理解AI算法和模型,降低了开