AI智能总结
云计算开源产业联盟开源创新发展推进中心 版 权 声 明 本报告版权属于云计算开源产业联盟,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:云计算开源产业联盟”。违反上述声明者,将追究其相关法律责任。 编制说明 本报告由云计算开源产业联盟开源创新发展推进中心撰写,限于撰写组时间、知识局限以及技术、社会发展迭代等因素,内容恐有疏漏,烦请各位读者不吝指正。 在编写过程中得到多家单位的大力支持,在此特别致谢中国信息通信研究院、中国平安人寿保险股份有限公司、东亚银行(中国)有限公司、中国电信股份有限公司研究院、麒麟软件有限公司、鼎道智联(北京)科技有限公司等。感谢各位秉承开源精神,协同共创,从多个视角提出了对于人工智能开源的理解,最终完成本报告的撰写工作。 报告撰稿人:俊哲、郭雪、李万宁、张子钰、宋罗娜、贾金鹏、王锴、周飞、陈亚阁、王悦、张方昌、周巍、任晓东、黄丽、陈慧、龙显军、江洪、黄琴、陈泳、刘敏、康艳红、张天雄、柴丹、李晓丽。 前言 当前,人工智能技术与开源模式的深度耦合,正引发全球科技创新范式与产业价值链的系统性重构。开源已超越单纯的代码共享范畴,演变为配置全球算力、数据与智力资源的核心机制。在算法框架、基座模型、工具链及数据要素等关键环节,开源生态的规模化渗透不仅大幅压缩了技术从实验室到产业界的转化周期,更有效消融了闭源技术垄断的壁垒。作为驱动数字经济高质量发展与培育新质生产力的核心引擎,开源人工智能为个人赋能、企业创新及国家技术自主体系的构建提供了不可或缺的路径支撑。 与此同时,开源人工智能的商业逻辑正经历深刻演变。以核心技术开放、生态资源共建与产业价值共创为特征的新型商业范式已趋于成熟,为产业的可持续发展奠定了结构性基础。然而,随着应用场景向深水区拓展,开源生态的系统复杂性与安全风险亦同步攀升。面对挑战,全球范围内的政府、科研机构与产业界正加速构建协同治理体系,推动开源发展从“自发式增长”向“制度化、体系化演进”转型,以确保技术红利的安全释放。 本报告基于开源创新发展推进中心的研究成果,立足2025年产业新局,全景式解析人工智能开源生态的演进态势。报告紧扣五大核心环节与三大驱动引擎,深入剖析技术、商业与治理的互动逻辑,旨在为我国人工智能开源生态建设、产业布局优化及政策制定提供科学化、前瞻性的决策依据。 目录 一、人工智能驱动开源向多元化范式演进...................................1 (一)从软件到模型:开源范式的延续与创新性演进........................1(二)从垄断到开放:开源重塑人工智能产业生态..........................4(三)从个人到国家:开源释放人工智能效能..............................7 二、五大环节构筑开源人工智能生态根基...................................8 (一)开源项目体系化发展,中国模型优势凸显............................9(二)开源社区分化鲜明,结构多元化演进...............................14(三)开源协议范式转变,从自由开放到责任治理.........................17(四)开源贡献规模持续扩大,模型衍生创新呈现集聚态势.................21(五)全球开源AI应用需求持续扩张,规模化落地进程加速................24 三、政策引擎:开源产业布局与生态治理协同推进..........................27 (一)美国:制度性扶持与安全治理双轨并行.............................27(二)欧洲:监管先行与合规导向的发展路径.............................28(三)中国:体系化部署与区域协同发展.................................30四、商业引擎驱动:开源生态活力加速释放................................33(一)开源人工智能主流商业模式趋于成熟...............................34(二)商业资本向头部聚集,应用层成为投资热点.........................36五、治理引擎驱动:各方协同联动构建生态锚点............................39(一)人工智能开源衍生多维度新型风险.................................39(二)企业级开源治理体系与全生命周期管理.............................41六、我国开源人工智能生态完善建议......................................45 图目录 图1人工智能开源形式............................................................................................2图2人工智能模型的开放访问等级........................................................................4图3人工智能开源生态架构图................................................................................9图4 2023-2025年GitHub平台托管仓库数量与增长率.......................................10图5 2023-2025年Hugging Face平台托管模型数量与增长率...........................11图6 2023-2025年魔搭平台托管模型数量与增长率.............................................11图7中美欧开源模型应用采用率..........................................................................12图8主流人工智能开源数据集规模对比..............................................................13图9开放人工智能透明度等级划分......................................................................17图10 Hugging Face平台主要许可协议使用分布.................................................18图11全球开源贡献者分布与开发者数量变化趋势............................................22图12 2025年第三季度典型开源大模型Tokens调用量对比..............................25图13企业使用开源模型主要情况占比................................................................25图14人工智能开源应用的主要行业分布............................................................26图15各地区包含开源内容的政策分布................................................................32图16人工智能开源商业模式结构示意图............................................................34图17开源人工智能的典型商业模式分类............................................................34图18全球商业开源软件企业融资领域................................................................37图19全生命周期分阶段防控策略........................................................................43 表目录 表1主流开源模型系列..........................................................................................15表2国内外典型大模型许可协议类型表..............................................................19表3企业入选“重要模型”数量..........................................................................23表4部分地区人工智能开源支持政策汇总表......................................................32表5 2022-2024年国内商业开源企业部分融资情况.............................................38表6典型模型主要风险类型及占比表..................................................................40表7企业治理体系中角色与职责分工表..............................................................42表8人工智能开源数据合规管理策略..................................................................43表9人工智能开源项目物料清单..........................................................................45 一、人工智能驱动开源向多元化范式演进 开源作为一种开放协作的范式,其应用边界已从传统软件领域系统性拓展至开源硬件、开放数据及开源大模型等多元形态。这一演进的本质在于突破技术壁垒,构建资源共享与协同创新的机制。相较于闭源模式,开源不仅重构了人工智能的产业生态链,更在个人、企业及国家层面拓展了技术自主与应用创新的纵深空间。 (一)从软件到模型:开源范式的延续与创新性演进 开源思想兴起于软件开发领域,软件开源核心在于源代码开放。“开源”(Open Source)概念根植于上世纪五十年代以来自由开放的计 算 机 文 化 , 并 随 着 开 源 软 件 促 进 会 (Open Source InitiativeAssociation,OSI)经典开源定义的确立,逐渐形成共识。在传统软件行业,源代码凝结了创作者的设计思想、实现方法和具体表达,因此软件开源的核心集中体现在源代码的开放、可获取。历经数十年的发展,开源已成为现代软件产业的主流开发模式。目前,全球96%的商业代码库中包含开源软件,并且商业代码库中77%的代码直接源自开源软件1。 开源模式应用场景不断拓展,人工智能开源实现了技术资产维度的突破性扩展。随着数字时代的到来和全球互联的加深,开源模式在不同场景的应用过程中逐渐衍生出开放数据、开放模型等多种概念形 态,成为人工智能技术创新、开放共享、可持续发展的源头活水。传统软件开源核心围绕