版权声明 本报告版权属于中国信息通信研究院和中车工业研究院有限公司,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院和中车工业研究院有限公司”。违反上述声明者,编者将追究其相关法律责任。 前言 当前,全球新一轮科技革命与产业变革加速演进,人工智能技术正加速从单点突破向系统化赋能演进,"模型能力"与"数据要素"的深度融合与共振协同已成为驱动产业智能化转型的核心动能。党的二十大报告明确提出要构建新一代信息技术、人工智能等新的增长引擎。人工智能模数共振体系在推动数据要素价值释放、加速模型技术迭代升级、赋能产业智能化转型方面发挥着日益重要的战略作用,是支撑人工智能高质量发展的核心要素。2025年9月23日,在2025人工智能产业及赋能新型工业化大会上,南京、济南、青岛、武汉、深圳等先导区和部属单位代表共同启动了“模数共振”行动。2025年10月27日,“人工智能赋能新型工业化模数共振专题研讨会”在北京召开,会议探讨了模数共振的概念内涵与实践路径。2026年1月,工业和信息化部等八部门联合发布《“人工智能+制造”专项行动实施意见》,其中提到模数共振行动相关要求,对构建数据驱动、模型赋能、应用牵引的模数共振协同发展格局具有重要意义。 人工智能模数共振体系是人工智能技术与产业应用深度融合的核心载体,其本质在于通过高质量数据集与高效能模型的双向共振,实现“以模引数、用数赋模”的良性循环。该体系以分层分类、精准赋能为原则,通过构建行业通识与专识数据集,培育行业大模型与特色智能体,并探索建立跨主体的“模数共振空间”与生态协同机制,打通数据流通壁垒,完善算力供给、标准规范与安全治理体系,为“人 工智能+”应用落地和各行业数字化转型提供全方位支撑。 本研究报告首先阐述了人工智能模数共振体系的具体定义和内涵,全面总结了模数共振的三大核心要素、五大核心基础能力支撑和三大协同运行机制,并提出模数共振下一步落地发展的具体建议,可为政策制定者、行业从业者及企业投资者等提供全面的行业洞察、策略建议与决策依据。面向未来,人工智能模数共振体系仍存在诸多问题与挑战,还需要产学研各界紧密合作,共同推进模数共振技术创新与产业发展,为“人工智能+”全面落地提供有力支撑。 目录 一、模数共振定义与内涵..............................................1(一)模数共振具体内涵..........................................1(二)模数共振必要性分析........................................3二、模数共振三大核心要素............................................5(一)高质量数据集..............................................5(二)高效能模型................................................7(三)高价值应用................................................9三、模数共振五大能力支撑...........................................11(一)数据集设计与构建.........................................11(二)数据集质量评估...........................................13(三)模型微调与优化...........................................15(四)模型性能基准测试.........................................17(五)数据增强与优化...........................................17四、模数共振三大协同机制...........................................21(一)建立模型-数据关联映射关系................................21(二)创新模数闭环迭代能力机制.................................23(三)构建模型自适应性能测试系统...............................26五、模数共振落地发展建议...........................................29(一)统筹推进行业数据集建设与模型优化.........................29(二)持续完善模型性能评测能力机制.............................29(三)探索建立模数共振生态协同机制.............................30(四)加强模数共振关键要素保障.................................30 图目录 图1 AI数据闭环迭代系统流程...............................................................................3图2可信AI人工智能数据集质量评估体系2.0..................................................15图3“方升”(FactTesting)大模型基准测试体系3.0..........................................18图4模型自适应测试闭环体系...............................................................................27 一、模数共振定义与内涵 人工智能模数共振体系是推动人工智能与实体经济深度融合发展的系统性工程,其核心要义在于实现高质量数据集、高效能模型、高价值应用三大要素的协同共振与价值倍增。该体系以数据要素为根基、以模型能力为枢纽、以场景赋能为导向,通过构建数据驱动模型进化、模型赋能应用创新、应用反哺数据积累的良性循环机制,打通从数据资源到智能服务的全链条价值通路。模数共振体系是连接数据治理、算法创新产业数字化转型的关键纽带,是释放人工智能乘数效应的核心载体,是培育新质生产力的重要引擎。在当今智能化浪潮加速演进的时代,构建完善模数共振体系已成为抢占人工智能发展制高点、赋能千行百业智能化升级的战略支撑。 (一)模数共振具体内涵 “模数共振”体系具体是指建立数据质量提升、模型优化与应用反馈的协同联动及闭环迭代机制,实现数据动态适配模型需求、模型输出反哺数据质量提升,旨在通过数据汇集、标注、合成、治理与管理全方位提升数据质量,并以高质量数据为底座夯实大模型训练、生成、推理能力,激活数据场景应用价值,有效破解AI模型训练中数据量不足、质量参差、场景适配性差等瓶颈,为大模型研发、智能装备升级、生产流程优化提供关键支撑。 传统人工智能数据集构建模式呈现出典型的“线性断裂”特征,往往止步于简单的预处理后即投入训练,导致训练过程中产生的反馈 信号被截断,缺乏对原始数据的有效检验与修正机制。这种“一次性交付”的粗放模式,使得数据集无法根据模型表现进行动态调优,进而引发场景覆盖存在盲区、特征提取能力孱弱、质量管控失效等系统性问题。在此割裂的体系下,模型难以习得稳健的泛化特性,导致其在复杂的业务实践中落地效果大打折扣,无法形成从数据到应用的价值闭环。 随着人工智能从通用技术向垂直场景深化,高质量数据集的建设已超越了单纯的“规模堆砌”,演进为一种动态的“闭环迭代生态系统”。这一系统构建了“原始数据—训练微调—测试评估—反向优化”的全链路流转机制,将数据的全生命周期管理与模型的进化周期深度耦合,形成了“数据滋养模型、模型反哺数据”的共生共荣格局。其实质是利用科学化、结构化的流程设计,精准破解数据质量与模型需求错配、训练效果与实际应用脱节、应用需求与技术迭代断层等核心痛点。在以数据为中心的新一代人工智能范式中,核心目标在于推动数据集从“被动供给”向“主动适配”转型,构建起具备自我进化能力的AI数据闭环,具体如图1所示。 人工智能模数共振体系通过循环反馈机制通过“数据处理—模型训练—性能检测”三位一体构成完整的循环圈,把数据和模型绑定在一起,再把数据利用的效能嵌入到闭环体系中,不断改进提高训练效果,从根本上提高整个闭环体系的数据集训练效率和准确度。 (二)模数共振必要性分析 模数共振体系是对人工智能“数据-模型”关系的一种再认识,由“数据供给决定模型能力”的单向逻辑转变为“模型需要引导数据进化、数据进化反哺模型升级”的双向主动机制,解决好数据质量与模型需求精准对接的问题,实现“好数育好模,好模引好数”,为人工智能技术由“实验室”迈向“产业界”提供坚强保证。 从技术层面来讲,闭环迭代体系的核心价值的是实现人工智能从“静态训练范式”向“动态持续进化范式”的根本性转变,打破了传统AI模型“训练-部署-停滞”的静态瓶颈。依托闭环架构,人工智能系统能够构建起“环境交互-信息感知-自主优化”的持续循环机制,持续接入真实场景中的动态数据、环境变量及反馈信号,在预设的算法边界与安全规则框架内,自主完成参数调优、模型迭代与策略适配,实现从“被动响应”到“主动进化”的跨越。同时,智能算法将深度渗透于数据 处理与模型优化全流程,构建“问题自动识别—策略自动生成—优化自动执行—效果实时反馈”的全链路自动化闭环,通过自动化工具覆盖数据采集、清洗、标注、模型训练、测试验证、部署运维等各个环节,大幅降低人工干预成本,提升系统运行效率、迭代速度与优化精度,推动AI技术从“可用”向“好用、耐用”持续升级。 从产业层面来讲,随着基础算法的趋同化与算力资源的普惠化,高质量数据集的规模与迭代体系的敏捷度已取代单一的技术指标,成为决定企业核心竞争力的关键变量。自适应闭环迭代体系正演变为重塑人工智能产业格局的决定性力量,具备成熟闭环能力的企业,能够依托“数据飞轮”效应,针对垂直场景的细粒度需求做出毫秒级反馈,在高频的实战演练中持续打磨模型精度。同时,在反复的迭代循环中,不断沉淀高质量、高价值的场景化数据资产,形成“数据积累-模型优化-效果提升-数据增量”的正向循环,持续深化自身技术优势与场景适配能力,逐步构建起难以被复制的技术壁垒与竞争优势,在同质化竞争中实现差异化突围,推动人工智能技术与产业场景的深度融合落地。 未来,人工智能闭环迭代体系将朝着“智能化、自动化、一体化”发展,数据和模型的深度融合,最终实现“数据即模型、模型即数据”的共生状态,实现人工智能的自我进化成长。这样才能不断激活高质量数据集的价值,带动人工智能技术进入“数据驱动、自主进化”的新阶段。 二、模数共振三大核心要素 人工智能模数共振体系以高质量数据集、高效能模型、高价值应用为核心要素,构建“数据驱动模型进化、模型赋能场景落地、场景反哺数据迭代”的闭环生态。高质量数据集作为基石,通过汇聚行业核心知识与多模态信息,为模型提供高价值、高密度的“燃料”;高效能模型作为引擎,融合通用能力与行业机理,实现从云端训练到边缘推理的精准适配;高价值应用作为出口,锚定产业刚需场景,推动AI从辅助工具升级为生产主体,最终形成“模数共生、价值倍增”的智能化发展新范式。 (一)高质量数据集 高质量数据集是指用于训练、验证和优化人工智能大模型而收集、整理、标注形成的覆盖行业核心专业知识和生产经营活动信息的数据资源集合。高质量数据集覆盖制造、金融、医疗、交通、公共安全、自然资源、地理信息、人力资源、社会治理、科学研究等重点行业的公域数据和私域数据,具有高技术含量、高知识密度、高效益场景的“三高”特征。 一是高技术含量。当前,高质量数据集的建设