您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国信通院]:数据要素发展报告(2025年) - 发现报告

数据要素发展报告(2025年)

AI智能总结
查看更多
数据要素发展报告(2025年)

中国信息通信研究院云计算与大数据研究所2025年10月 版权声明 本报告版权属于中国信息通信研究院,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,本院将追究其相关法律责任。 前言 党的二十届三中全会强调,要健全因地制宜发展新质生产力体制机制,健全促进实体经济和数字经济深度融合制度。2025年政府工作报告进一步提出,要激发数字经济创新活力,持续推进“人工智能+”行动,加快完善数据基础制度,深化数据资源开发利用。随着以人工智能为代表的新一轮科技革命和产业变革深入发展,数据作为关键生产要素的战略价值愈加凸显。数据与智能的深度融合,不仅是催生新产业、新模式、新动能的重要力量,更是我国在全球数字经济竞争中构筑新优势、把握发展主动权的关键所在。在此背景下,统筹发展和安全,全面深化数据要素市场化配置改革,持续扩大高质量数据供给,推动数据在经济社会各领域的深度应用,对建设数字中国、推进中国式现代化具有深远意义。 当前,推动数据“供得出、流得动、用得好、保安全”串联起了我国数据要素市场化配置改革的长期目标,在制度、技术与产业的协同向前中,数据要素发展已进入体系化构建与规模化应用的新阶段。一是数据为人工智能发展筑基,推动智能涌现,同时人工智能也使得数据要素价值发挥得到升级拓展,为数字经济发展提供重要引擎。国产大模型的爆发式演进,使高质量、多模态、专业化数据的研发需求空前迫切。数据采集、数据标注等环节与人工智能产业结合为紧密的生态体系。同时,大模型使数据成为能够承载多样化内容的语义载体。智能化数据治理有效降低了海量非结构化数据的处理成本,提升了数据质量。“数据驱动智能,智能优化数据”为数字经济发展筑牢根基。 二是数据制度体系建设全面提速,为数据产业规范发展和数据市场培育筑牢基础。公共数据资源开发利用“1+3”政策体系的相继出台实施,成为破解数据供给瓶颈、激发市场活力的关键突破口。培育全国一体化数据市场的系列政策正加速制定,例如,《国家数据基础设施建设指引》为搭建支撑全国数据资源互联互通的技术底座提供顶层设计,推动各技术路线从理论走向实践;《关于促进数据产业高质量发展的指导意见》则聚焦数据产业发展现状和市场需求,优化布局、加强激励,推动培育多元经营主体。 三是产业实践探索多点开花,在多元创新场景中加速落地。各类主体在确保安全可控的前提下,着力打通数据供给和流通堵点,参与数据要素价值创造。在人工智能的助力下,数据应用向深层次、多领域拓展,持续赋能经济社会发展。数据资产的经济价值在各类应用中加速显化,对于新方法、新路径的探索持续活跃。数据安全治理也从基础的合规达标转向与业务深度融合的主动治理,覆盖数据全生命周期的智能防控体系正在形成。 在此背景下,《数据要素发展报告(2025年)》进一步讨论了数据要素的理论认识,系统梳理了过去一年我国数据要素发展在供给、流通、应用和安全等方面的最新动态,并在总结发展特征、研判核心挑战的基础上,对未来发展趋势提出展望,以期为各方深入推进数据要素市场化配置改革、全面释放数据要素价值提供有益参考。 目录 一、智能时代数据要素再认识................................................................................... 1 (一)数据是人工智能发展的核心要素之一.................................................... 1(二)人工智能助推数据的作用方式升级拓展................................................ 4(三)数据要素价值释放以全过程贯通为根基................................................ 6二、“供得出”:高质量数据供给水平持续提升........................................................8(一)制度进展:一系列政策举措推动强化数据供给.................................... 9(二)技术热点:多模态数据研发治理能力寻求突破.................................. 13(三)产业热点:重点领域加快建设高质量数据集...................................... 16三、“流得动”:全国一体化数据市场培育平稳推进..............................................20(一)制度进展:全国一体化成为顶层设计关键目标.................................. 20(二)技术热点:数据流通利用基础设施建设启动...................................... 22(三)产业热点:数据交易向规范化多样化发展.......................................... 24四、“用得好”:多层次应用拓宽数据赋能路径......................................................28(一)制度进展:“数据要素×”多举措推动数据使用复用............................ 28(二)技术热点:数智技术融合推动应用范式变革...................................... 30(三)产业热点:数据资产化探索丰富数据价值领域.................................. 32五、“保安全”:数据智能紧密结合共筑安全堡垒..................................................34(一)制度进展:数据安全治理向AI领域延伸............................................ 34(二)技术热点:数据安全技术愈加精准智能.............................................. 36(三)产业热点:安全治理从合规达标转向主动治理.................................. 37六、发展展望............................................................................................................. 38(一)容错免责机制设计需成为改革关键对象.............................................. 39(二)三大引导方向或将在短期内快速推进.................................................. 41(三)夯实企业能力仍是发挥市场主导作用的基础...................................... 42 图 目 录 图1数据要素的三类微观作用方式................................................................................... 5图2数据要素的三次价值释放.............................................................................................7图3历年地级及以上数据开放平台数量增长情况......................................................11图4高质量数据集建设方法论...........................................................................................19图5企业知识工程能力体系............................................................................................... 32图6 2024年数据资源入表趋势...........................................................................................33 一、智能时代数据要素再认识 数据作为形成新质生产力的关键生产要素,以其独特的价值增值方式促进科技革命和产业变革,提升全要素生产率。2025年,由国产大模型深度求索(DeepSeek)引发的新一轮人工智能发展热潮中,数据作为“智能引擎”的作用进一步凸显。2025年8月,国务院印发《关于深入实施“人工智能+”行动的意见》,系统布局“人工智能+”6大重点行动和8大基础支撑能力,对于数据的供给、开放、应用、安全等也提出了相应要求。与此同时,多模态大模型、具身智能等人工智能技术的爆发式演进,也将对数据的产生、治理、流转和利用方式产生深刻影响。因此,应不断深化和完善对数据要素及其价值作用规律的理论认识,以推动数据要素价值释放,赋能智能经济蓬勃发展。 (一) 数据是人工智能发展的核心要素之一 数据是人工智能技术和产业发展的重要生产要素。生产要素是对某一时期经济发展中所需重要资源的科学抽象,是对生产过程中所投入成本的高度凝练,数据要素就是在数字经济语境中对数据的指代和对数据价值的强调1。数据既是人工智能技术迭代和产品研发的关键输入,也是人工智能产业的生产源头和消费对象。技术层面,随着大模型技术应用的快速发展,人工智能的研发重点正从“重点优化模型架构”转向“模型与数据协同优化”,其中高质量数据的作用日益凸显2。当前,从数值记录到行为轨迹,从图像语音到文本知识,万事万物不断转化成数据并“喂”给模型,充当神经网络提取特征的“养 料”。输入数据的质量直接影响人工智能模型的训练效果和决策生成的准确性。提高数据质量成为智能水平进一步提升的“先手棋”。产业层面,2024年,全国数据生产总量达41.06泽字节(ZB),同比增长25%。其中,用于开发、训练和推理的数据量同比增长40.95%,智能家居、智能网联汽车等智能设备数据增速位居前列,分别为51.43%、29.28%3。数据采集、数据标注、高质量数据集建设等产业与人工智能产业逐渐结合为关联紧密的生态体系,训练数据流通、合成数据供给等业态正不断补足人工智能产业链条。 大模型突破了 DIKW 模型,重塑数据与知识、智慧间的转化关系。数据的概念及其扮演的角色随着社会变迁而不断变化,在快速变化的技术环境中,数据的功能定位也不断涌现出新的指征和意义。20世纪80年代,“数据-信息-知识-智慧”(Data-Information-Knowledge-Wisdom,DIKW)模型提出了一种层次分明的认知路径,其中的“数据”侧重指代无意义的原始记录,可被直接输入到计算流程中。大数据和人工智能正是依靠大规模数据计算产生大量人类理性难以直接感知到的信息,为数据赋予意义和解释。这种抽象和提炼式的线性升级路径同样适用于大多数从信息到知识、从知识到智慧的演变过程,但诸如因果、默会知识等知识形式或直觉感知、善恶是非之心等智慧表现的产生并不严格遵循这一线性升级过程。然而,大模型的出现表明,数据可以打破DIKW模型中的线性层级壁垒,数据与知识、智慧之间可以直接形成动态交互结构。具体 表现形式如,预训练模型将海量数据的关联关系压缩存储,成为输入给机器的经验知识;向量空间中长距离的数据点被自注意力机制敏锐捕捉,效仿人类智慧发掘出看似无关、实则关联的元素;以专业领域信息内容为基础的模型微调优化,生成的内容