NATIONAL DATA RESOURCE SURVEY REPORT 版权声明 本报告版权属于全国数据资源统计调查工作组,并受法律保护。转载、摘编或利用其他方式使用本报告文字或者观点的,应注明“来源:《全国数据资源调查报告(2025年)》”。违反上述声明者,将追究其相关法律责任。 专家委员会 (排名不分先后) 顾问 邬 贺 铨江 小 涓梅宏刘 韵 洁尹浩张 平 文李骏孙 胜 利高 新 民许 宪 春 委员 江 明 涛姜 奇 平廖凯汪 玉 凯李 晓 东黄罡张 向 宏何强吴 志 刚蔡 跃 洲王 建 民欧阳日辉王晨赵刚孙毅胡 良 霖林伟王钺冯 海 红杨 翰 方郑 爱 军 工作组 国 家 工 业 信 息 安 全 发 展 研 究 中 心复 旦 大 学 上 海 数 学 中 心 前言INTRODUCTION 习近平总书记指出,当今世界正在加速迈入智能时代,数据的基础资源作用和创新引擎作用日渐显现。党中央、国务院高度重视数据工作,就健全数据要素基础制度、深化数据资源开发利用、促进实体经济和数字经济深度融合等方面作出全面部署。国家数据局成立以来,贯彻落实党中央、国务院决策部署,坚持以数据要素市场化配置改革为主线,围绕数据基础制度、数据基础设施、数据融合应用和场景建设、全国一体化数据市场建设、数据产业培育5个方面打出一套“组合拳”,夯实数据领域核心技术攻关、数据标准化、数字人才培养3个基础,突出数据赋能人工智能创新发展1个重点,探索形成了“531”的工作体系,持续推动数据“供得出、流得动、用得好、保安全”,促进数据要素全面赋能经济社会发展。 贯彻落实《中华人民共和国国民经济和社会发展第十五个五年规划纲要》提出“构建国家数据资源体系,健全数据资源统计调查制度,建立全国数据资源‘一本账’”的工作部署,国家数据局修订了《全国数据资源统计调查制度》。在此基础上,组织开展2025年度全国数据资源统计调查工作,调查有效样本数量4.25万个,覆盖除国际组织外所有国民经济行业门类。在保持数据供给、流通与开发利用等指标体系连续性的基础上,本年度调查实现了双向扩容:一是向“新主体”拓展,将地方数据集团、可信数据空间等纳入调查范围;二是向“新热点”拓展,将词元(Token)调用、高质量数据集流通交易、企业数据要素投入、数据增值等产业发展热点作为调查研究重点,持续提升对我国数据资源全景刻画、结构性分析和前瞻性研判能力,形成《全国数据资源调查报告(2025年)》。 调查结果显示,我国数据要素市场化价值化进程显著提速,数据资源供给体系、数据流通体系和数据开发利用体系协同演进,正由数据资源规模扩张向数据要素价值释放跃升,呈现以下显著特征: 一是数据资源规模保持高速增长态势。2025年,全国年度数据生产总量1达52.26泽字节(ZB),同比增长27.28%,增速较上年提升2.28个百分点。我国数据生产总量占全球约27.44%。从主体看,企业成为数据生产的主力,数据生产增量约九成来自企业数据,产业数智化转型成效明显。从行业和领域看,工业制造、交通物流、软件和信息技术服务业等行业数据生产量增幅较大,同比分别增长1.27泽字节(ZB)、1.22泽字节(ZB)、0.92泽字节(ZB),有效发挥“领头羊”“压舱石”作用。具身智能、低空经济等新兴领域数据生产量高速增长,增速分别为477.78%、75%。全国数据存储总量达2.53泽字节(ZB),同比增长21.05%。结构化数据存储量为0.56泽字节(ZB),同比增长43.59%,占数据存储总量的22.13%,数据质量持续提升,加速向可计算、可分析形态转化。 二是算力基础设施建设稳步推进。“东数西算”工程全面实施,全国一体化算力网加快构建,智能算力供给水平稳步提升。截至2025年底,全国智能算力规模达159万PFLOPS(FP16),通用算力向智能算力的代际更替加速,成为支撑人工智能发展的关键基础设施。智算资源集聚优势逐步显现,八大国家算力枢纽(含十大集群)智算规模占全国智算规模的80%以上。 三是数据资源开发利用更加高效。随着“数据要素×”行动、公共数据“跑起来”示范场景建设、国有企业数据效能提升行动、国家数据基础设施建设先行先试、可信数据空间发展行动计划等纵深推进,数据融合应用和场景建设不断深化,数据要素价值加速释放。公共数据资源开发利用成效显著。公共数据用于共享、开放、授权运营的数据量均快速增长,申请共享的数据集数量同比增长近30%,公共数据开放数据量和授权运营数据量同比分别增长31.71%、53.96%。公共数据带动各行业数据加快融合应用,场景覆盖产业发展、教育科技、医疗健康、民生服务、基层治理等领域。企业用数活力加速释放。2025年,企业数据技术投入同比增长17.37%。企业数据产品和服务数量同比增长29.29%,交易额同比增长39.8%,数据产品和服务从数字化副产品向赋能业务增长的驱动引擎转变。 四是数据流通交易效果初显。全国一体化数据市场建设加快推进,市场活力进一步激发,数据要素价值加速释放,为高质量数据付费的市场共识正在形成。数据流通活跃度不断提高。2025年,全国数据跨境流通总量为142.34艾字节(EB),同比增长14.88%。数据跨省流通总量为2949.12艾字节(EB),同比增长19.01%,广东、浙江、江苏、山东、河南等经济大省数据跨省流通量位居前五。企业数据流通总量为1935.36艾字节(EB),同比增长25.17%。头部平台企业和中央企业2的数据流通规模均值是其他企业的140多倍,数据流通枢纽功能持续强化。数据付费意愿不断提升。样本企业中,11.65%的企业购买过数据,购买数据费用同比增长22.36%。头部平台企业和中央企业购买数据费用均值是其他企业的60倍。金融、软件和信息技术服务业等行业购买过数据的企业比例均超30%,大幅高于行业平均水平。 五是数据赋能人工智能迈入规模化应用新阶段。人工智能发展从通用大模型到行业垂域模型,再到代理型人工智能形态演进,对数据的需求 也从基础语料到行业高质量数据集拓展。调查表明,2025年,用于人工智能训练和推理的数据总量为199.48艾字节(EB),同比增长42.86%,推理数据量达101.34艾字节(EB),首超训练数据量。高质量数据集数量超11万个,规模超908拍字节(PB),同比分别增长61.13%和142.58%。全年词元(Token)调用量约21100万亿,词元(Token)正成为人工智能的新度量衡。 同时也要看到,当前我国数据市场建设还处于起步阶段,数据价值释放仍有较大潜力。2026年是“十五五”开局之年,也是“数据要素价值释放年”,随着数据基础制度加快健全完善、数据基础设施规模化部署和应用能力不断增强、全国一体化数据市场建设持续推进,数据要素在更大范围、更深层次参与资源配置的条件正加速形成。展望未来,我国数据资源规模优势将加快向价值优势转化,数据要素将在赋能经济社会发展和治理能力提升、促进生产方式深层次变革和生产力革命性跃迁中发挥更加重要的基础性、战略性作用。 报告不足之处在所难免,敬请各位专家和广大读者指正。 目录CONTENTS 第一章重点指标01 020304一、数据资源供给主要指标二、数据要素流通主要指标三、数据资源开发利用主要指标 第二章调查分析05 一、数据资源供给规模持续扩大06 (一)数据生产规模保持高速增长(二)存储数据可用性提高(三)智能算力持续保持高速扩张060708 二、数据流通交易效果初显 08 (一)数据流通活跃度不断提高(二)数据付费意愿不断提升0809 三、数据资源开发利用更加高效09 (一)数据赋能人工智能创新发展(二)公共数据资源开发利用不断深化(三)企业用数活力加速释放091111 四、数据加快赋能千行百业12 (一)农业数据助力智慧农业建设(二)工业供数用数动力逐渐提升(三)服务业数据流通利用成效显著(四)科学数据引领创新应用与转化12121313 第三章发展趋势15 一、人工智能将变革数据生产利用方式二、词元成为数据价值释放的新路径三、数据资源流通效率加快提升四、数据产业专业化分工体系不断深化16161616 附录:调查方法17 第一章重点指标 一、数据资源供给主要指标 全国数据生产、存储规模保持高速增长,活跃数据量明显提升,通用算力向智能算力的代际更替加速,数据生产、存储和开发利用的“剪刀差”开始缩窄。 二、数据要素流通主要指标 跨境、跨省数据流通持续提速,头部平台企业和中央企业发挥数据资源汇聚、流通和开发利用的枢纽作用,为高质量数据付费的市场共识正在形成。 三、数据资源开发利用主要指标 数据资源支撑人工智能跃迁式发展,词元(Token)调用量呈现指数级增长。数据资源开发利用不断深入,公共数据供给方式从“共享为主”向“共享、开放、授权运营协同推进”转变,企业用数活力不断提升,加快释放数据要素价值。 第二章调查分析 一、数据资源供给规模持续扩大 (一)数据生产规模保持高速增长 2025年,全国年度数据生产总量达52.26泽字节(ZB),同比增长27.28%,增速较上年提升2.28个百分点。我国数据生产总量占全球约27.44%。人均数据生产量约为39.94太字节(TB),同比增长27.56%。 从结构看,数据生产正由感知驱动向计算驱动转变,系统软件、人工智能产生的数据量为26.92泽字节(ZB),首次超过摄像头、传感器等物联感知数据量25.34泽字节(ZB),用于人工智能训练、开发和应用的数据增长显著。 从主体看,企业成为数据生产的主力。2025年,企业数据生产总量为33.54泽字节(ZB),占数据生产总量比重从58.30%提升到64.18%,贡献九成数据生产增量,产业数智化转型成效明显。 从行业和领域看,工业制造、交 通物 流、软件和信息技术服 务业等 行业 数据生产量增幅较大,分别增长1.27泽字节(ZB)、1.22泽字节(ZB)、0.92泽字节(ZB),有效发挥“领头羊”“压舱石”作用。具身智能、低空经济等新兴领域数据生产量高速增长,增速分别为477.78%、75%。 (二)存储数据可用性提高 2025年,全国数据存储总量为2.53泽字节(ZB),同比增长21.05%。存储空间为3.94泽字节(ZB),存储空间利用率为64.21%,较上年提升3个百分点。 从存储 结构看,云存储总量为0.98泽字节(ZB),同比增长53.13%,占数据存储总量的38.74%,有效支撑了业务协同和数据交互。结构化数据存储量为0.56泽字节(ZB),同比增长43.59%,占数据存储总量的22.13%,数据质量持续提升,加速向可计算、可分析形态转化。 从利用效率看,人工智能的普及应用极大促进了存储数据的盘活利用,全国活跃数据总量为1.67泽字节(ZB),同比增长28.46%,增速超过数据存储总量增速。在“人工智能+”行动的政策推动下,中央企业平均活跃数据量超56拍字节(PB),同比增长41.98%,示范带动作用明显。 (三)智能算力持续保持高速扩张 截至2025年底,全国智能算力规模为159万PFLOPS(FP16),通用算力向智能算力的代际更替加速,成为支撑人工智能发展的关键基础设施。 从空间布局看,智算资源集聚优势逐步显现,八大国家算力枢纽(含十大集群)智算规模占全国智能算力的80%以上。贵州、内蒙古和河北加快打造算力高地,占全国智算规模超六成,全国一体化算力网建设加快。 从建设主体看,中央企业和平台企业加大对智能算力的战略性投资,智算资源成为人工智能时代衡量企业竞争力的重要指标。中央企业自建算力中,智能算力占比近80%,智能算力规模同比增长65.99%。头部平台企业智算建设投入超千亿。 二、数据流通交易效果初显 (一)数据流通活跃度不断提高 2025年,数据流通交易政策文件加快落地,全国一体化数据市场建设持续推进,跨境、跨省数据流通更加活跃。 数据跨境流通稳步增长。2025年,全国数据跨境流