您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国家工业信息安全发展研究中心]:全国数据资源调查报告(2024年) - 发现报告

全国数据资源调查报告(2024年)

AI智能总结
查看更多
全国数据资源调查报告(2024年)

版权声明本报告版权属于全国数据资源统计调查工作组,并受法律保护。转载、摘编或利用其他方式使用本报告文字或者观点的,应注明“来源:《全国数据资源调查报告(2024年)》”。违反上述声明者,将追究其相关法律责任。 凯汪 玉 凯李 晓 东吴 志 刚冯 海 红黄晨黄 丽 华赵刚孙宏刘 韵 洁尹浩张 平 文李国 家 工 业 信 息 安 全 发 展 研 究 中 心专家委员会工作组(排名不分先后) 委员蒋艳姜 奇 平廖蔡 跃 洲欧阳日辉王郑 爱 军顾问邬 贺 铨江 小 涓梅复 旦 大 学 上 海 数 学 中 心 罡毅胡 良 霖林伟骏高 新 民 前言INTRODUCTION习近平总书记指出,我国数据资源丰富,产业体系完备,应用场景广阔,市场空间巨大,要深化数据资源开发利用和开放共享。随着数字中国建设深入推进,数据领域新技术、新模式、新业态不断涌现,数据生产、存储、计算、流通和应用等各环节发生新变化,数据要素对经济社会发展的乘数效应进一步释放,我国海量数据资源和丰富应用场景优势逐渐转化为经济增长新动能、国家竞争新优势。贯彻落实《数字中国建设整体布局规划》工作部署,2024年国家数据局联合相关部门首次开展全国数据资源调查,对数据资源进行摸底。2025年2月,国家数据局联合相关部门组织开展2024年度全国数据资源统计调查工作,有效样本数量1.44万个,覆盖除国际组织外的所有国民经济行业门类。本年度调查在上年度数据规模、开发利用和应用情况等指标基础上,新增人工智能(AI)、大模型、低空经济等热点领域调查指标,并对数据资源地区、行业分布情况做了分析测算,形成了《全国数据资源调查报告(2024年)》。报告显示,我国数据资源规模优势持续扩大,数据资源开发利用活跃度稳步提升,各类主体加快人工智能布局投入,数据要素市场化、价值化进程进一步提速。一是数据资源规模加速增长。2024年,全国年度数据生产总量1达41.06泽字节(ZB),同比增长25%,增速提高2.56个百分点。人均年度数据生产量约为31.31太字节(TB),同比增长25.17%,年度数据生产总量和人均产量实现同步跃升,智能家居、智能网联汽车、无人机等智能设备数据增速位居前列。二是数据存储结构持续优化。2024年,全国数据存储总量2为2.09泽字节(ZB),同比增长20.81%。存储空间利用率3达61%,同比提高2个百分点。结构化数据同比增长36%,占存储总量比重为18.70%,大幅超过非结构化数据存储增速,表明数据资源开发利用的程度明显提高。1全国数据生产总量指2024年度全国数据创建、复制、捕获和消费产生的数据总量。2全国数据存储总量指全国累计存储的数据量,包括算力中心存储量,以及政府、企事业单位、个人终端的数据存储量。3存储空间利用率=累计数据存储总量/累计数据存储总空间。 三是算力基础设施加快布局。2024年,全国算力总规模4达280EFLOPS(每秒百亿亿次浮点运算),八大国家枢纽节点算力总规模达到175EFLOPS。智能算力规模达90EFLOPS,在算力总规模中占比提升至32%,为海量数据计算提供智能底座。四是公共数据资源开发利用步伐加快。政务数据共享持续深化,共享枢纽平台累计支撑调用超5400亿次,有力支撑“高效办成一件事”改革。2024年,全国地市级以上地方公共数据开放平台数量增长7.5%,开放的数据量增长7.1%5。国家公共数据资源开发利用“1+3”政策文件发布后,各省(自治区、直辖市)、计划单列市中,超六成启动授权运营工作。五是企业数据资源开发利用提速。2024年,66.1%的行业龙头企业购买过数据,企业数 据与公共数 据融合应 用场景加速增长 。活跃 数据6总量同比提 升22.73%,活跃数据总量占存储数据总量为62.04%。企业数据要素在企业内部关键环节,如技术研发、生产协同、产品营销、售后服务等环节中发挥了重要作用,产业链供应链韧性不断提升。六是数据促进人工智能加速发展。2024年,新增238款人工智能服务在国家网信办完成备案。开发或应用人工智能的企业数量同比增长36%,高质量数据集数量同比增长27.4%,有力支撑人工智能训练和应用。利用大模型的数据技术企业同比增长57.21%,数据应用企业同比增长37.14%。报告不足之处在所难免,敬请各位专家和广大读者指正。4数据来源于数字中国建设峰会官方网站。5数据来源于复旦大学数字与移动治理实验室。6活跃数据指一年中至少被使用1次的数据。 (一)数据资源规模优势持续扩大(二)数据资源开发利用活跃度稳步提升(三)数据要素价值潜力持续释放一、重点指标(一)数据生产总量增速加快(二)数据存储结构和空间持续优化(三)智能算力加速布局(四)公共数据资源开发利用步伐加快(五)企业用数活力逐步提升二、调查分析目录CONTENTS 02020201040505060703 (一)数据生产总量将保持增长态势(二)数据资源流通利用进入加速期(三)数据融合应用加快价值化进程09090908三、发展趋势一、数据来源二、样本分布三、统计方法10111210附录(六)人工智能与数据资源开发利用互相促进(七)数据资源区域和行业分布不均衡0707 一、重点指标 我国数据生产、存储总量增长再提速,数据存储空间利用率提高,智能算力加快布局引领算力规模增长。•2024年,全国数据生产总量达41.06泽字节(ZB),同比增长25%。•2024年,全国数据存储总量为2.09泽字节(ZB),同比增长20.81%。存储空间利用率为61%,同比增长2个百分点。•2024年,全国算力总规模达280EFLOPS(每秒百亿亿次浮点运算),八大国家枢纽节点算力总规模达175EFLOPS。智能算力规模达90EFLOPS,在算力总规模中占比提升至32%。(一)数据资源规模优势持续扩大公共数据资源供给和企业用数需求双向拉动,企业加快应用大模型,高质量数据集建设进入加速期。•2024年,全国地市级以上公共数据开放平台数量增长7.5%,开放的数据量增长7.1%。超六成省(自治区、直辖市)、计划单列市启动公共数据授权运营工作。•2024年,约66%的行业龙头企业和30%的数据技术企业购买过数据。•2024年,利用大模型的数据技术企业和数据应用企业数量分别增长57.21%、37.14%。•2024年,企业高质量数据集建设增速超27%。(二)数据资源开发利用活跃度稳步提升数据“产-存-算-流-用”各环节转换过程中,数据要素价值持续释放,数据产业发展潜力巨大。•2024年,活跃数据总量为1.3泽字节(ZB),同比提升22.73%,活跃数据总量占存储数据总量为62.04%。•2024年,利用数据获得直接收益的企业实现小幅提升。(三)数据要素价值潜力持续释放 二、调查分析 数据生产总量呈高速增长态势。2024年,全国数据生产总量达41.06泽字节(ZB),同比增长25%,增速较去年提高2.56个百分点(图2-1)。人均数据生产量约为31.31太字节(TB),同比增长25.17%,数据生产总量和人均产量实现同步跃升。智能应用推动数据资源规模加速增长。随着人工智能快速发展,用于开发、训练和推理的数据量同比增长40.95%。智能家居、智能网联汽车等智能设备数据增速位居前列,分别为51.43%、29.28%。战略性新兴产业激发数据新增长点。无人机应用范围快速拓展,机器人产业化进程不断加快,带动低空经济和机器人数据生产量增速超过30%。图2-1数据生产总量(2022年—2024年)数据来源:2024年度全国数据资源统计调查2022年26.83010515202530354045ZB+22%(一)数据生产总量增速加快 32.8541.062023年2024年+25% 数据存储结构持续优化。2024年,全国数据存储总量为2.09泽字节(ZB),同比增长20.81%,其中新增数据存储总量1.15泽字节(ZB)。数据存储空间利用率为61%,同比提升2个百分点。结构化数据同比增长36%,占存储总量比重为18.70%,大幅超过非结构化数据存储增速,表明数据资源开发利用的程度明显提高。各行业数据上云差异明显。2024年,全国数据云存储率为30.39%。政务、气象、金融数据云存储占比分别为47.39%、42%、26.38%,数据弹性灵活调用更敏捷。科学数据仍然以本地化存储为主,云存储占比约为5%。智能算力规模大幅提升。2024年,全国算力总规模达到280EFLOPS,其中智能算力规模达90EFLOPS,占比提升至32%(图2-2),为海量数据计算提供智能底座。企业加快布局智能算力。随着人工智能应用推广,市场对智能算力的需求呈爆发式增长,企业布局智能算力提速。其中,中央企业7算力规模增长近3倍,智能算力占比为40.22%;数据技术企业算力规模同比增长近1倍,智能算力占比为43.63%。图2-2 2023—2024年算力中心算力规模及智能算力占比2023年010050150200250300EFLOPS30%7中央企业有效样本数量为101家。数据来源:2024年度全国数据资源统计调查(二)数据存储结构和空间持续优化(三)智能算力加速布局 2024年全国算力总规模全国智算占比情况32% 政务数据共享持续深化。建成全国一体化政务数据共享枢纽,累计支撑调用超5400亿次,推动国务院部门201个垂管系统向基层“回流”数据8.2亿条,为经济社会发展、数字政府建设、“高效办成一件事”改革提供了有力的数据支撑。公共数据集开放总量稳步增长。公共数据开放程度逐渐提升,2024年全国地市级以上公共数据开放平台数量增长7.5%,开放的数据量增长7.1%。公共数据授权运营探索步伐加快。国家公共数据资源开发利用“1+3”政策文件发布后,超六成省(自治区、直辖市)、计划单列市启动授权运营工作,公共数据授权运营逐步规范化、有序化。其中,市级政府部门公共数据授权运营数据量为省级政府部门的2.53倍,公共数据资源供给不断扩大。公共数据服务场景日益丰富。公共数据服务产品数量同比增长超过40%(图2-3),涵盖交通、环保、医疗等经济社会各领域,应用在低空经济、多式联运、保险理赔、征信服务等场景。图2-3公共数据服务产品数量变化及分布2023年2024年0500010000150002000025000个40%数据来源:2024年度全国数据资源统计调查(四)公共数据资源开发利用步伐加快 WEB应用移动APP小程序其他 企业数据应用需求逐步释放。2024年,存储数据中活跃数据占比为62.04%,数据资源开发利用活跃度逐步提升。企业用数需求旺盛,约66%的行业龙头企业和30%的数据技术企业购买过数据,企业数据与公共数据融合应用场景更加丰富。平台企业成为数据流通的关键枢纽。平台企业发挥生态优势,促进气象、交通、地理等公共数据加速与企业数据融合,在客户服务、精准营销、研发创新等场景得到广泛应用。(五)企业用数活力逐步提升大模型应用促进企业数据资源开发利用。企业加快人工智能投入和大模型应用,利用大模型的企业数量同比增长超过37%,比例提升至约10%。大模型有望帮助企业降低非结构化数据加工成本,推动数据资源开发利用提档加速。人工智能发展带动高质量数据集需求激增。数据技术企业积极推动数据集建设,高质量数据集数量增速达27.4%。人工智能加快向垂直领域发展,企业用于人工智能的数据量占数据存储量约为7%,企业数据集建设潜力空间巨大。(六)人工智能与数据资源开发利用互相促进区域数据资源水平和经济发展高度相关。经济大省数据资源集聚效应明显,广东、江苏、山东、浙江、河南和四川6个省份数据生产量占全国比重达57.45%。东部地区数据资源开发利用活跃,北京、上海企业人工智能投入平均水平位居全国前二,浙江应用大模型的企业比例位居第一,江苏、广东企业平均数字化投入是全国平均水平的1.71倍。行业数据资源开发利用水平与数字化投入密切相关。随着我国数字化、网络化、智能化进程加速,制造、金融、交通物流行业数据生产总量领先其他行业,金融、采矿、交通物流行业企业平均数