您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[复旦大学]:2025中国地方公共数据开放利用报告 - 发现报告

2025中国地方公共数据开放利用报告

2025-11-26-复旦大学杨***
AI智能总结
查看更多
2025中国地方公共数据开放利用报告

目录 本报告为国家社科基金重大项目“面向数字化发展的公共数据开放利用体系与能力建设研究”(批准号:21&ZD337)的阶段性成果之一。 引言 “中国开放数林指数”是我国首个深耕于公共数据开放领域的专业指数,由复旦大学数字与移动治理实验室制作。自 2017 年首次发布以来,“中国开放数林指数”定期对我国地方公共数据开放利用水平进行综合评价,精心测量各地的“开放数木”,并发布《中国地方公共数据开放利用报告》( 以下简称《报告》),助推我国公共数据的供给流通与价值释放。 开放数林指数将省及其下辖地市作为一个整体的“区域”来进行评测,将直辖市、副省级城市和地级城市,都作为一个“空间”和“聚落”,而不仅仅是一个行政 " 层级 " 来进行评测,并形成省域和城市两个指数榜单。 开放数据,蔚然成林,“开放数林”意喻我国公共数据开放利用的生态体系。我们期待,一个个地方的开放“数木”将共同成长为一片根深叶茂、生生不息、人人受益的中国开放数林。 一、数林概貌 截至 2025 年 7 月,我国已有 257 个省级和城市的地方政府上线了数据开放平台,其中省级平台 26 个(不含直辖市和港澳台),城市平台 231个(含直辖市、副省级与地级行政区)。与 2024 年同期相比,新增 14 个地方平台,其中包含 2 个省级平台和 12 个城市平台,平台总数增长约 5%,如图 1 所示。 目前,我国 27 个省级行政区(不含直辖市和港澳台)中已有 26 个上线了公共数据开放平台,占总数的 96%。历年省级平台数量增长情况如图2 所示,各省级平台(不含直辖市和港澳台)上线时间如表 1 所示。同时,报告还发现有 5 个省级平台在上线后又出现了无法访问的情况,包括甘肃、河南、青海、陕西与新疆。 ■ 表 1省级公共数据开放平台上线时间 截至 2025 年 7 月,各地已上线省级(不含直辖市和港澳台)公共数据开放平台的地理分布如图 3 所示,颜色越深,代表平台上线时间越早,整体上呈现出从东南部地区向中西部、东北部地区不断延伸扩散、相连成片的趋势。 自中国开放数林指数 2017 年首次发布以来的九年中,全国省级公共数据开放平台已蔚然成林。图 4 为 2017 年到 2025 年期间,省级地方(不含直辖市和港澳台)公共数据开放平台的地理空间分布情况。 截至 2025 年 7 月,全国各省域数据开放平台的整体上线情况如图 5和表 2 所示。省域包括省 ( 自治区 ) 本级和省内下辖城市,图中颜色越深,代表该省域数据开放平台的整体上线程度越高。目前,安徽、福建、广东、广西、贵州、黑龙江、湖北、江苏、江西、山东、四川与浙江共 12 个省域的省(自治区)本级和下辖所有地市都已上线了数据开放平台(图中显示为全境深绿色的省域)。 目前,我国 337 个城市(含直辖市、副省级与地级行政区)中已有231 个城市上线了公共数据开放平台,占总数的 69%,历年城市平台上线情况如图 6 所示,各城市平台上线时间如表 3 所示。同时,报告还发现有13 个城市平台在上线后又出现了无法访问的情况,包括巴中、常德、承德、衡水、淮安、兰州、陇南、内江、萍乡、乌鲁木齐、新余、永州和运城。 截至 2025 年 7 月,全国各地上线的城市公共数据开放平台的地区分布如图 7 所示,颜色越深,代表平台上线时间越早。目前,所有直辖市以及安徽、福建、广东、广西、贵州、黑龙江、湖北、江苏、江西、山东、四川与浙江共 12 个省域所有下辖城市都已上线了公共数据开放平台,形成我国最为密集的城市“开放数林”。同时,吉林、宁夏下辖的绝大多数城市也已上线了开放平台。然而,青海省内的所有城市以及海南、河南、辽宁、陕西、云南省内的绝大多数城市尚未上线公共数据开放平台。 自 2017 年中国开放数林指数首次发布以来的九年中,全国城市公共数据开放平台已蔚然成林。图 8 为 2017 年到 2025 年,地级以上城市(含直辖市)公共数据开放平台的地理空间分布情况。 自 2017 年中国开放数林指数首次发布以来,各地平台上开放的有效数据集总数逐年增长(如图 9 所示)。2017 年全国所有地方只开放了八千多个数据集,2025 年已增长到近 48 万个,是八年前的近 57 倍,复合年均增长率为 66%。 数据容量是指将一个地方平台中可下载的、结构化的、各个时间批次发布的数据集的字段数(列数)乘以条数(行数)后得出的数量,体现的是平台上开放的可下载数据集的数据量和颗粒度。2019 年以来,各地平台无条件开放的可下载数据集的容量从 2019 年的约 15 亿到 2025 年超 1907亿(如图 10 所示),六年间增长了 126 倍,复合年均增长率为 124%。 表 4 是省本级开放的容量最高、具有代表性的十大数据集,内容涉及生态环境相关污染源监测、市场主体基本信息与经营情况、天气、水利、停车等方面的全省数据。 表 5 是城市开放的容量最高、具有代表性的十大数据集,内容涉及公交、出租车、环卫车等类型车辆的实时位置信息,以及空气质量与水位监测、医保结算、特殊设备等方面的城市数据。 报告梳理了目前各地平台累计下载量最高的十类数据集的名称、下载数量与地方平台开放比例(见表 6),下载量最高的数据集是建设项目施工备案 / 许可 / 机构,公交站点、路线、时刻表,这两类数据集全国累计下载次数均超过 100 万次,其次是商品房、公租房、经济指标、饮用水卫生监测、空气质量等方面的数据集,全国下载量均超过 60 万。然而,目前这些数据集在地方平台开放的总体比例仍然偏低。 二、数林指数 2025 年度全国省域开放数林指数分值如表 7 所示。报告基于综合指数分值将各地的公共数据开放利用水平分为五个“开放数级”。浙江、山东综合表现最优,进入第一等级“五棵数”,获得“数开繁盛”大奖。贵州、福建与四川也总体表现优秀,进入第二等级“四棵数”,其次是广东、广西与湖北,进入第三等级“三棵数”。在四个单项维度上,浙江在保障层、数据层表现最优,山东在服务层、利用层上表现最优。湖北、山西进步显著,获得“数飞猛进”奖。 省域开放数林指数空间分布如图 11 所示,颜色越深代表综合指数分值越高。指数分值较高的地方主要集中在我国东南沿海和西南地区。 2025 年度全国城市开放数林的指数分值如表 8 所示。报告基于综合指数分值将各地的公共数据开放利用水平分为五个“开放数级”。杭州、济南、上海与德州综合表现最优,进入第一等级“五棵数”,获得“数开繁盛”大奖。济宁、日照、台州、滨州、潍坊与温州也表现优异,进入第二等级“四棵数”。其次是宁波、菏泽、泰安、东营、北京、淄博、烟台、青岛、丽水、枣庄、临沂与无锡,进入第三等级“三棵数”。杭州在保障层、服务层、数据层与利用层四个维度上均表现最优。宜昌与菏泽进步显著,获得“数飞猛进”奖。 城市开放数林指数空间分布如图 12 所示,颜色越深代表综合指数分值越高。指数分值较高的城市主要集中在东部沿海地区,中西部和华南地区也有部分城市指数分值较高。 四个直辖市开放数林指数分值和排名如表 9 所示。上海综合表现最优,位列第一,其次是北京、重庆和天津。 副省级开放数林指数排名前十的地方如表 10 所示。杭州综合表现最优,位列第一,济南和宁波也表现优秀。 地级开放数林指数排名前十的城市如表 11 所示。德州综合表现最优,位列第一;济宁、日照、台州、滨州、潍坊等地也表现优秀。 在各大区域中,排名领先的城市如表 12 所示。华北地区领先城市为北京,华东地区领先城市为杭州,华中地区领先城市为宜昌,华南地区领先城市为深圳,西南地区领先城市为达州,西北地区领先城市为银川,东北地区领先城市为哈尔滨。 “数林匹克”指数 报告进一步通过“数林匹克”累计分值,反映一个地方在过去四年(2022年 -2025 年)开放数据的持续水平。省域与城市“数林匹克”指数由 2022年到 2025 年这四年该省域与城市的年度开放数林综合指数的分值累加而成。 表 13 是 2022-2025 省域“数林匹克”累计分值排在前十名的地方,浙江分值最高,其次是山东、贵州和福建等省域。 表 14 是 2022-2025 城市“数林匹克”累计分值排在前二十名的地方,杭州分值最高,其次是德州、济南、日照、上海与温州等城市。 三、数林亮叶 浙江省的公共数据开放目录编制与质量管控规范 浙江省制定的《浙江省公共数据开放工作实施细则》明确了公共数据开放目录应当标明“数据名称、数源部门、数据开放属性、数据格式、数据类型、数据更新频率”等基本信息,强调了“数据应确保核心字段无缺失、关键信息无遗漏,数据与客观事实一致,真实可靠、无错误或虚假信息”,为公共数据开放工作中的公共数据目录编制提供政策支撑,如图 13 所示。 上海市的样本数据建设规范 上海市制定的《上海市公共数据开放实施细则》提出“在有条件开放类数据集的基础上建设高质量样本数据集,自然人、法人和非法人组织无需申请即可获取。”,有利于数据利用主体在申请高质量数据集前能对其有更多了解,如图 14 所示。 杭州市与潍坊市的公共数据开放下架规范 杭州市制定的规范性文件《杭州市公共数据开放工作实施细则》明确了开放数据下架规范,强调“公共数据开放主体不得随意下架已发布的开放目录”,如图 15 所示。潍坊市出台的《潍坊市公共数据开放工作细则》提出“公共数据开放主体不得随意下架已开放的数据。确因政策调整等不宜再开放的,按照第十条要求进行开放属性变更,下架结果应通过开放网公示,并同步通知申请该开放数据的公共数据利用主体”。这些开放数据下架的规范与流程为公共数据的持续性开放了提供法规政策保障,如图 16所示。 台州市、绍兴市、济宁市、日照市、菏泽市、宜昌市的年度数据开放清单有效落地 台州市、绍兴市、济宁市、日照市、菏泽市与宜昌市等多个城市于2024 年制定的公共数据开放清单已在 2025 年全部落实开放,体现了对年度数据开放清单承诺的重视与兑现。优质的年度公共数据开放清单有利于公共数据开放工作有序持续地推进。 广东省平台提前公示准备下架的数据 广东省平台对准备下架的数据集提前 7 天进行了公示,并提供了下架的原因,便于用户及时知晓,如图 17 所示。 山东省平台借助大模型提供了“资源检索小助手” 山东省平台提供了数据资源检索助手,用户只需使用自然语言提出自己的需求,平台便能借助大语言模型匹配含有相关内容的数据集,并推荐给用户,降低了数据资源查找的难度,减少了单一关键词检索可能导致的偏差,如图 18 所示。 浙江省与山东省开放的优质 API 接口 在省域中,浙江省与山东省以无条件形式开放了相对较多的优质 API接口,如表 15 所示。这些接口的数据容量较高且能够每日更新,内容主要涉及天气、空气、水质监测等方面。 杭州市与台州市开放的优质 API 接口 在城市中,杭州市与台州市以无条件形式开放了相对较多的优质 API接口,如表 16 所示。这些接口的数据容量较高且能够每日更新,内容主要涉及天气、停车、公交、水位监测、客流感知等方面。 上海市平台无条件开放了用于 AI 训练、经过标注的政策文本语料 上海市平台以无条件形式开放了各类政策语料库,包含宪法法律、法律法规、地方性法规等多种类型,且这些语料文本标注了多种实体信息(如创建时间、标题、正文、发布机构等),如图 19 所示,能够帮助机器更好地理解与利用,用于人工智能训练。 广东省平台提供了详细的数据摘要信息 广东省平台提供的数据摘要内容详细,包含数据记录的时间范围、与数据采集相关的职能、内容字段以及政策依据等信息,如图 20 所示,能帮助用户更全面地了解数据的背景信息。 浙江省、德州市为部分开放数据提供了详细的数据字典 浙江省与德州市为部分开放数据提供了优质的数据字典。浙江省受限开放的停车场设施信息,在数据字典中对每个字段及其相关内容进行了详细描述,如图 21 所示;德州市无条件开放的企业登记信息,在数据字典中详细描述了企业(