您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[开放树林&复旦智库]:2021上半年中国地方政府数据开放报告(指标体系与省域标杆) - 发现报告
当前位置:首页/行业研究/报告详情/

2021上半年中国地方政府数据开放报告(指标体系与省域标杆)

房地产2021-07-10复旦智库开放树林&复旦智库孙***
2021上半年中国地方政府数据开放报告(指标体系与省域标杆)

1 001 001引言 ■ 评估方法■ 数林概貌■ 数林标杆 附录 001004014020022 002引言 001引言“中国开放数林指数”是我国首个专注于评估政府数据开放水平的专业指数,由复旦大学数字与移动治理实验室制作出品。开放数据,蔚然成林,“开放数林”意喻我国政府数据开放利用的生态体系,一棵棵地方开放“数木”由最初的丛然并生、成荫如盖,直至枝繁叶茂、花开结果,终将成长为一片繁盛多样、枝杈相连、持续循环的中国“开放数林”。“中国开放数林指数”自2017年5月首次发布以来,每半年发布一次,定期对我国地方政府数据开放水平进行综合评价,精心测量各地“开放数木”的繁茂程度和果实价值,助推我国政府数据开放生态体系的建设与发展。2018年以来,“中国开放数林指数”为国家互联网信息办公室信息化发展局监测我国公共信息资源开放情况提供数据支撑。 0022021年起,指数制作方将原来的“省级”指数调整为“省域”指数,从而将省作为一个“区域”,而不仅仅是一个“层级”来进行评测,并发布《中国地方政府数据开放报告——指标体系与省域标杆》(以下简称《报告》)。 003评估方法 0041.1 评估对象:从“省级”到“省域”随着中国开放数林的不断生长,今年的评估方法和指标体系又作出了新的调整。2021年起,中国开放数林指数将原来的评估对象“省级”调整为“省域”,主要出于以下考量:原来的评估对象“省级”更多将省作为一个“层级”来进行评测,“省级”主要是指“省本级”,包括省直属部门和机构。然而,省和自治区不仅仅是一个层级,更是一个“区域”,省和自治区政府在数据开放工作上的职责不仅限于省本级,还包括对省内下辖地市的赋能、规范和协调作用,例如制定省级法规和标准,统筹推进省内下辖地市开放优质数据集,促进省市平台间的互联互通,组织全省性的数据利用促进活动等。因此,从本期《报告》开始,开放数林指数将把“省域”(含省和自治区)作为一个整体来进行评估,并注重省市两级在数据开放上的协同性和互通性。根据公开报道,以及使用“数据+开放”“数据+公开”“公共+数据”“政务+数据”“政府+数据”“地名+数据”“地名+政府数据”“地名+开放数据”等关键词进行搜索,发现了截至 2021年4月我国已上线的地方政府数据开放平台,并从中筛选出符合以下条件的平台:1、原则上平台域名中需出现gov.cn,作为确定其为政府官方数据开放平台的依据。2、平台由行政级别为地级以上的地方政府建设和运营(不包括港澳台)。一、 评估方法 005■ 表1 评估范围(按拼音首字母排序)3、开放形式为开设专门、统一的地方数据开放平台,或是在政府官网上开设专门栏目进行集中开放,由条线部门建设的开放数据平台不在评估范围内。本次评估中,共发现符合以上条件的省域18个,具体省域、省本级平台名称和平台链接如表1所示。2021年上半年《报告》从全国选择了省级及下辖地市基本都已上线了数据开放平台的省域作为标杆对象进行评估,以供其他省域对标借鉴。截至2021年4月,我国共有广东省、广西壮族自治区、山东省、四川省与浙江省五个省域符合以上标准。 0061.2 评估指标体系1.2.1 评估指标体系构成开放数林指数邀请国内外政界、学术界、产业界七十余位专家共同参与,组成“中国开放数林指数”评估专家委员会,以体现跨界、多学科、第三方的专业视角。专家委员会基于数据开放的基本理念和原则,借鉴国际数据开放评估指标体系的经验,立足我国政府数据开放的政策要求与地方实践,构建起一个系统、科学、可操作的地方政府数据开放评估指标体系,并为每项指标分配了权重(见图1)。■ 图1 开放数林指数评估指标体系的构建方法 007评估指标体系共包括准备度、平台层、数据层、利用层四个维度及下属多级指标(见图2):准备度是“数根”,是数据开放的基础,包括法规政策效力与内容、标准规范、组织与领导等三个一级指标。平台层是“数干”,是数据开放的枢纽,包括平台关系、发现预览、数据获取、成果提交展示、互动反馈、用户体验等六个一级指标。数据层是“数叶”,是数据开放的核心,包括数据数量、数据质量、数据规范、开放范围等四个一级指标。利用层是“数果”,是数据开放的成效,包括利用促进、利用多样性、有效成果数量、成果质量等四个一级指标。 008■ 图2 2021中国开放数林指数评估指标体系(省域) 009利用层数据层平台层准备度 0101.2.2 评估指标主要调整内容■ 整体:省域评估指标体系将准备度权重设为20%,并更强调省级政府对下辖地市数据开放工作的赋能、规范和协调作用。指标体系将数据层权重设为38%,利用层权重设为22%,以强调政府数据不仅应向社会开放,还需要在开放之后被社会充分利用。最后,将平台层的权重设为20%,以体现平台作为数据供需对接枢纽的作用。■准备度:提高了“标准规范”的权重,以鼓励由省级政府制定全省统一的数据标准和平台标准;新增了对标准规范等级的评估,细化了对标准规范内容的评估;新增了相应指标以强调建立跨部门统筹管理机制、明确数据开放主管部门的职责、以及制定详细的当年度数据开放工作计划与任务部署的重要性。■平台层:新增“平台关系”指标,对“省域整体性”和“区域协同性”进行评估,以鼓励省域内的平台既能实现互联互通,又能保持地市特色,并促成平台间的跨区域协同;取消或降低了部分功能设置类指标,以更加突出平台帮助用户有效获取和利用数据的核心作用;在“互动反馈”下新增“权益申诉”指标,以体现对公众和第三方权益保护的重视;在“用户体验”下新增“账号互通性”指标,以鼓励实现省域内用户账号体系的互通。■数据层:在统计省域有效数据集总数、数据容量和优质数据集数量时,将省内下辖地市所开放的数据集也折算记入省域总分,以反映省级政府对下辖地市数据开放工作的赋能效果。在数据数量下新增“单个数据集平均容量”指标,以引导各省既要提升数据总容量,也要提升单个数据集容量;在数据质量下新增“高整合度数据集”指标,以鼓励省级政府整合省域内各地市内容相同或相近的数据集,以减少数据碎片化;同时,还在数据质 011■利用层:新增了相应指标以强调省域内多个近似比赛之间的协同,以及在举办大赛之外组织常态化、多样化、专门性的利用促进活动的重要性;在有效成果的评价中,将省内下辖地市产出的有效利用成果也计入省域有效成果数量;除评价有效成果数量外,新增“成果有效率”和“优质成果”指标,以评估利用开放数据开发的成果是否真正有效和有用;新增“创新方案质量”指标,以评测各地开放数据比赛产出成果的质量。1.3 数据采集与分析方法准备度评估主要对相关法律法规、政策、年度计划与工作方案、标准规范、新闻报道等资料进行了描述性统计分析和文本分析。搜索方法主要包括以下两种:一是在搜索引擎以关键词检索相关法规与政策文本、标准规范、年度工作计划、地方党政领导讲话的新闻报道以及数据开放主管部门的信息;二是在地方政府门户网站以及政府数据开放平台上通过人工观察和关键词检索采集数据。数据采集截止时间为2021年5月。平台层评估主要采用人工观察法对各地方政府数据平台上各项功能进行观测并做描述性统计分析,数据采集截止时间为2021年5月。同时,还对平台的回复时效和回复质量进行了评估,回复情况采集截止时间为2021年5月。数据层评估主要通过机器自动抓取和处理各地公共数据开放平台上开放的数据,结合人工观察采集相关信息,然后对数据进行了描述性统计分析、量下新增“优质数据集持续供给”指标,以强调优质数据集的持续供给,防止供给中断;在数据规范下新增“数据项一致性”指标,以强调内容相同的数据集在数据项上的一致性。 012利用层评估主要对各地公共数据开放平台上展示的利用成果进行了人工观察和测试,对2019年以来各地开展的开放数据创新利用比赛信息进行了网络检索,并对采集到的数据进行了描述性统计分析。数据采集截止时间为2021年5月。此外,为确保采集信息准确,避免遗漏,部分指标采取报告制作方自主采集和向各地征集相结合的方式。各地征集结果经过报告制作方验证后纳入数据范围。1.4 指数计算方法指数制作方基于各地在各项评估指标上的实际表现从低到高按照0-5分共6档分值进行评分,其中5分为最高分,相应数据缺失或完全不符合标准则分值为0。对于连续型统计数值类数据则使用极差归一法将各地统计数据结果换算为0-5分之间的数值作为该项得分。各地平台在准备度、平台层、数据层、利用层四个维度上的指数总分等于每个单项指标的分值乘以相应权重所得到的加权总和。最终,各地开放数林指数等于准备度指数、平台层指数、数据层指数、利用层指数乘以相应权重的加权平均分。省域开放数林指数计算公式如下:省域开放数林指数交叉分析、文本分析和空间分析。数据采集截止时间为2021年5月,对“动态更新”这一指标的评测时段为2021年1月至2021年5月。 013数林概貌 014二、数林概貌截至2021年4月底,我国已有174个省级和城市的地方政府上线了数据开放平台,其中省级平台18个(含省和自治区,不包括直辖市和港澳台),城市平台156个(含直辖市、副省级与地级行政区)。与2020年下半年相比,新增32个地方平台,其中包含1个省级平台和31个城市平台。如图3所示,全国地级及以上政府数据开放平台数量增长显著,从2017年的20个到2021上半年的174个,"开放数据,蔚然成林"的愿景已初步实现。■ 图3 历年地级及以上平台数量增长情况 015目前,我国64.29%的省级(不含直辖市)政府已上线了政府数据开放平台。如图4所示,自2015年浙江省上线了我国第一个省级(不含直辖市)平台以来,省级平台数量逐年增长,目前已达到18个。■ 图4 历年省级(不含直辖市)平台上线情况 016截至2021年4月,全国各地上线的省级(不含直辖市)政府数据开放平台的地区分布如图5所示,颜色越深,代表平台上线时间越早,整体上呈现出从东南部地区向中西部地区不断延伸扩散的趋势。■ 图5 省级(不含直辖市)平台上线时间的地理空间分布 017截至2021年4月,全国省域数据开放平台的整体上线情况如图6所示,省域数据开放平台包括省(自治区)本级和省内下辖地市的平台,图中颜色越深,代表该省域数据开放平台的整体上线程度越高。目前,只有广东省、广西壮族自治区、山东省、四川省与浙江省的省(自治区)本级和下辖绝大部分地市都已上线了数据开放平台(图中显示为全境深绿色或基本深绿色的省域)。同时,安徽省内已有相当部分的下辖地市上线了数据开放平台,但省本级平台尚未上线;而福建省、河北省、河南省、湖南省和陕西省虽已上线了省本级平台,但省内绝大多数地市却尚未上线平台。从整体上看,东南沿海省域的政府数据平台已经基本相连成片。然而,目前全国仍有吉林、辽宁和云南3个省的省本级和下辖地市均未上线数据开放平台(图中显示为全境灰色的省域)。■ 图6 省域平台整体上线情况地理空间分布 018图7是省域数据容量前十的地方,反映了省域有效数据集总数和数据容量之间的关系。山东省的省域数据容量和省域有效数据集总数最高,浙江省和广东省的省域数据容量仅次于山东省,其次是贵州省、四川省等地。数据容量更能反映一个省域的数据开放总量,从图中可见,虽然有些省域的数据集总数并不大,但数据容量却远高于其他省域;而有些省域的数据集总数虽然较大,但数据容量相对于其他省域却并不占优势。■ 图7 省域数据容量和有效数据集总数(前十名) 019数林标杆 020三、数林标杆■ 表2 中国开放数林标杆省域(前五名)2021上半年全国开放数林标杆省域的指数分值、排名和等级如表2所示。在这五个标杆省域中,浙江省的综合表现最优,进入第一等级“五棵树”;山东省表现优异,进入第二等级“四棵树”,其次是四川省、广东省和广西壮族自治区。 021附录 022指数制作团队报告校对组观察员郑磊、刘新萍、张忻璐、吕文增、华蕊、张宏、侯铖铖纪昌秀、王翔、毛天慧、韩笑、马李滨蔡伊南、常媛媛、董万怡梦、段晓耀、冯妍、管莹、胡海琛、黄思雅、嵇江夏、姜怀舒、蒋佳钰、景宇欣、李佳欣、李慧瑜、李行行、卢一鸣、莫

你可能感兴趣

hot

中国地方政府数据开放报告:指标体系与城市标杆

房地产
中国开放森林指数&复旦智库2021-11-27