城市数据空间CDS白皮书 编 写 单 位上海数据集团有限公司华为云计算技术有限公司 编制委员会上海数据集团有限公司:朱宗尧 李小山 傅行晓 高晓丽 周强 夏佳斌华为云计算技术有限公司:尚海峰 胡玉海 马运 徐俊 悦怡 王飞刘鹏宇 方芳 滕奉涛 高卓 张志刚 季亮朱杰 陈勇 郭奕浩 郑辉 宋晔志鹏殷润悦 前言F O R E W O R D 今世界,新一轮科技革命和产业变革深入发展、加速演进、裂变创新,开辟了人类生产生活新空间,拓展了社会治理的新疆域。近几年,以土地生产要素为主的城市经济增长动力逐步减弱,而数据成为继土地、劳动力、资本、技术之后的“第五个关键生产要素”,日益成为经济发展的新引擎。数据要素正在驱动构建数字敏捷型经济形态,重建模型化知识产品,重塑市场化信任规则,重构生态化共治规制。工业经济筑造了城市空间,数字经济将开创数据空间。像城市空间一样,数据空间要围绕数据要素高效合规流通,探索构建新生产关系,创造新权属、新信任、新规则、新基础设施、新模式。当 长期以来,我国政府高度重视发展数字经济,将其上升为国家战略,提出加快建设数字中国,率先探索数字化转型之路。数据要素流通是培育数据要素市场的基本前提,是推动数字经济发展的必然要求和核心引擎,是促进数字政府持续长效运营、激活政府公共数据的社会化价值和市场化潜力重要手段。2023年10月,国家数据局正式挂牌掀开了我国数据要素市场化的序幕,进一步加快统筹全国统一的数据大市场建设。 上海数据集团有限公司和华为技术有限公司联合编制本白皮书,在业内首次发布城市数据空间CDS(City Data Spaces)理念,利用各自在数据要素领域积累的经验,取长补短,在洞察分析国外数据空间和国内数据要素发展现状基础上,提出城市数据空间的“2+1+1”的架构体系顶设,即制度和组织2个保障参考体系、1个基础设施、1个数据生态,并且在基础设施中进一步提出,构建城市数据空间基础设施的“1+4+2”统一基础架构,即1个城市数据底座,4个数据分层(数据资源、数据治理、数据资产和数据交易),以及2个治理框架(安全可信和合规可控),旨在鼓励行业内外各单位共同探讨,并推动在行业中形成统一的认知。 目录D I R E C T O R Y 城市数据空间顶设与模式 国内外现状与主要挑战 1.1 国外数据空间现状1.2 国内数据要素现状1.3 国内主要挑战 2.1 城市数据空间的内涵 2.2 城市数据空间的体系架构 2.3 城市数据空间的制度参考体系 2.4 城市数据空间的组织参考体系 2.5 城市数据空间的基础设施架构 2.6 城市数据空间的数据生态 最佳实践案例 发展与展望 3.1 上海数据集团城市数据空间实践3.2 某医疗集团数据可信流通探索实践3.3 华为产业数据空间探索实践 国内外现状与主要挑战 共管理、技能)。其中,数据空间作为核心概念,进一步拉动欧洲对安全、高效和可信的云基础设施投资建设。 1.1 国外数据空间现状 1、欧洲数据战略 欧洲长期存在数据挑战,依赖于谷歌、亚马逊、Facebook等提供的数字应用和服务,同时欧洲的云计算、人工智能、5G通信等关键基础技术发展也相对落后。在此背景下,欧洲已意识到其在数字经济所处的被动局面,于2020年2月发布《塑造欧洲数字未来》的数据战略,并陆续出台了《通用数据保护条例》、《数字市场法》、《数字服务法》等一系列政策和法律框架,致力于构建欧洲“数字主权”,增强数字创新能力。 2、IDS数据空间 IDS(International Data Spaces)是在欧洲数据战略下的最佳实践,是基于工业4.0下发展的子项目,随着更多的国家和组织参与进来,该项目上升为欧盟资助的重点项目。IDSA(Inter-national Data Spaces Association)协会已发展成员130多个,其中以欧洲企业为主,也包括微软、IBM等美国企业,以及华为、海尔和信通院等中国企业和机构。 欧洲数据战略提出四大核心措施:加强数据全周期治理、加大数据基础设施投资、赋能个人和中小企业,以及构建九大领域数据空间建设(制造、环保、移动、卫生、金融、能源、农业、公 IDS核心理念是欧洲的价值观和数据主权,即数据隐私保护和安全,提倡机会均等,确保数据创建者的数据主权和参与者之间的信任。通过IDS 数据空间,欧洲致力于建设一个以用户为中心,独立于供应商的数据生态系统和市场,以低成本和低门槛方式向所有人开放,促进数据供需双方的连接。 3、IDS与GAIA-X组合 2020年欧洲发布《欧洲数字主权》报告,明确建设欧洲的下一代数字基础设施,建立数字主权的最高标准。由德国和法国联合倡议GAIA-X计划启动,GAIA-X遵循《欧洲数据战略》要求,致力于实现跨行业共享,避免数据孤岛,打造安全可靠的数据基础设施,培育开放的数据生态系统,以推动欧洲经济增长和创新。 IDS数据空间参考架构定义了一个去中心化的数据 生 态 系 统 , 数 据 提 供 者 和 消 费 者 之 间 通 过Connector(可信连接器)进行数据的共享交换,连同Identity Provider(认证服务)、Broker(数据交易监管服务),Clearing House(结算服务),APP Store(应用商店服务)一起构成了完整的数据空间系统。IDS实现数据主权的核心技术是“使用控制”,数据供需双方配置相应的数据控制策略后,由Connector(可信连接器)负责执行,将数据的控制策略转化为形式化语言,与数据内容一起流转到对端并执行控制。 GAIA-X生态系统架构分为两个部分:数据生态系统和基础设施生态系统。两者构成了一个不可割裂的整体。联接两个生态系统的关键服务是联合服务,由身份与信任、合规、主权数据交换以及联合目录四个部分组成。 G A I A - X 和 I D S 形 成 一 个 完 整 的 组 合 架 构 ,GAIA-X专注于主权云服务和云基础设施,而IDS 专注于数据和数据主权。GAIA-X和IDS相互补充和联合,以保护整个生态系统中端到端数据价值链的数据主权。 活的数据控制工具、数据可信连接器等,确保了欧洲数据战略的落地,也促进了IDS数据空间的推广,已成为广泛接受的产业标准。 1.2 国内数据要素现状 4、欧洲模式主要特点 IDS数据空间的核心理念是保护欧洲的数据主权,欧洲发布多部法律法规为数据保驾护航。 国内数据要素发展经历了预热阶段、起步阶段、落地阶段,已进入深化阶段。 基于统一的基础架构(GAIA-X+IDS),以及去中心化的数据交换模式,降低了使用成本和门槛,提升了中小企业的广泛参与。 1、国内数据要素政策进入体系化深化阶段 2014年大数据首次写入政府工作报告以来,数据与实体经济不断融合加深,数字产业、数字应用等都飞速发展。2019年,十九届四中全会首次将数据列为新型生产要素,数据要素市场配置上升为国家战略,一批批《关于构建更加完善的数据要素市场化配置体制机制的意见》、《“十四五”数字经济发展规划》、《关于构建数据基础制度更好发挥数据要素作用的意见》等文件相继出台,数据要素政策体系架构初步形成,已进入体系化深化阶段。 集中力量构建九大领域数据空间建设,为推进数据高效流通使用、赋能实体经济,提供了丰富的最佳实践。 从技术到标准体系,全流程保障数据的安全可信,以及数据空间之间的平等互信、互操作性。 工欲善其事,必先利其器。通过开发多种便捷灵 上海围绕“经济、生活、治理”三大领域,全面推进城市数字化转型,深入贯彻网络强国、数字中国、智慧社会战略部署,落实党中央、国务院决策部署,践行“人民城市人民建,人民城市为人民”重要理念,按照《上海市数据条例》和中共上海市委、上海市政府《关于全面推进上海城市数字化转型的意见》《上海市促进城市数字化转型的若干政策措施》等文件精神,加快实现超大城市治理体系和治理能力现代化。 2、“数据二十条”为推动数据要素发展筑牢政策基础 2022年12月,国家“数据二十条”发布,明确了数据基础制度体系的基本架构,提出建立保障权益、合规使用的数据产权制度,建立合规高效、场内外结合的数据要素流通和交易制度,建立体现效率、促进公平的数据要素收益分配制度,建立安全可控、弹性包容的数据要素治理制度。在“数据二十条”的指导下各地各部门不断完善相关制度体系和配套政策,制定相关细则。 1.3 国内主要挑战 3、数据局组建推动数据要素统筹管理和协调发展 缺数据,高价值数据更缺,数据入场难 2023年初《党和国家机构改革方案》提出组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等工作。国家数据局的组建有利于破除“九龙治水”的数据治理环境,平衡数据要素安全和发展的辩证关系,从而进一步推动数据要素的统筹规划,推进多层次数据要素市场建设。 对政府公共数据来说,国家层面还没有明确公共数据的开放范围,有些数据不能给;有些数据质量参差不齐,担心使用后承担风险,数据不敢给。同时,有些数据维护政府需要投入经费保障,额外带来较大工作量,数据不想给。对于企业数据来说,政府行业部门缺少指导,担心合规风险,数据不能给;没有安全交易渠道,担心数据泄露和扩散,数据不愿给。对于个人数据,缺少相关法律政策指导,隐私数据不敢用。有些稀缺数据,数据资源来源垄断, 4、上海进一步明确加快构筑数据要素体系重点工作 缺少可替代方案。总体上,国内市场不仅缺少数据,更缺少高价值数据,以及相关的数据供需方的利益保障机制。 缺治理,高质量数据更缺,闭环监管难 数据要素缺少有效治理,有些数据入市后缺乏可靠的质量保障措施,无法快速响应新场景和新需求。数据要素的高效流通依赖于数据的高质量供给,而系统化的数据治理是高质量数据的必要保障,当前我们治理能力和水平参差不齐,基本还处在数据规范的可管可控阶段,缺少在数据安全保障、数据分类分级、数据融合加工、数据分析应用、数据质量提升、数据产品开发等方面的深化治理,缺少数据治理的标准要求和考核体系,缺少数据质量的监管、跟踪、反馈、完善的闭环机制,缺少税收、法律等配套体系的建立,形成完整的监管服务流程。 与主体多元化、使用场景多样化,使得数据要素权益保障变得复杂。数据供需双方在数据使用上,缺少工具来落实公共数据、企业数据和个人数据的不同权益保障,以及不同权益下的数据使用策略,包括数据的使用时间、访问权限 、 使 用 频 次 等 。 工 具 的 安 全 性 和 操 作 便 捷性,将大幅度降低用户进入市场的门槛,促进数据要素市场的用户参与规模。 缺标准,实施细则待探索,供需互信难 目前多个省市已发布《数据条例》,以地方性立 法 的 形 式 明 确 开 展 公 共 数 据 授 权 运 营 , 如《北京市公共数据专区授权运营管理办法》、《浙江省公共数据授权运营管理办法》等,但国 家 层 面 暂 时 没 有 “ 公 共 数 据 ” 、 “ 企 业 数据”和“个人数据”的细则规定或指导意见,在数据要素市场供需双方互信不足,落地过程中涉及的法律、税收等诸多细则还有待探索和实践,导致各地实施的方案流派不同,比如公共数据,有的地方纳入政务平台的数据开放体系,与政务数据共平台运营;有的地方单独建设数据开放体系,政务数据只是其中一种数据资源来源,各种落地方式不同。 缺生态,生态环境待培育,创新驱动难 在数据开发方面,手中掌握一定规模数据的企业,并具备开发能力的各类“数商”,各自占山为王,生态封闭。在数据消费方面,政府与企业在数字化转型中,有大量的ToB、ToC应用场景,但缺少对数据业务创新的动力,偏好零风险的成功实践。在人才供给上,高校科研机构,因缺少仿真“数据要素实训环境”,数据类人才供给缓慢,创新人才不足。总体上,缺少生态培育土壤、场景创新机制,需要数据提供方、场景应用方、数据监管方、技术服务方以及法律合规机构等共同积极参与,稳步构建覆盖数据