您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[可信数据空间发展联盟]:可信数据空间建设及应用参考指南1.0 - 发现报告

可信数据空间建设及应用参考指南1.0

AI智能总结
查看更多
可信数据空间建设及应用参考指南1.0

声明 本报告所载的材料和信息,包括但不限于文本、图片、数据、观点、建议,不构成法律建议,也不应替代律师意见。本报告所有材料或内容的知识产权归可信数据空间发展联盟所有(注明是引自其他方的内容除外),并受法律保护。如需转载,需联系本联盟并获得授权许可。未经授权许可,任何人不得将报告的全部或部分内容以发布、转载、汇编、转让、出售等方式使用,不得将报告的全部或部分内容通过网络方式传播,不得在任何公开场合使用报告内相关描述及相关数据图表。违反上述声明者,本联盟将追究其相关法律责任。 可信数据空间发展联盟 目录 一、目标及原则..................................................................1 (一)建设目标................................................................1(二)建设原则................................................................2 二、建设内容.....................................................................2 (一)明确建设定位........................................................3(二)挖掘场景应用........................................................4(三)开发数据资源........................................................6(四)构建规则机制........................................................7(五)建设技术系统........................................................9(六)繁荣空间生态......................................................11(七)开展商业运营......................................................11 三、保障措施...................................................................11 (一)组织保障..............................................................11(二)资金投入..............................................................12(三)人员保障..............................................................12(四)安全保障..............................................................12 可信数据空间是基于共识规则,联接多方主体,实现数据资源共享共用的一种数据流通利用基础设施,是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体。为贯彻落实国家数据局《可信数据空间发展行动计划(2024—2028年)》,指导产业界健康有序开展可信数据空间建设及应用,特组织制定本指南。 一、目标及原则 (一)建设目标 可信数据空间建设需以业务场景为牵引,通过建设统一的规则机制和安全可靠的技术系统,促进数据提供方、使用方、数据服务方等生态主体汇聚,推动数据资源的规模化流通利用,释放数据要素价值。具体目标体现为四方面: 一是形成一批高价值场景应用。可信数据空间各主体在共性需求牵引和共识规则带动下,发挥协同优势开发数据产品和服务,实现多方价值共创,推动数据资源规模共享流通应用,形成一批适用范围广、复制推广性强的数据应用场景,深度释放数据要素价值。 二是建立一套完善的规则机制。基于多方主体共识建立完善的规则机制体系,包括但不限于数据资源接入审核、互联互通、共享利用、收益分配等规则机制,在合理的规则机制配合下促进数据空间可持续发展。 三是开发一套可信的技术系统。通过构建中间服务平台、客户端和自动化履约组件等软件系统,打造分布式的数据管 控体系,叠加标识解析、区块链等成熟技术产品,支撑数据空间可信管控、资源交互、价值共创三大能力实现。 四是建成一个繁荣的数据生态。支持数据提供方、数据使用方、数据服务方(数据经纪、托管、开发等)多元主体协同创新,强化与数据接入认证、审计仲裁等第三方服务机构协同合作,实现多元主体间数据共享共用共治。 (二)建设原则 坚持应用牵引、规则驱动。从实际应用需求出发,深入挖掘存量业务痛点和增量创新应用,通过设计符合多主体共同利益诉求的规则机制,吸引各参与方接入并应用数据空间,构建公平透明、高效有序的数据流通应用环境。 坚持市场主体、多方共赢。充分发挥龙头企业、链主企业、地方数据集团、数据富集型企业等市场主体在空间建设应用中的能动性,积极探索数据提供方、使用方、数据服务方等多元主体的合作模式,形成共建共享、合作共赢的可信数据空间建设发展模式。 坚持建设为基、运营为主。强化可信数据空间可信规则和运营模式设计,注重可持续商业机制建设,通过数据价值挖掘实现长效发展。在规则机制牵引下,考虑建设数据流通全环节信任技术系统,开发部署应用需求牵引下的数据流通支撑环境和服务组件。 二、建设内容 推进可信数据空间建设可遵循明确建设定位、挖掘场景 应用、开发数据资源、构建规则机制、建设技术系统、繁荣空间生态、开展商业运营七大步骤,参考路线图如下。 (一)明确建设定位 1.明确战略方向。明确可信数据空间发展定位,设定清晰的建设目标。由于可信数据空间核心特征在于数据跨主体、跨区域、跨行业的共享流通,不同空间难以完全切割或区分,并且会存在某类空间在发展过程中演化为其他类可信数据空间的情况。因此,在战略方向上要充分结合数据资源流通利用的短期业务需求以及长期规划,综合考虑产业主体角色、业务发展需求、数据资源基础、现有技术设施等多方面的情况,确定可信数据空间的建设类型。在此基础上,进一步开展投入产出分析,明确长期发展目标,确保资源有效配置和经济效益最大化。 (二)挖掘场景应用 2.确定应用场景。梳理存量业务发展过程中数据流通面临的卡点堵点,找出需要通过数据空间破解流通难题的应用场景。同时,结合未来发展需求挖掘一批多源数据融合的增量创新场景,研究制定场景应用清单和图谱。 3.制定应用场景路线图。综合考虑业务场景需求的紧迫程度、应用价值、建设难度、现有基础,对场景落地应用顺序进行综合排序,构建起应用场景建设实施的总体路线图,明确每个关键业务场景的建设目标、建设周期与预期成效。 【专栏1汽车数据空间应用场景设计实例】 当前,我国已成为全球新能源汽车及动力电池产品出口大国,为加强我国电池全产业链上下游企业协同发展,同时应对电池产品合规出口,亟需打通整车企业、电池制造商、电池原材料供应商等全产业链数据,但由于企业数据涉及到供应商信息、电池原材料等企业的高价值数据,在数据交换过程中难以保证数据安全和数据主权,企业提供数据的主观意愿较低。为解决这一问题,可以通过联合龙头企业以及汽车行业协会等主体,构建可信数据空间技术系统,消除各方主体数据开放顾虑,建设汽车可信数据空间,打造碳排放核算、产品数字护照、企业ESG披露、能碳协同、绿色金融服务等行业应用场景,实现多方价值共创与合作共赢。 (一)碳排放核算 碳排放计算需要收集能源消耗、使用材料、运输等各类数据,但由于主体众多且跨交通、能源、汽车、材料等各个行业,传统强制要求数据报送的模式难以实现,同时数据本身涉及企业的知识产权、商业秘密等高价值信息,因此各主体也不愿意共享数据。可以通过规划建设汽车可信数据空间,统一数据开放流通标准,强化数据可信管控,推动电池、钢铁、物流等各类企业接入,实现各企业碳排放量计算,以数据要素赋能汽车行业节能减排与绿色转型。 (二)电池产品数字护照 欧盟电池法、数字产品护照等都对电池数据公开提出要求,可以推动电池材料、电池生产制造、物流、电池拆解回收等领域龙头企业联合规划建设汽车数据空间,并制定统一的数字产品护照数据标准,以此推动汽车制造相关厂商接入空间并按照标准共享流通数据,实现电池产品信息、回收拆解、可持续性、制造商和供应商、警示标识、动态信息等数据可控共享流通,实现电池产品数字护照生成和流通。同时不断吸纳检测机构、审核认证机构、主管部门等生态主体,开展数据真实性审核认证,提升数据可信水平。 (三)开发数据资源 4.明确数据接入主体。剖析目标应用场景所需的数据资源类型,明确不同数据资源所需要接入的主体,构建起数据接入主体的对象清单。 5.制定数据资源清单。结合应用场景和接入主体,建立不同接入主体的详细数据清单。清单应包括数据项的名称、内容描述、数据类型、数据格式、数据来源、数据更新频率等信息。同时为每类数据设计适配的接入方式,如实时数据推送、定时批量上传、数据接口调用等。 6.推动数据标准化与资源化。规范数据语义,为数据赋予统一明确、符合业务逻辑的数据描述,避免名称混乱和歧义,使数据使用者能够准确理解数据的含义、来源、用途以及相关业务规则,提升数据发布发现与共享流通效率。 【专栏2语料数据空间数据资源开发实例】 当前,人工智能飞速发展,但数据供给不足导致的模型训练不充分问题突出,核心原因是语料数据在流通交易过程中可能存在转存转售、滥用的情况,导致语料数据拥有方不愿供给高质量语料数据,阻碍人工智能大模型的创新。针对语料安全可控供给场景,可以通过规划建设大模型开发数据空间,推动大模型开发者、语料数据拥有者接入并开展供需对接,实现大模型开发。在明确接入主体方面,应接入包括拥有高质量语料数据集的主体、拥有语料处理技术工具的主体、模型训练者等主体。制定数据资源清单方面,以问答类大模型开发细分场景为例,接入数据清单应通过数据标注明确字段名称、数据格式、数据来源。数据标准化方面,通过构建统一元数据表达方式,保障了接入语料的质量,有力推进人工智能大模型训练开发。 (四)构建规则机制 7.建立资源接入审核规范。对数据空间接入的主体、数据资源、产品或服务、技术组件等资源进行全面认证。主体接入认证主要确保空间中各方主体的身份真实且安全可信;数据资源接入认证主要确保数据来源可信、数据真实可用;产品服务接入认证主要确保空间内的数据产品和服务与空间技术系统能够兼容适配,同时防止产品或服务出现违规、安全等问题;技术组件接入认证主要确保各技术组件满足可信数据空间安全性、互操作性、扩展性等要求。 8.建立数据互联互通标准。构建统一的数据标识、数据 目录、数据接口标准,为数据提供方、使用方提供统一的数据资源命名方式,通过数据资源的标准化命名,提升数据资源发布发现效率,促进数据规模化共享流通。 9.建立共享利用管控规范。制定空间各参与方开展数据共享利用等活动的规范,对各方在供需对接、合同协商签订、数据交付、清算审计等全流程的行为进行约束,规范数据流通流程,明确各方责任,保障数据流通过程的合规性和透明性。其中,合同模板生成和纠纷解决机制是共享利用管控规范的关键部分。合同模板是基于供需双方共识所建立的数据流通使用协议框架,主要记录数据提供方、使用方达成的数据资源合作内容;纠纷解决机制是为解决争议纠纷而设计的处理方案,保障仲裁公平公正与高效处理。 10.建立收益分配机制。收益分配规则主要包含数据评估定价方法和收益分配方式,确保各方收益公平合理。其中,数据评估定价方法是为了确保数据价值得到合理衡量,保障交易公平和数据价值最大