您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[2023产业数据价值化峰会暨数栖大会]:高新民_重视数据基础设施建设 - 发现报告

高新民_重视数据基础设施建设

AI智能总结
查看更多
高新民_重视数据基础设施建设

高新民2023.05杭州 对数字化转型的理解 所有生产业务经营活动网络化、数字化、智能化,由联结汇聚数据,由数据产生智能,由智能科学决策,本质上是以数据要素优化其他生产要素的配置和运营,以达到全产业链、全价值链高质量发展的目标 工业互联网平台基础功能 •联接•数据•智能 数字基础设施(功能视角) 通信网络基础设施(光纤、5G)存储基础设施(IDC)算力网络基础设施(东数西算)数据网络基础设施(?) 数据的重要性已有共识 目前面临问题不少 高质量数据成为服务与创新的重要基础,也是提升机构数据价值的前提。然而,数据质量不高的现象依然突出,给数据深入挖掘与高效应用带来困难。 数据使用过程中普遍存在“不愿、不敢、不能”共享的问题,导致海量“三异”数据散落在众多机构和信息系统中,形成数据孤岛”,同时流通机制不灵活、不清晰。 出路何在? •理顺流转思路•建设基础设施 数据流通机制多元化,清晰化 •数据要素资产化的前提:有边界,可识别,有潜在价值。 •数据要素价值实現取决流通,与埸景強相关,流通机制依埸景而多元,才是正道。 •数据流通机制中,市场化是一重要选项,但不宜成为唯一。更应倡导数据共享(在共同体内),数据开放,后两者也要明确尊重数据主权原则 •异构、异主、异地(“三异”)数据的流通的基础是数据的互操作,然后依埸景及规则选择流转机制 •多元流通机制:自用/机密数据,共享数据,开放教据,交易数据 工业数据基础设施 工业数据基础设施包括数据互操作基础设施和数据建模基础设施, 两者又由技术架构和制度架构支撑数据互操作是基本要求,共享和交换是有约束条件的:需求、主权、安全 工业数据互操作基础设施架构 例:FAIR原则 数据利用面临的重大挑战之一,就是通过机器发现、访问、整合和分析与任务相适应的数据及其相关算法和工作流程,来促进知识发现。 在这里,FAIR指导原则,使数据具有可发现性、可访问性、互操作性和可重用性。FAIR一词是在2014年的洛伦兹研讨会(Lorentz Workshop)上发起的,由此产生的FAIR原则于2016年发布。 FAIR原则 •2016年3月一部分科学家和组织组成的联合体在《数据科学》中明确了“FAIR原则”,用于科学数据管理。 使用数据的第一步是找到它们。元数据和数据都应该让人类和计算机能够很容易的找到。机器可读的元数据是自动发现数据集和服务的必要条件,因此这是FAIR化过程中的一个重要组成部分。一旦用户找到所需的数据,她/他需要知道如何 访问这些数据,可能包括认证和授权。 Accessible——可访问性 这些数据通常需要与其他数据进行整合。此外,数据还需要与应用程序或工作流进行互操作,以便进行分析、存储和处理。 Interoperable——互操作性 Reusable——可重用性 FAIR的最终目标是优化数据的再利用。为了实现这一目标,元数据和数据应该得到很好的描述,以便它们能够在不同的环境中被复制和/或组合。 这些原则涉及三类主体:数据(或任何数字对象)、元数据(关于数字对象的信息)和基础设施。 FAIR化数据的细则要求 1Findable——可发现性•F1. (元)数据也需要被分配一个全球唯一的、永久的标识符(ID)。•F2.用丰富的元数据描述数据。•F3.元数据清楚明确地包括它们所描述的数据的标识符。•F4. (元)数据在可搜索的资源中注册或编制索引。 3Interoperable——互操作性I1. (元)数据使用一种正式的、可访问的、共享的和广泛适用的语言来表示信息(知识knowledge)I2. (元)数据使用遵循FAIR原则的词汇表。I3. (元)数据包括对其他(元)数据的有条件参考 Accessible——可访问性A1. (元)数据可以使用标准化的通信协议通过其标识符进行检索。A1.1协议是开放的、免费的、可普遍实施的;A1.2协议允许在必要时采用认证和授权程序。A2.即使在数据不再可用的情况下,元数据也可以访问。 Reusable——可重用性R1.对元(数据)的描述应当丰富,具有多种准确和相关的属性。R1.1. (元)数据的发布要有明确的、可获取的数据使用许可证;R1.2. (元)数据与详细的出处有关;R1.3. (元)数据符合领域相关的社区标准。 对FAIR指导性原则的认识 认识到计算机必须能够在没有或很少人的干预下自主地访问数据,实现异构、异主、异地数据互操作是FAIR原则的核心。 FAIR不等于开放。FAIR中的“A”标识“在明确规定的条件下可以使用”,任何数据在多大程度上可用,完全由数据所有者决定,可包含权限控制的可访问——性 数字对象体系架构(Digital Object Architecture,例:数字对象体系架构(DOA) DOA)是互联网体系架构的逻辑扩展,满足了支撑数据管理的需求,而不仅仅是将数字结构的信息传输,提供一套基础架构,实现各种“三异”信息系统之间数据安全互操作,构建数字对象的互联网。ITU认为DOA是下一代互联网的关键基础设施。 DOA体系架构的两个协议 Handle协议(Handle Protocol):•分配数字对象的全球唯一标识符•把标识解析为对应的数字对象信息•提供标识的分布式管理•内嵌的密钥和安全机制 DOIP协议(Digital Object Interface Protocol):•指定数字对象交互的标准方式•提供安全的数字对象的访问框架 DOA契合FAIR 如:Findable——可发现性 F1. (元)数据也需要被分配一个全球唯一的、永久的标识符(ID)。 基于数字对象的数联网:软件定义的数据基础设施 例:国际数据空间(IDS) •德国工业4。0的数据空间 •欧盟的数据基础设施•试图成为国际数据互联生态 国际数据空间(IDS)基本理念 •国际数据空间由所有通过数据空间连接器连接到空间的端点组成。没有一个中央机构负责数据管理或监督数据治理原则的遵守情况。 •它代表了一种不同于集中式数据管理概念和分散式数据网络(通常没有普遍适用的“游戏规则”)的替代架构。 •最终使用什么样的体系结构取决于每个体系结构对每个应用程序场景的实际效益。工业数据空间计划从一开始就假定了各种共存的架构。 例:工业数据空间(IDS)参考架构 1业务架构:包含数据治理,协同数据管理,商业模型,每个模块都是独立的功能模块,可以自由配置。 数据和服务架构 包含工业数据空间App Store,Broke,Connector,每个模块也可以自由配置。 ③软件架构 包含外部和内部国际数据空间连接器EXIC和INIC,实现数据高效流通。 ④安全架构 包含网络安全、身份认证、数据使用限制、安全运行环境等功能模块。 IDS-基本原则(1) •数据主权(Data Sovereignty)•安全数据交换(Secure Data Exchange)•分布式模式(DecentralApproach)•数据治理(Data Governance) IDS-基本原则(2) •平台和服务网络化(Network of Platformsand Services)•规模经济和网络效应(Economies of Scaleand Networking Effects)•开放架构(Open Approach)•可信参与(Certified Participants) IDS生态角色及模型架构 倡导面向产业的工业数据共同体 由业务强关联的企业参与,按共识制度和技术架构共建共享,实现数据流转通畅化,数据价值最大化,支持产业高质量发展的数据利益共同体 结论 •数字化转型本质上是以数据要素优化其他生产要素的配置和运营,以达到高质量发展的目标 •发挥数据价值的关键是理顺流转思路,建设基础设施 •数据要素价值实現取决流通,与埸景強相关,流通机制依埸景需多元化 结论 •“三异”数据的流通的基础是数据的互操作,然后依埸景及规则选择流转机制 数据基础设施包括数据互操作基础设施数据建模基础设施,两者又由技术架构和制度架构支撑 倡导面向产业的工业数据共同体重视数据建模及知识图谱+大模型学习 谢谢!