您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [华为]:企业架构-数据架构建设交流材料 - 发现报告

企业架构-数据架构建设交流材料

建筑建材 2024-11-12 - 华为 洪雁
报告封面

1.数据架构概述 2.数据资产目录3.数据标准4.数据模型5.数据分布 数据架构DA是企业架构4A中的重要组成部分 数据架构是联接业务架构与应用架构、技术架构的桥梁 •数据架构整合抽象业务对象、逻辑数据实体和属性,承接业务的数据需求,牵引IT的规划设计 •应用架构依据业务对象规划功能,技术架构依据数据模型设计数据存储方案 数据架构的定义及包含的内容 数据架构(DataArchitecture):数据架构是以结构化的方式描述在业务运作和管理决策中所需要的各类数据及其关系的一套整体组件规范。数据架构包括数据资产目录、数据标准、数据模型和数据分布四个组件。 以超市为例,理解数据架构四个组件数据模型 数据架构的交付件参考清单 说明:结合系统的数据架构蓝图,设计机位分配的数据架构,包含数据源到应用的端到端数据架构 城市示例:政务服务数据架构 1.数据架构概述 2.数据资产目录 3.数据标准4.数据模型5.数据分布 数据资产目录:五层数据结构 数据资产:是指由个人或企业拥有或者控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源。是指以个人或企业的照片、文档、图纸、视频、数字版权等以文件为载体的数据,相对于实物资产以数据形式存在的一类资产,是数字时代最重要资产形式之一。 主题域分组&主题域是公司的信息分类 特征: 以公司价值链为主线,整合各个部门的信息诉求,提供公司层级的数据全景图 通过高层级的分类,管理关键业务对象,支撑公司运作与管理决策 价值: 是企业信息目录,方便用户检索与信息获取定义公司级数据的范围与边界,便于信息统一管理为变革项目识别所涉及的数据范围提供输入,提供划分变革项目相关数据信息的管理责任人的依据 业务对象是数据架构中最核心的管理要素 业务对象是企业重要的人、事、物、地,承载了业务运作和管理涉及的重要信息 特征与价值 作用 特征: 业务对象是业务领域的宿主通过业务对象,划分业务领域的信息分布,保持跨领域的信息一致性。 至真、至实地反映业务,且容易被业务理解相对稳定,且与组织和流程解耦在企业内必须唯一,且只归属唯一的主题域业务对象对应建模语言中的概念实体 业务对象是数据治理的核心面向业务对象,建立核心数据的治理机制。主数据和主要的事务数据是业务对象。 价值: 统一企业重要业务概念,作为业务人员之间以及业务人员和系统人员之间沟通的桥梁 指导交易型IT系统开发和系统集成。 识别变革项目涉及的信息范围和关键信息的依据 变革项目进展过程中细化信息范围,明确信息定义和关联关系的基础 逻辑数据实体是具有一定逻辑关系的属性组合 逻辑数据实体是具有一定逻辑关系的属性组合 属性组的划分可以按照属性的相关性或建模需要 支持快速检索业务对象的属性 属性组对应建模语言中的逻辑实体 属性用来描述所属业务对象的性质和特征 业务对象的标签数据供应和数据消费的最小颗粒度用于定义数据规则 交通示例:机场数据资产目录 L1-主题域分组 L2-主题域 城市示例:政务服务资产目录 1.数据架构概述 2.数据资产目录 3.数据标准 4.数据模型5.数据分布 数据标准定义:业务术语&数据标准 业务术语是公司内部业务对象统一的定义。流程、IT系统界面统一引用业务术语,以方便业务人员之间交流、IT系统之间信息的集成。一般来说,容易出现歧义的业务对象需发布业务术语以消除歧义、提高沟通效率。 数据标准用于描述公司层面需共同遵守的属性层数据含义和业务规则。其描述了公司层面对某个数据的共同理解,这些理解一旦确定下来,就应做为企业层面的标准在企业内被共同遵守。 数据标准作用:统一语言、消除歧义,提高沟通效率 数据标准分类和管理范围 对数据标准进行分类,将有利于数据标准的编制、查询、落地和维护;业界对数据标准的分类并不统一,但对数据标准应涵盖内容的理解基本一致。 交通示例:机场数据标准 城市示例:政务服务数据标准 1.数据架构概述2.数据资产目录3.数据标准 4.数据模型 5.数据分布 数据模型是业务抽象化和结构化表达 数据模型分类及定义 逻辑模型数据库表设计 概念模型业务对象关系设计 物理模型在数据库系统中开发 .审视业务对象之间的关系:业务对象之间的关系是设计服务的重要输入。如果业务对象之间的关系很紧密,则适合归属到同一服务。如果两个有关联关系的业务对象分属于两个服务,则这两个服务之间应该有信息集成交互; .概念定义:逻辑数据模型是数据需求和控制数据质量的业务规则的详细描述。逻辑数据模型不依赖于任何技术以及具体实施中的具体限制。一个逻辑数据模型从概念数据建模开始,将数据属性添加到每个实体。 .概念定义:是面向计算机物理表示的模型,描述了数据在储存介质上的组织结构,它不但与具体的DBMS有关,而且还与操作系统和硬件有关。 .设计方法:逻辑数据模型通过应用两种技术转换概念数据模型的结构:范式化和抽象化。范式可以反映实体细节;抽象是在实体某些细节丢失或还未发现的情况下使用。 .和逻辑模型的关系:每一种逻辑数据模型在实现时都有起对应的物理数据模型。 .审视业务对象与业务项之间的关系:业务活动的业务项是否都可以归属于业务对象、逻辑数据实体和属性三层。如果存在业务对象不能覆盖业务项,则需要重新梳理本业务领域的业务对象。 .实现方法:DBMS为了保证其独立性与可移植性,大部分物理数据模型的实现工作由系统自动完成,而设计者只设计索引、聚集等特殊结构。 .范式化:范式化是运用规则将业务的复杂性转化为稳定的数据结构的过程。范式化的基本目标是保证数据元素仅在一个位置出现。 .抽象化:数据抽象地体现了真实世界中的对象、事件和概念的典型特征,通过对数据的含义、采集和存储进行明确的规则约定,确保其被准确地表达和理解 .简化业务对象之间的关系:通过将双向关系简化为单向关系来约束业务对象的访问方向,用单向箭头表示单向访问。 数据模型流程、输入、输出 三个数据模型的对比 交通示例:机场数据模型 物理模型 城市示例:政务服务数据标准 1.数据架构概述2.数据资产目录3.数据标准4.数据模型 5.数据分布 数据分布,通过数据源、数据流、信息链,拉通业务流 信息链&数据流 信息链&数据流是对指定的业务范围内,特定的数据在流程活动和各系统之间流转的描述,描述内容包括: 数据在流程活动或系统中的创建、读取(使用)、修改、删除等操作。数据被转换、抽取、加载、拷贝等操作。数据的存储:数据库、文件等。 表达数据与业务/IT关系,并从数据在业务和IT系统上的应用的视角,深入分析业务和IT问题并给出建议 可直观全面地描述信息&数据在业务流程/IT系统的使用的现状 可帮助分析数据在流程/IT系统流转过程中的断点/冗余/不一致等问题 TO-BE的信息链&数据流,规划了数据在业务流程和IT系统之间的流转和集成 数据源 数据源定义 指业务上首次正式发布某项数据的应用系统,经过数据管理专业组织认证,作为唯一数据源头被周边系统调用。 数据源要求 在做业务分析时,识别需求所涉及的实体或数据项的产生源头,同时提供数据源的更新要求,识别与其它项目或系统的关联关系。同一数据只能在数据源录入,在一定程度上规避多源录入,确定“数据血缘”。规定使用数据的应用只能从数据源集成数据,从而规范了集成的拓扑架构。次要的、将淘汰的应用不能被认证为数据源,有利于减少因数据集成造成的耦合。 交通示例:机场数据分布 城市示例:政务服务数据分布 总结:数据架构四个组件及核心价值是什么? 数据架构的核心价值 数据架构的四个组件 总体价值:数据架构对业务对象进行数字化描述,承接业务的数据需求,牵引IT的规划设计通过数据资产目录,全盘掌握业务对象及数据家底并管理通过数据标准,统一语言、消除歧义,提升数据质量通过数据模型,架起业务人员和技术人员之间沟通的桥梁通过数据分布,拉通业务流,消除信息孤岛 谢谢!