AI智能总结
2024全 球 数 据 管 理 趋 势报 告 黄万忠2025年9月26日 报告摘要 当 今 经 济 由 数 据 驱 动 , 人 工 智 能 (A I) 和 数 字 商 务 已 成 为 家 喻 户 晓 的 概 念 。 本 年 度 调 研 的 一 个 显 著 现 象 是 : 大 家 更 关 心 如 何 治 理 支 撑 这 些 技 术 的 数 据 并 确 保 高 质 量 , 而 非 仅 仅 讨 论A I与数 字 技 术 的 变 革 力 量 。数 据 治 理 以 及 需 要 跨 职 能 、 具 备 数 据 素 养 的 团 队 来 管 理 企 业 数 据 , 是 贯 穿 今 年 调 查 的 一 个 鲜 明 主 题 。 主 要 调 查 结 果 亮 点 包 括 : 6 3 %的 受 访 者 认 为 他 们 的 组 织 将 数 据 视 为 企 业 资 产 。通 过 报 告 和 分 析 获 得 洞 察 是 数 据 管 理 的 首 要 驱 动 力 , 占7 2 %的 回 复 。数 据 孤 岛 的 数 量 是 首 要 关 注 点 ,6 8 %的 受 访 者 将 其 列 为 组 织 中 的 一 个 问 题 。未 来1 - 2年 计 划 的 首 要 举 措 是 数 据 治 理 (3 9 %) 和 数 据 战 略 (3 7 %) , 因 为 组 织 希 望 在 维 护 可 信 、 安 全 的 信息 资 产 的 同 时 , 从 数 据 中 发 掘 更 多 价 值 。 人群分布 今 年 的 调 查 共 有 来 自 全 球4 5个 国 家 的3 3 4名 受 访 者 。 从 地 理 分 布 上 看 ,5 4 %的 受 访 者 来 自 美 国 , 其 次 是 加 拿 大 (9 %) 、 英 国 (6 %) 、 澳 大 利 亚 (3 %) 和 印 度 (3 %) 。调 查 对 象 涵 盖 了 各 种 规 模 的 企 业 , 涉 及 多 个 行 业 和 职 位 。大 多 数 受 访 者 从 事 数 据 治 理 相 关 工 作 。 按职业划分,2024年排名前三的受访职业群体是: 超过2/3受访者来自1000人以上的组织: 覆盖40余个行业,TOP行业包括: 咨询业:14%政府部门:12%教育业:8%金融业:7% 10,000人及以上:28%1,000-4,999人:24%5,000-9,999人:16% 信息/数据治理:35%数据和/或信息架构:21%顾问:11% 其余职位涵盖了从企业高管到学术/研究人员再到技术/工程角色的范围。 数据管理的目标与驱动因素 2024年排名前五的目标和驱动力如下: 通过报告和分析获得洞察:72%节约成本和提高效率:63%支持数字化转型:62%遵守法规:55%降低风险:52% 数据驱动决策仍是头号驱动。除分析决策外,组织也在用数据改善核心业务运营(如主数据支撑的供应链、定价、采购与客户旅程“360视图”等)。隐私监管兴起(如CCPA、GDPR)推动可追溯与可治理的数据能力(治理、元数据、主数据等)。 数据管理的挑战与优先级 2024年排名前五的挑战: 企业级“一数一源一标准”仍然难以实现,组织结构、系统互通性不足与文化等因素加剧了孤岛。 数据孤岛数量:68%(2023年为61%)数据素养:58%(2023年为57%)数据质量问题:56%(2023年为55%)缺乏数据治理:51%(2023年为50%)技能短缺:41%(2023年为44%) 开放题显示2024–2025年的头号优先级任务是数据治理,紧随其后是数据质量;元数据/数据目录与主/参考数据管理也是高频诉求。 数据管理现状 仅51%组织称已开展企业级数据管理;21%尚无健全实践;19%仅在项目级实施。与“孤岛”为首要难题相呼应,跨部门协同仍是瓶颈,进一步凸显数据治理对齐利益相关方的必要性。 数据治理负责人最常成为组织级数据管理的牵头人(39%)。CIO、CDO、COO、CEO等C级参与度较上年提升,反映数据作为战略资产的地位提升。 数据管理现状 排名前10的实施项目如下: 商业智能与报告:72%(2023年为65%)数据仓库:64%(2023年为63%)数据治理:59%(2023年为57%)数据安全:55%(2023年为60%)数据架构:52%(2023年为47%)数据战略:51%(2023年为46%)数据建模:48%(2023年为41%)数据质量:45%(2023年为44%)云服务:42%(2023年为44%)数据集成:42%(2023年为38%) 在审视组织当前正在实施的关键举措时,“商业智能(BI)与报告”年复一年地保持领先地位,比2023年增加了7%。数据仓库,作为BI和报告的底层存储,紧随其后。 随着报告需求的增长,数据治理的需求也随之而来,以确保报告基于可信、定义明确、可追溯的信息。调查结果显示,59%的组织已实施数据治理举措,比2023年增加了2%。 数据管理现状 在2025年至2026年间,企业TOP10任务计划: 数据治理:39%(2023年为43%)数据战略:37%(2023年为40%)数据质量:33%(2023年为38%)数据架构:31%(2023年为32%)自助服务报告与分析:28%(2023年为34%)主数据管理:26%(2023年为38%)元数据管理:25%(2023年为35%)数据科学(包括AI或机器学习):25%(2023年为26%)数据建模:20%(2023年为26%)生成式AI:20%(2023年未设此项) 尽管生成式AI和数据科学(包括AI或机器学习)等热门话题进入了2024年的前十名,但值得注意的是,更为传统和基础性的能力,如数据治理(39%)、数据质量(33%)和数据架构(31%),以显著优势成为首要关注点。 数据战略(37%)是第二大被选择的举措。 软件工具对数据管理实施的影响 虽然工具不应成为数据管理计划的主要驱动力,但它们是成功的重要因素。大多数受访者认为工具有轻微到中度的影响,而有34%的人认为工具有主要影响,这一比例正在增长。这比2023年增加了8%。随着法规的增加和数据源的复杂性,这种影响力的增加是合理的,因为组织需要自动化并展示关键数据资产的血缘关系。 数据管理方面的培训 随着组织对数据素养技能的需求增加,培训的重要性将继续增长。2024年最常见的学习渠道:书籍(73%,较2023年+12%)、网络资源(66%)、非学历课程(58%)、厂商教程(50%)、导师/教练(35%)、高校课程(25%);“无培训直接上手”降至19%。在高技术性与高合规风险背景下,系统化学习更受重视。 元数据管理情况 元数据应用场景 TOP5元数据管理应用场景: 数据治理:66%(2023年为53%)数据质量改进:57%(2023年为51%)数据仓库和BI报告:46%(2023年为41%)主数据管理:34%(2023年为35%)法规与审计:29%(2023年为22%) 数据架构的现状 数据架构TOP5好处: 是否拥有明确的数据架构(饼图显示了拥有明确数据架构的组织百分比)是:42%否:32%不知道:16%其他:10% 改善了IT团队内部的协作:34%改善了与业务团队的协作:32%我们没有明确的数据架构:26%标准化的数据管理策略:25%提高了数据质量:24% 数据建模的现状 数据建模的现状 数据模型和图表(倒金字塔图显示了2024年组织使用的各种模型和图表的百分比) 2024年,受访者偏好的TOP5模型: 逻辑数据模型:59%概念数据模型:53%物理数据模型:53%数据流图:51%数据血缘图:33% 随着越来越多的业务利益相关者对组织中的数据产生兴趣并承担责任,数据模型成为强大的沟通和需求收集工具。 逻辑和概念数据模型通常面向业务受众,它们最受欢迎——使用率分别为59%和53%——这是合乎逻辑的。 数据平台与存储 关系型数据库依然是运营系统与数仓/ODS的基石;电子表格因易用性仍广泛存在,但不推荐用于企业级数据管理。 数据平台与存储 未来1–2年Top4: 云上关系型数据库(55%)云对象存储/数据湖(40%)本地关系型数据库(31%)云上非关系型数据库(28 关系型数据库继续是未来实施的首选,尽管趋势是向云平台迁移。云对象存储已上升到未来计划的第二位,这主要得益于数据湖仓一体(data lakehouses)的普及。 数据湖仓一体提供了“两全其美”的方案,既有数据湖的灵活性和存储选项,又有数据仓库的数据质量和报告支持。 新技术与趋势 在数据管理中,对组织产生最大变化的三个主要趋势: 人工智能(AI)在关于新技术和趋势的回答中首当其冲——既包括它可能带来的前景,也包括其风险。毫不奇怪,数据治理和数据质量分别是第二和第三大主题,因为受访者对AI使用的治理以及支持AI模型所需的数据质量表示担忧。监管问题也是一个被频繁提及的话题,特别是围绕消费者数据的法规,如CCPA和GDPR,这也推动了对更强数据治理的需求。有观点希望回归实践本身,避免过度迷信新工具与风潮。 数据管理领域下一个将引起行业最深刻变革的三大新兴趋势: AI再次成为可能改变行业的领先新兴趋势。紧随AI之后的是数据治理、法规、数据质量以及隐私和安全。数据网格(Data mesh)是另一个显示出一定人气的回答,组织希望通过一种更联邦化的数据治理方法来解决组织孤岛问题,即基于领域的数据产品所有权。 新机遇亦有新风险。要最大化分析、AI与BI的潜能,必须先夯实治理、合规与质量。 谢谢观看