市场份额 中国数据治理市场份额,2023——为GenAI做好准备 Yanxia Lu IDC市场份额图 中国数据治理平台市场份额概况,2023 本摘录内容 本报告内容直接节选自《中国数据治理市场份额,2023——为GenAI做好准备》(CHC51598024) 执行概要 2023年中国数据治理平台级市场规模达29.3亿元人民币,相比2022年增长9.1%;数据治理解决方案市场规模2023年达30.8亿元人民币,相比2022年增长9.1%。受宏观经济影响,整体市场增速略有下滑。 数据要素、数据资产入表相关政策为中国的数据治理领域带来了新一轮增长驱动力。 数据治理市场是一个相对成熟的市场,无论是主数据、元数据管理、数据资产管理还是数据治理等。受外部宏观经济影响,2023年整体市场同比增长略低于2022年。要想驱动该市场持续稳定增长,抓住大模型与生成式AI的机遇是关键。 IDC中国人工智能与大数据研究总监卢言霞表示:"大模型与生成式AI为企业数据治理带来全新的机会也带来全新的要求。技术提供商应该充分利用这一机遇全面更新数据治理产品与解决方案的能力,尤其是多模态、非结构化数据处理能力,企业主数据质量等,以帮助用户大步提高企业数据就绪度。" 给技术提供商的建议 系统全面审视还有哪些业务可以数据化。随着大模型的普及,现有的数据源很快就会被大模型充分利用,要提升模型的效果,需要更多高质量的数据。 正式在数据集成与治理软件中引入生成式AI功能。很多行业用户也在寻找实现人工智能的领域,尽快升级产品,才能保住市场份额。 数据的可用性仍然是今天用户采用人工智能的关键。帮助用户提高数据的可用性、质量、合规性以及可信赖性。 基于云的分析数据平台正在市场上获得越来越多的关注,并不断扩大包括数据集成与数据智能功能在内的本地功能。如果不参与这些生态系统,不展示您的解决方案在哪些方面以及如何实现增值,也有可能会错失良机。 帮助行业用户:1)实施正式的数据素养、共享和负责任的AI培训。员工需要了解与将内部数据与外部模型一起使用相关的风险。如果您的组织不知道如何负责任地使用数据,那么与AI一起负责任地使用数据是无法实现的。2)扩展现有的数据治理系统和流程,以解决GenAI的新数据价值链问题,提高组织中数据的智能水平,并查看数据和模型智能方程式以取得成功。3)在创建新的GenAI解决方案时,在各个层面指导组织利用AI卓越中心和审查委员会来批准解决方案设计、模型选择和实施。4)考虑使用数据可观测性和系统可观测性解决方案来监视数据的使用情况。5)设置有关GenAI的定期衡量重要的指标,例如可以访问GenAI模型的员工数量、使用GenAI模型的次数、数据控制的有效性以及对业务成果的影响(正面或负面)。 市场份额 在本次报告中,IDC仍然将数据治理分为数据治理平台级子市场以及解决方案级子市场2个市场。平台级子市场即将数据治理软件以平台形式出售,由合作伙伴为最终用户提供解决方案的相关市场。解决方案级子市场,主要是指为用户提供整体解决方案,而非只提供标准软件的相关市场。2个子市场并非完全独立。 数据治理平台级子市场 如下所示,2023年中国数据治理平台级市场规模达29.3亿元人民币。相比2022年,整体市场增长9.1%。数据要素、数据资产入表政策起到一定的推动作用,但对于市场规模的实际影响较弱。本年度,IDC在该市场的市场份额中收录了3家公司。其中厂商1市场规模达9.03亿元人民币,市场占 比30.8%;腾讯云市场规模达3.02亿元人民币,市场占比10.3%;厂商3作为后起之秀,市场份额也达到了3.2%。 表1 哪些厂商塑造了这一年? 腾讯云 腾讯云WeData定位云端一站式数据开发治理平台,融合了包含数据集成、数据开发、任务运维的全链路DataOps数据开发能力,以及数据地图、数据质量、数据安全等一系列数据治理和运营能力,帮助企业在数据构建和应用的过程中实现降本增效,数据价值最大化。 腾讯云WeData数据治理平台的核心能力:协同——坚持Dataops的理念,基于协作空间支持数据团队不同的角色更好的协作;效率——支持增量式代码开发和发布;支持代码自动补全;可视化拖拉拽方式进行流程设计;支持在线代码调试和日志查看;支持灵活的开发方式。一体——通过事前规划、事中异常阻断、事后质量和成本分析以及数据流通安全管控为数据的生产和消费提供保障,支持一站式运营治理。质量——从事后的质量评分转为事中的质量监控,一体化测试由代码测试与数据测试两方面组成,以保证数据分析的高质量。从事后的标准对标转为事前的标准落标,以保证数据分析时的数据质量、统计口径的一致性。此外,基于开源、简单易用、降本增效、安全稳定也是腾讯云大数据治理的优势所在。 市场环境 重大市场变化 "数据要素"、"数据资产入表"相关政策出台。而在全球市场,数据作为产品进行管理的概念也在不断成熟,促使数据治理供应商创建数据市场或者数据共享产品和功能,以满足市场需求。 央国企对于数字化转型以及AI的投入是数据治理市场重要的增长驱动力。 矢量成为重要的数据类型。数据矢量化是GenAI用例的关键功能和数据类型,推动了新的矢量存储和搜索技术进入市场。矢量现已成为DII软件功能必须支持的数据类型。 大模型与生成式AI的热潮带动了数据治理的需求。一方面,用于大模型训练的数据紧缺,要想大模型在特定领域发挥作用,需要更多的专有数据,数据的采集与治理也因此被再度提上日程。另一方 面,RAG作为当下非常主流的大模型使用方式,需要从多个内外部的数据源集成数据,如何能实现端到端的数据集成,也是数据治理的重要课题。 研究方法 本研究是IDC一直以来对中国ICT方案市场系列研究的一部分。IDC获取信息主要通过一手资料研究和案头研究,两种方法同时使用,相互关联、相互验证,以确保信息的有效性和准确性,资料获取具体方法如下: 一手资料主要通过对独立软件开发商、系统集成商、IT产品厂商及最终用户(CIO)的直接访谈获得。 案头研究资料来源主要包括(但不局限于)互联网网站、期刊和报纸、IDC先前的研究资料,以及IDC专有数据库等。 对IT产品厂商、独立软件开发商和系统集成商的访问:IDC的分析师通过对数据治理市场的重要参与者进行访问,以确定其软件和服务的收入情况以及其它相关信息。大部分的访问通过面访的形式进行,电话访问、电子邮件联系等其它信息收集方式也会根据需要采用。 厂商的介绍、新闻稿和其它对外公布的信息:IDC的分析师每年会和大量IT厂商进行广泛地交流,以此了解IT厂商目前和今后IT产品、服务及解决方案策略、收入状况、客户情况、目标市场等重要市场信息。 IDC最终用户研究:主要包括每年对数以千计的最终用户访谈。通过最终用户研究可以了解用户IT系统应用现状、痛点、IT采购流程、未来需求等,也可对厂商的竞争情况及业绩提供进一步的验证。 IDC全球数据库:IDC全球IT厂商的数据库提供了全面的主流IT厂商历史信息,为IT厂商的策略分析提供了极好的参考依据。IDC的行业用户数据库提供了对行业趋势和发展的持续观察研究。 综上所述,IDC在此研究报告中呈现的数据代表了IDC基于上述数据源、厂商介绍和观察到的主要市场活动、以及对数据的进一步建模分析从而形成的对市场的最为近似的估计。在本次研究中,直接数据来源大约占70%,间接数据来源大约占30%。 注:由于使用了四舍五入,本报告中的数据不完全精确。 市场定义 本次报告中研究的数据治理范畴是指:围绕数据资产开展的具体工作,包括数据全生命周期开发、治理、运营一系列工具,提供数据生命周期管理、数据集成、数据清洗、主数据管理、元数据管理、数据资产管理、数据共享交换、数据质量管理、数据标准化等功能。 相关研究 ▪IDC MarketScape:中国实时湖仓市场2024年厂商评估(IDC #CHC51768224,2024年7月)▪数据智能市场生态图谱,2024(IDC #CHC50345723,2024年7月)▪工业领域中数据管理分析服务最佳实践案例(IDC #CHC51598524,2024年7)▪图数据管理分析平台技术能力评估,2024(IDC #CHC51598324,2024年7月)▪零售行业数据智能市场分析——以客户为主导的零售业的逆向体验(IDC#CHC51598724,2024年6月)▪数据要素全景研究(IDC #CHC51598424,2024年3月) 关于IDC 国际数据公司(IDC)是在信息技术、电信行业和消费科技领域,全球领先的专业的市场调查、咨询服务及会展活动提供商。IDC在全球拥有超过1,100名分析师,他们针对110多个国家/地区的技术、IT对标研究和采购以及行业发展机遇和趋势,提供全球化、区域性和本地化的专业意见。IDC的分析和洞察有助于IT专业人士、业务主管和投资界做出基于事实的技术决策,实现他们的关键业务目标。IDC成立于1964年,是国际数据集团(IDG,Inc.)的全资子公司。 IDC China IDC中国(北京):中国北京市东城区北三环东路36号环球贸易中心E座901室邮编:100013+86.10.5889.1666Twitter: @IDCblogs.idc.comwww.idc.com 版权声明 这份IDC研究文件作为IDC持续情报服务的一部分发布,提供书面研究、分析师互动以及网络会议和会议活动记录。请访问www.idc.com了解有关IDC订阅和咨询服务的更多信息。要查看IDC全球办事处列表,请访问www.idc.com/about/worldwideoffices。请致电+1.508.988.7988或访问 www.idc.com/?modal=contact_repsales联系IDC报告销售人员,了解有关应用本文档价格购买IDC服务的信息,或有关其他副本或网络权利的信息。2024 IDC。未经许可,不得复制。保留所有权利。