构建成功作为GenAI数据驱动型企业 这就是为什么以及如何做到这一点 2 商业领袖们越来越认识到生成式AI作为推动创新和收入增长加速器的价值。91%的组织 正在试验或投资GenAI,以及88%的组织计划在未来12到18个月内专注于AI-包括GenAI。 但大多数成功扩大其通用人工智能(GenAI)项目规模的组织随后难以从这些投资中提取显著价值。这往往是因为他们在数据和数据管理实践方面存在问题。 数据是一种需要投资、管理与治理的资产,正如通用人工智能(GenAI)应用所需的基础一样,必须建立在清洁、准确且可用的数据之上,以交付有意义的结果。数据驱动的企业拥有坚实的基础,能够降低生态系统复杂性,理解概念验证与规模化项目之间的区别,连接数据流程和政策,并支持快速响应所需的灵活性。 作为GenAI数据驱动型企业取得成功 3 数据驱动 defned 我们在凯捷报告中确定了九个关键属性 数据驱动型企业:数据掌握之路。这些维度共同赋能组织创造、处理和利用数据以实现业务目标、提升运营卓越性、改善客户体验并推动创新。 作为GenAI数据驱动型企业取得成功 Defningthedata-PoweredEnterprise4 数据驱动型企业:数据掌握之路,凯捷研究院2024 作为GenAI数据驱动型企业取得成功 5 该报告还发现,在过去四年里,几乎三分之二的高管表示其组织利用了激活的数据,这些数据已被嵌入到核心业务流程中。然而,这些九个领域内数据成熟度的进步表明并非如此。 80%的全球组织今年增加了他们的GenAI投资 ,只有54%的 数据高管们意识到,在采用AI的过程中需要具备数据信任和指导原则。这意味着大多数成功扩大其通用人工智能(GenAI)项目规模的组织随后难以从其投资中提取显著价值。这往往是因为数据和数据管理实践方面的问题阻碍了成功。 Only 54% 数据高管意识到在AI时代获胜所需的数据基础 In2024, 80% 全球组织从去年开始增加了对GenAI的投资 作为GenAI数据驱动型企业取得成功 6 数据无可辩驳的价值 企业已经认识到信息的价值,表示其组织从数据中获益的比例自2020年以来翻了一番,到2024年已达三分之二。但在实现大规模人工智能应用时,数据质量往往是问题所在,因为大量数据通常是未结构化的。 电子邮件、视频、图像、社交媒体帖子以及HTML内容。这些数据类型使得识别、汇总、分析和提取洞察成为一个挑战。如果组织的数据质量低劣、治理不佳、分散在不同的系统中,或者存在安全问题,或者如果 组织因受限于获取合适技术技能的渠道,无法有效利用这些技术,因此他们将无法从生成式人工智能中提取最大价值。 作为GenAI数据驱动型企业取得成功 作为GenAI数据驱动型企业取得成功 以下是组织如何有效地解锁和增强其数据。 1 开始强大 建立一个能够解锁及时、准确且相关的洞察以驱动实际成果的数据基础。这是成为数据驱动型企业的第一步。 创建扩展能力 3 公司往往会在概念验证(Proof-of-Concept)生成人工智能(GenAI)产品上取得成功,但在过渡到生产阶段时,成功率可能会大幅下降。关键在于高质量的数据以及构建统一的企业级数据分类体系的能力。工程团队需要强大的、协调一致的数据安全和合规政策及程序,并且具备协调多供应商采购策略的能力。 7 避免过度复杂的生态系统 2 数据往往被隔离在不同的技术和软件产品中。大量的数据是无结构的或质量较低的,验证这些数据并重新结构化以便于分析、比较和生成见解需要时间、技能和预算 。 4 消除有效交付的障碍 组织必须迅速行动并控制成本以履行其承诺。如果不管理复杂性和可扩展性,这将变得极具挑战性和代价高昂 。 最终,推动结果和回报意味着数据必须是可访问的、结构化的、值得信赖的和成熟的。 8 一起工作 数据启用创造优势 大多数通用人工智能(GenAI)的成熟之旅都始于同一起点:企业希望获得类似ChatGPT的体验,并遇到了众多开源和闭源的GenAI模型。因此,能够在单个工具包中访问信任、成本和规模控制功能变得至关重要。 这就是为什么Capgemini正在与Databricks和Informatica合作,为企业的组织提供一种解决方案,使它们能够更有效地成熟并利用数据以驱动业务成果。我们的方法将数据视为产品枢纽。通过结合企业数据管理平台在云上的最佳功能,以及最佳通用人工智能(GenAI)解决方案的能力,我们能够实现这一目标。Databricks数据智能平台,并与 Informatica智能数据管理云我们在一个工具中简化数据管理过程,作为高效、互操作且可扩展的通用人工智能开发平台和框架。 凯捷RAISE我们的ReliableAISolutionEngineering解决方案包括来自Databricks的关键能力:训练和推断(MosaicAI和AI/BI)、数据仓库(DatabricksSQL和UniForm)以及机器学习(MLfow)能力,所有这些都使用开放标准,并结合了Informatica的关键能力,包括数据集成、数据质量、无代码AI应用开发和可信主数据;综合的数据治理由DatabricksUnityCatalog和Informatica的CloudDataGovernanceandCatalog共同提供的解决方案提供。这使得数据可以在混合环境中的多个云平台上被充分利用,并降低了管理和维护端到端平台的复杂性。该解决方案可以部署在现有的数据平台上,包括MicrosoftAzure、AWS和GoogleCloudPlatform。 作为GenAI数据驱动型企业取得成功 9 试点、规模化、产业化GenAI交付业务 受益。 CapgeminiRAISE可在多个平台上运行,包括MicrosoftAzure、AWS和GoogleCloudPlatform。 作为通用人工智能价值案例运营加速器,CapgeminiRAISE提供了可衡量的商业成果,使组织能够借助适当的指导原则工业化定制的通用人工智能项目,并通过创建所需的整体数据治理和AI风险框架来解决数据复杂性、信任准备性和可扩展性问题。它专注于业务优先事项,为通用人工智能的大规模应用做好准备。 与现有基础设施无缝集成,CapgeminiRAISE还通过必要的数据基础增强了跨业务的数据协同效应和民主化。该加速器可以识别并工业化供AI模型使用的数据产品,并通过数据网格确保数据民主化,这是一种分散式数据架构,旨在通过在业务领域之间分配所有权和管理来提高数据访问、安全性和可扩展性。这实际上使数据驱动的组织具备了优势,并能够试点、扩展和工业化其通用人工智能(GenAI)应用和服务以实现预期结果。 CapgeminiRAISE并不是一个一刀切的产品。它可以模块化构建,并具备灵活性以满足独特需求,同时为企业范围内的数据管理(适用于通用人工智能)提供端到端的价值链。 生成式AI为企业在任何领域都带来了巨大的潜力,但构建大规模的有效系统仍面临重大挑战。CapgeminiRAISE以及我们与DatabricksandInformatica立即解决这些问题。联系我们以了解更多信息。 作为GenAI数据驱动型企业取得成功 10 Authors 请就本文内容及我们协助贵组织的能力提出问题或安排对话。 EricReichCapgemini公司AI和数据工程、洞察和数据的领导者和全球主管 RikTamm-DanielsGVP生态系统和联盟Informatica 瑞安·辛普森 管理技术联盟负责人, Databricks 作为GenAI数据驱动型企业取得成功 11 关于Databricks Databricks✁数据和人工智能公司。全球超过10,000家企业——包括Block、Comcast、CondéNast、Rivian、Shell以及超过60%✁《财富》500强企业——依赖Databricks ✁数据智能平台来掌控其数据,并利用人工智能将其投入使用。Databricks总部位于旧金山,并在全球范围内设有办事处,公司由Lakehouse、ApacheSpark™、DeltaLake和MLfow✁原始创建者创立。如需了解更多信息,请关注Databricks。LinkedIn,XandFacebook. 关于Informatica Informatica(纽交所代码:INFA),作为企业AI驱动云数据管理领域✁领导者,通过赋能企业充分利用其最关键资产✁变革力量,将数据和AI带入现实。我们创造了一个新 ✁软件类别——Informatica智能数据管理云(IDMC™) 。IDMC✁一个端到端✁数据管理平台,由CLAIRE提供动力。®AI,能够连接、管理和统一任何多云或混合系统中 ✁数据,使数据民主化,并帮助企业现代化和推进其业务策略。来自大约100个国家✁客户,包括超过80家fortune100公司,依赖Informatica来推动以数据驱动✁数字转型 。Informatica,让数据和AI活起来。 作为GenAI数据驱动型企业取得成功 关于凯捷 capgemini✁一家全球性✁业务和技术转型合作伙伴,帮助组织加速向数字化和可持续世界转变,同时为企业和社会创造实际影响。这✁一家拥有340,000名成员✁责任多元化✁集团,分布在超过50个国家。凭借超过55年✁深厚底蕴,capgemini被其客户信任,利用技术解锁其整个业务需求✁价值。该公司提供端到端✁服务和解决方案,利用从战略与设计到工程✁优势,并由其在人工智能、云技术和数据领域✁市场领先地位以及深厚✁行业专长和合作伙伴生态系统推动。该集团在2023年✁全球收入为225亿欧元。 www.capgemini.com ©2024凯捷。保留所有权利。