数据库助力加速生成式AI转型 借助运营数据库,充分释放生成式AI潜力的实用指南 目录 生成式AI的成功之旅始于运营数据02 数据库为企业级生成式AI应用和智能体提供核心驱动力04 利用Google Cloud数据库和生成式AI实现创新和转型07 生成式AI的成功之第1章 旅始于运营数据 企业成功的关键在于数据,数据可以用来驱动应用、挖掘业务价值。企业早已在使用客户信息、财务交易和库存水平等运营数据来优化业务流程,提升客户体验。如今,生成式AI又极大地提高了数据的潜在价值。 生成式AI是解锁更多业务价值的关键,这一点早已不言而喻。它能够通过优化后的搜索功能和个性化帮助,变革客户互动方式。还能协助开发者和管理员完成任务,大幅提高团队工作效率。此外,它可承担日常重复性工作,让员工得以专注于创新与创造。 本指南将介绍如何通过运营数据库来充分发挥生成式AI的潜力,借助新一代AI工具提高员工工作效率。 生成式AI使现代化改造变得空前紧迫 领先企业早已将运营数据库和生成式AI相结合,在以下领域改善体验并提高业务价值: 领先企业已经纷纷开始在其工作流中使用生成式AI技术。生成式AI的迅速普及正在拉大各企业在市场上的差距。乐于接受该技术的企业将蒸蒸日上,而不愿接受的企业则会被时代所抛弃。 客户服务 例如,通过将生成式AI与运营数据相结合,可以实时提供高度相关的回答,而这正是当今客户所看重的,也正是为客户提供个性化精准回答与通用回答的区别所在。 营销自动化 产品搜索 86%的组织认为,通过集成生成式AI的数据库提供基于上下文且高度相关的用户体验,能够产生显著的积极影响。1 员工辅助 然而,实施生成式AI技术并非易事,无法一蹴而就。许多组织发现,他们所用的旧数据库导致他们无法实现全新水平的数字化转型。 在零售行业,Target借助AlloyDB AI为其新一代电子商务搜索引擎提供核心驱动力。通过将庞大的产品目录转换为向量嵌入形式,Target可以执行相似性搜索,不仅能更好地了解购物者的意图,还能提供更具相关性的搜索结果,最终在大规模业务场景下提升客户体验。 只有14%的组织对其旧数据库的AI支持状况感到满意或非常满意,这表明还有很大的改进空间。1 旧数据库存在的问题很多,技术落后和用户体验不佳只是其中两例。随着生成式AI的发展,对数据库进行现代化改造的新需求迫在眉睫。这是因为最常用的用于处理向量、模型和智能体的AI工具都在云端运行。借助合适的工具,您可以在数据库中充分发挥生成式AI的能力,从而提供更优质的用户体验、提升工作效率并提高数据可用性。 在自动驾驶汽车行业,Nuro借助AlloyDB为其自动驾驶送货车的开发提供核心驱动力。他们分析了PB级的复杂模拟和路测数据,通过运营高性能查询来快速识别特定事件,进而加速改进驾驶系统。 那么,让我们开始吧。 在医疗设备行业,NeuroPace使用AlloyDB Omni来寻找癫痫患者间相似的电生理特征,以帮助确定治疗方案。他们使用AlloyDB AI的嵌入功能直接在数据库中将患者的iEEG(颅内脑电图)数据转换为向量表示法。 数据库为企业级生成第2章 式AI应用和智能体提供核心驱动力 基础模型是使用通用数据训练的大型机器学习(ML)模型。这类现成模型经济高效,是快速构建生成式AI应用和智能体的基础。然而,许多企业发现,仅靠这些模型不足以构建用户所需的基于上下文的高度精准体验。 数据库迎来了真正的高光时刻,我们将看到组织如何借助运营数据库在基础模型与企业级生成式AI应用之间架起一座桥梁,实现基于上下文的个性化用户体验。” 在零售应用场景中,客户日益期望智能体提供库存水平、预计送货时间等最新信息。在企业内部,员工可以访问智能体,自助获取有关人力资源政策的准确信息。而通用训练模型无法满足企业级应用和智能体的需求。 Andi GutmansGoogle Cloud Data Cloud副总裁兼总经理 这就是许多企业将基础模型接地在实时网络信息、企业数据(数据库和数据仓库)、企业应用(ERP、CRM和HR系统)以及其他相关信息来源的原因。 智能体正日益跨越多业务环节的数据进行联动。因此,模型与运营数据库的接地程度越深,智能体和生成式AI应用所释放的能力就越强大。 强大的企业级AI智能体构建,围绕以下三大指导原则: 03 简单易用 准确性 提供准确、最新的信息 方便开发者构建、操作和修改。 运营数据库可实时存储和处理您的数据,因此成为最新信息的最可靠来源。如果您的应用未集成此类数据,就无法充分发挥其能力。检索增强生成(RAG)技术则能让您将新鲜数据或特定领域数据嵌入基础模型,为构建生成式AI应用开辟了新机遇,使其能够为最终用户提供准确无误、内容详实且高度相关的答案。 任何技术都依赖于使用它的人。因此,在使用您的数据库和生成式AI技术时,您的团队必须尽可能密切地协作。应用开发者熟知并理解运营数据库,能够与开发中的应用进行交互。现有基础框架已支持在企业中利用运营数据,无需学习全新系统。 Google Cloud数据库内置向量支持,这意味着无需额外配置专用数据库。相反,您可以使用常规数据库简化嵌入的创建和访问流程。 上下文 提供高度相关的用户体验 通过引用便于更新的知识库,企业级生成式AI应用能够提供相关度更高的回答。 向量嵌入可将文本转换为数值表示法,使基础模型能够理解单词和短语之间的语义相似性。然后,通过向量搜索帮助模型从大量数据中快速找到相关度最高的信息。 RAG工作流可使用这些向量嵌入来检索相关数据,并将数据整合到基础模型提示中,以对提示进行优化。该方式可最大限度减少幻觉,为基础模型的回答提供更多上下文依据,从而提供更可靠的信息。 应用场景示例:构建产品搜索智能体 借助基础模型,基础版聊天机器人已能回答各种关于库存状况和退货政策的基本问题。而通过RAG,聊天机器人还能基于库存水平或当前定价的最新信息,回答更多问题。 客户希望获得及时、个性化的互动。借助RAG技术,生成式AI应用可实时访问运营数据库中存储的信息。 让我们来了解一下RAG在常见场景中的运作方式。在本场景中,我们以某玩具公司的购物智能体为例。该智能体采用标准基础模型,并通过其运营数据库中的实时库存和产品信息加以增强。 因此,该客户不仅会收到针对五岁以下儿童的玩具推荐,还会收到距离最近且有货的商店的相关信息。这种个性化回答可以提高销售转化率。 现在,有一位客户正在寻找适合五岁以下儿童的热门玩具。 下面介绍RAG与运营数据库的协作机制: 内部数据通过嵌入模型存储在数据库中。生成式AI应用通过嵌入模型将自然语言问题(“有哪些适合五岁以下儿童的热门玩具”)转换为向量。利用嵌入模型对数据库进行语义搜索以检索相关产品,并根据库存水平对产品进行排序。数据库返回搜索结果,并将其作为基础模型提示的一部分。基础模型根据您的数据构建准确的答案,例如“以下是适合五岁以下儿童的现货热门玩具清单”。0203040501 第3章 利用Google Cloud数据库和生成式AI实现创新和转型 Google Cloud可帮助组织构建生成式AI解决方案,并简化其所依赖的数据库的管理工作。借助Google DataCloud,数据团队可利用生成式AI工具充分发挥企业数据的价值,并通过内置功能直接便捷地应用AI/ML技术。例如,AlloyDB和BigQuery中内置向量嵌入功能,允许用户在其数据存储区中存储和生成嵌入,以帮助其生成式AI应用场景落地。 更高效地构建企业级智能体 在我们的数据库产品组合中,Google Cloud可提供卓越的向量嵌入和搜索能力。关系型数据库和非关系型数据库同样具备生成式AI功能,可对您的数据进行更深入、更具意义的洞察。 Google Cloud数据库可轻松集成至您的开发者生态系统。它支持MySQL、PostgreSQL、Oracle、SQLServer、Redis、Valkey、Cassandra和MongoDB等主流开源及商业引擎,可确保运营效率、加快开发速度并降低总拥有成本(TCO),让您能够按照自身节奏高效推进现代化改造。 您还可以轻松将自己的数据库连接至提供额外AI推理功能的外部服务(如Vertex AI),并与LangChain、LlamaIndex等编排框架集成。 以AI为核心,基于全球级基础设施打造业界领先的强大数据库套件。 Regnology借助AlloyDB开发了一款监管报告聊天机器人。该聊天机器人旨在以更快的速度准确回答内部和外部用户提出的监管方面的问题。AlloyDB AI可作为动态向量存储,为监管指南、合规文件和历史报告数据的知识库编制索引,从而为聊天机器人提供事实依据。合规分析师和报告专家以对话形式与聊天机器人互动,不仅节省时间,还能解决各种监管报告问题。 AlloyDB正助力组织构建生成式AI应用 AlloyDB的最新动态 我们将继续对AlloyDB进行创新,打造新一代AlloyDB AI,包括全新向量功能、远程模型便捷访问,以及安全灵活的自然语言支持。 AlloyDB针对需要实时且精准响应的企业级生成式AI应用进行了优化。它为事务型、分析型和向量型工作负载提供卓越性能,可以在任何环境中运行(包括本地和其他云平台),助力您随时随地推进现代化改造和创新。 Google拥有超过12年的实际场景向量算法创新经验,为我们多款热门服务提供了坚实后盾,其中包括Google搜索和YouTube。我们必须就向量的索引和搜索方法进行创新,才能满足要求严苛的应用场景。除了为PostgreSQL数据库提供开源pgvector支持外,我们还将为关系型数据库引入新一代树基向量功能。 AlloyDB AI是内置于AlloyDB中的一组集成式功能组件,可帮助开发者利用其运营数据构建高性能且可扩容的生成式AI应用。它可为向量嵌入提供内置的端到端支持,帮助开发者更轻松高效地将基础模型的能力与实时运营数据相结合,并提供以下功能: ScaNN索引是一款兼容pgvector的索引,以Google最先进的近似最近邻算法为基础。在我们的性能测试中,AlloyDB支持扩容至超过10亿个向量,查询延迟通常低于25毫秒。 •自动生成嵌入。只需一行SQL代码,即可访问嵌入模型,无论这些模型是在Vertex AI还是任何其他平台上运行。•该向量搜索兼容pgvector,具备急速性能。与标准PostgreSQL相比,索引创建速度快达10倍,向量搜索查询速度快达4倍、过滤式向量搜索查询速度快达10倍。2•与AI生态系统集成,使模型能够通过Vertex AI访问实时数据并作用于外部系统,同时支持LangChain和LlamaIndex等编排框架。 AlloyDB现已支持与远程AI模型集成,可直接在数据库内实现实时数据转换与增强。AlloyDB模型端点管理功能通过简化从Vertex AI、Anthropic和Hugging Face等第三方服务商或其他自定义服务调用模型的过程,实现了这一目标。 AlloyDB AI旨在加速智能体和应用的开发。高性能过滤式向量搜索支持现代应用所需的智能多模态数据检索。AlloyDB AI查询引擎则通过AI赋能的SQL运算符,从企业数据中发掘深层语义分析洞见。最后,AlloyDB AI自然语言会将最终用户或智能体提出的问题转换为SQL查询,从而给出答复。借助此功能,您可以构建交互式自然语言界面,准确捕捉用户意图,从而构建用户问题到对应答案SQL查询的高精确度映射。这些进步代表了数据库的未来。依托AI就绪数据,为智能体提供前瞻性分析洞见,使其能够预判并果断采取行动。 AlloyDB Omni在构建之初便兼顾了可移植性和灵活性。您可以利用AlloyDB中的技术,在任意环境中构建支持AI的企业级应用:本地、边缘、跨云,甚至在开发者的笔记本电脑上,皆可实现。 跨所有Google Cloud数据库进行向量搜索