AI智能总结
目录 01介绍 构建人工智能代理的完整工具包27逐步指南:定义一个LLM代理40使用 Google Agentspace 管理和扩展您的智能体劳动力43构建代理的其他选项45关键要点46 48505456确保人工智能代理可靠且负责任AgentOps:一个用于生产就绪代理的框架使用 AgentOps 构建负责任且安全的 AI 代理关键要点 59结论 资源 60 介绍 人工智能代理的发展代表了软件工程的一次范式转变,使初创企业能够自动化复杂的业务流程,创造新颖的用户体验,并解决以前在技术上不可行的问题。 无论您是在验证想法、构建MVP,还是在支持生产中的产品,本指南都将帮助您贯穿项目的各个阶段。 如何使用此指南 但要从有前景的原型转变为可用于生产的代理,意味着要解决一套新的挑战。你如何管理它们非确定性行为?你如何验证它们复杂的推理路径?而且,关键在于,你从何处开始? 新手吗?AI代理 本技术指南将帮助解答此类问题。它提供了一份系统化、以运营为导向的路线图,旨在帮助那些正在竞相拥抱代理系统潜力的初创公司和开发者。 准备好建设了吗? 跳转到第2节以使用ADK创建您的第一个代理。 代理构建? 深入第 3 节使其安全、稳定和可扩展。 您将学习代理系统的基本概念,从其核心架构组件到确保在生产环境中可靠和负责任运行的原则。您还将了解一系列工具,这些工具使在Google Cloud 上构建和使用代理更加高效,从使用代理开发套件(ADK)进行代码优先开发和使用代理启动套件进行操作自动化,到使用Google Agentspace 进行无代码代理创建。 使用gemini套件进行原型设计更快,并申请谷歌创业云计划,以获得专家指导并最多可获得35万美元的云额度。 本指南的重点 智能体AI生态系统提供了许多用于构建认知架构的工具、库和方法。例如,谷歌提供开源框架如Genkit和Google Cloud的对话式AI服务,以及流行的开源库如LangChain和CrewAI。 本指南主要关注ADK,分享能够让您在Google Cloud上构建健壮、可扩展的代理,同时保留集成其他首选工具和库的能力的概念和架构模式。 第一部分核心概念 g人工智能代理 自主AI领域正在快速发展中。本节提供关于AI代理的基础知识,解释了其核心概念、目的和运行机制。它还详细介绍了Google Cloud中可用的相关工具和服务。 这个播客是使用 NotebookLM 创建的,提示为:“作为一名播客主持人,为‘创业技术指南:AI 代理’创建一个对话式和教育性的播客,目标受众是创业创始人和技术人员。播客必须涵盖使用 AI 代理的三个主要路径(构建、使用、合作),详细说明像代理开发套件(ADK)和预构建的 Gemini 代理这样的工具。” 喜欢音频?收听由 NotebookLM 创建的此部分的播客版本。 它应该解释智能体的核心组件,包括模型、工具、编排和运行时。此外,还应涵盖如何通过检索增强生成(RAG)的接地技术和利用多模态来确保信任和权力。最后,总结关键要点,并发出一个清晰的行动号召,引导听众了解谷歌的资源。 1.1谷歌云代理生态概述 代理式工作流是下一个前沿。这不仅仅在于提出一个问题并得到一个答案。它在于为AI设定一个复杂的目标——比如“规划这个产品发布”或“解决这个供应链中断”——并让它编排实现这一目标所需的多个步骤任务。这将从根本上改变生产力。” 构建生产级ai代理需要的不只是选择一个大型语言模型。一个完整的解决方案需要可扩展的基础设施、强大的数据集成工具以及能够适应多种技术需求的架构模式。 谷歌云支持代理系统的全面发展,无论是您自己构建代理,使用预构建的谷歌云代理,还是引入合作伙伴代理。该通用框架基于模型上下文协议(MCP)和代理到代理(A2A)协议构建,旨在实现互操作性。这样一来,无论其来源或架构如何,您的代理都可以在谷歌云生态系统中协同工作。1 托马斯·库里亚谷歌云首席执行官 引入合作伙伴代理 使用 Google Cloud代理 与mcp和a2a协议的互操作性 构建你自己的智能体 如果您想要构建针对特定任务的自定义代理,那么这就是适合您的途径。在这里,您有两个选项:一种以代码优先的方式实现最大控制力,或一种以应用优先的方式加速开发。 • 容器化:将代理打包到标准、可移植的容器中,使其准备好在任何兼容的云环境中部署。 • 多智能体组合:构建系统时,多种专业智能体能够协作、分配任务、共同解决问题的能力。 自定义、代码优先开发的代理开发套件 为什么这对初创公司很重要 这种方法最适合需要高度控制代理行为的开发者、技术初创企业和团队。Google Cloud的代理开发套件(ADK)是为这种定制方法而构建的。 • 自动化工作流,而不仅仅是对话:实现多步骤编排逻辑以解决复杂的业务问题,为小团队创造可扩展性的运营杠杆。 adk 使开发者能够构建、管理、评估和部署人工智能驱动的代理。它为创建对话式和非对话式代理提供了一个强大且灵活的环境,能够处理复杂任务和工作流程。 • 建立一个有防御力的产品:将代理直接连接到您的专有API和内部数据,以创建一个具有真正竞争优势的产品。 • 记住你的客户以提供真正的个性化体验:无缝整合短期对话上下文与长期知识,使你能够让你的客服人员回想起过往互动,并建立真正的客户关系。 使用ADK构建的代理可以轻松部署到Vertex AI Agent Engine上,这是一个专门为此目的设计的托管、可扩展环境。由于这些代理是容器化的,因此也可以部署到任何运行容器的环境中,例如CloudRun和Google Kubernetes Engine(GKE)。 • 基于自信启动: 利用内置评估和可观察性,严格测试和调试您的代理,确保您交付一个可靠、生产级的产品。 核心能力 • 关注你的产品,而不是基础设施:将你的代理打包成标准容器,使用标准的DevOps实践,以更快、更可靠的方式进入生产。 • 协调逻辑:代理的核心推理过程,如同ReAct框架(参见1.2节),使其能够规划和执行一系列工具调用和行动来完成一个复杂的目标。 • 工具定义和注册:一个用于定义自定义函数和API的接口,允许代理与数据、API和外部系统交互。 • 上下文管理:一个向代理提供记忆的系统,允许您使用代理在多次交互中回忆用户偏好和对话历史,以提供连贯的体验。 • 评估与可观测性:一套内置工具,用于严格测试代理质量,调试代理的逐步推理,并监控其在生产环境中的性能。 谷歌代理人空间用于以应用为导向的开发 通过快速原型制作以及将AI轻松集成到现有应用程序的便捷方式,托管代理使您能够专注于核心业务逻辑,而不是管理基础设施。如果您的工程资源有限,它们也是理想的选择。 构建的第二个主要途径是通过谷歌代理人空间。与代码优先的adk不同,您可以使用谷歌代理人空间来协调您的整个人工智能劳动力,并使非技术团队成员能够使用无代码设计器构建自定义代理。 杰尼米代码助手 基于平台的这种方法非常适合管理多个代理,并在您的成熟初创公司不断增长的SaaS应用程序组合中扩展其使用。 杰尼米代码助手是一款面向开发者的AI辅助工具。它融入软件开发生命周期的多个环节,通过IDE插件、命令行界面、GitHub集成以及在多种谷歌云服务中提供辅助功能。 核心功能 • 统一全公司搜索:连接并跨多个SaaS应用程序进行搜索。 核心功能 • 多模态数据合成:理解和合成来自文本、图像、图表和视频的信息,同时尊重数据权限。 • ide集成:在流行的ide(vs code、jetbrains ide、android studio)中,它提供代码补全、按需函数生成和聊天界面。它使用gemini的大上下文窗口来提供与打开的代码库相关的回复。企业版可以连接到私有源代码库,以提供更个性化的建议。 • 预构建代理库:为深度研究或创意生成等复杂任务提供一套现成的代理。 • 无代码自定义代理构建器:包含代理设计器,允许非技术人员通过提示驱动界面创建代理。 • 命令行界面:Gemini CLI 是一个开源 AI 代理,将 Gemini 功能直接带到终端,用于代码理解、文件操作和动态故障排除等任务。 它为何对初创企业很重要 • 打破数据孤岛:非开发团队可以构建和部署代理,这些代理可以访问和跨这些碎片化的数据源和应用程序采取行动。 • GitHub 集成:在 GitHub 上,Gemini 代码助手可以自动审查拉取请求以识别错误和样式问题,并建议具体的代码更改。 • 基于代理的开发:部署能够执行跨整个项目上下文中的复杂、多文件编辑的AI代理。这些基于代理的工作流程集成了人在回路(HITL)监督,并可以与遵循MCP的生态系统工具集成。 • 自动化工作流:创建跨平台工作流,而不会消耗稀缺的工程资源,使您的工程团队能够专注于核心产品开发。 • 集成谷歌云服务:在Firebase(应用错误分析、性能洞察)、Colab Enterprise(Python代码生成)、BigQuery(自然语言转SQL、查询优化)、Cloud Run和Apigee等服务中直接提供AI助手。 将Gemini打造为一个世界模型,是开发一种全新、更通用、更有用的AI——即通用AI助手的关键步骤。这是一种智能的AI,能够理解你所在的环境,并且能够代表你规划和采取行动,跨越任何设备。” 德米斯·哈萨比斯谷歌DeepMind首席执行官 • 配置和优化:在FinOps中心以及成本优化控制面板中提供个性化的成本和利用率建议。 为什么这对初创公司很重要 杰尼米代码助手相当于一个乘数。它可以处理软件开发任务,覆盖整个开发生命周期,从编写样板代码等常规任务到多文件重构等更复杂的操作。 • 安全分析与分析:启用对网络流量和日志的自然语言调查。它提供有关数据加密、密钥管理和生成或测试自定义组织策略等安全任务的建议。它还可以推荐 IAM 角色,并诊断权限错误。 您可以向 Gemini Code Assist 委托广泛的任务。以下是一些示例,展示了它的功能。 • 用于自动化样板代码:生成一个在接收到HTTP请求时触发的Python云函数。它应该解析JSON有效载荷中的userId和documentId,然后使用google-cloud-firestore用于从'users'集合中获取特定文档并以JSON响应返回的客户端库。 为什么这对初创公司很重要 • 节省时间:云管理会占用工程时间。Gemini Cloud Assist 让您可以解放出来专注于构建您的产品。 • 用于全面测试:提供一个您现有的函数,并要求Code Assist生成一个完整的测试套件,包括对Google Cloud服务(如Cloud Storage或Firestore)所需的模拟(mocks)。 在 Gemini Cloud Assist 中尝试这些提示: 我如何使用vertex AI部署模型? • 对于大规模、由Gemini驱动的重构:要求它分析您代码库中的多个服务并生成战略计划。例如:“针对我们的‘用户服务’和‘认证服务’,提出一个逐步重构认证逻辑到单个共享库的计划,并说明这种方法的权衡。” 为在 Google Cloud 中设计、构建和部署 Web 应用创建高层次计划。 列出所有云存储存储桶prod-v1没有启用对象版本控制的项目。 哪些应用于带有网络标签external-web-server实例的面向公众的防火墙规则? Gemini云助手 杰尼米云助手是您谷歌云环境的AI专家,为基础设施管理和应用操作提供情境感知协助。它利用您项目的情境信息,包括谷歌云项目ID和您在控制台中查看的具体产品页面,来定制其支持。2 显示授予服务账户 data-pipeline@my-project.iam.gserviceaccount.com 的所有 IAM 角色。 核心功能 • 设计和部署:在应