行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

AGENTIC AI 应用构建实践指南

信息技术 2025-06-17 - 亚马逊云科技郭生根

Agentic AI概述

Agentic AI是下一代生成式AI技术的核心范式，超越了传统AI的被动响应模式，赋予AI自主规划、记忆、工具调用及协作能力，使其能够像人类一样主动理解、分解并解决复杂问题。Agentic AI的核心能力包括：

通用语言的理解能力：通过大语言模型理解人类用自然语言表达的复杂任务描述，无需进行专门的编程以及定义规则。
强大的推理能力：利用大语言模型预训练获得的广泛知识和推理能力，进行因果推理，并在新的上下文环境中应用已经构建的知识。
自主规划能力：结合思维链（Chain-of-Thought, CoT）技术，将复杂任务自行分解为子任务，并对这些子任务进行有序规划和执行。
工具使用能力：通过函数调用（Function Calling）的能力，识别何时需要调用函数，并正确构造API调用参数，使用外部工具来完成任务。

Agentic AI的飞跃发展得益于技术的进步、性价比的提升、安全可靠的数据基础设施以及先进的开发工具。根据Gartner的预测，到2028年，企业软件应用中将有33%集成Agentic AI功能，日常工作决策中的15%将由Agentic AI系统自主完成。

Agentic AI的技术原理

现代Agentic AI系统通常由四个核心组成部分构建：

大型语言模型作为推理引擎：负责自然语言理解、推理与决策、预训练阶段获取的广泛世界知识的应用、对话历史维护等。
规划能力：利用思维链（Chain-of-Thought, CoT）技术，将复杂任务自行分解为子任务，并对这些子任务进行有序规划和执行。
记忆机制：包括短期记忆和长期记忆，用于存储和检索过去的交互信息、知识和经验，实现上下文感知的连续对话和长期学习。
工具使用：通过调用外部提供的API接口来完成对各种工具的使用，执行相关操作并访问实时信息。

Agent的分类

Agentic AI系统可以根据交互模式和自主程度进行分类：

基于交互模式分类：
- 单Agent：以单个Agent为核心处理单元，适用于特定领域的任务场景、任务步骤清晰且相对固定的应用场景，需要快速响应且不需要复杂协作的场景。
- 多Agent：由多个协作的Agent共同组成，每个Agent负责不同的任务或领域，通过协作共同完成复杂的问题解决过程，适用于需要多种专业知识协作的任务、需要多个步骤和决策点的复杂业务流程、需要多角度思考的场景。
基于自主程度分类：
- Agentic Workflow（Agent工作流）：预定义包含了步骤序列工作流，Agent仅在预设的决策框架内做出选择，适用于具有明确步骤和决策点的流程、需要可预测性和可审计性的场景、任务复杂度相对较低的应用、以及需要低延迟和高效率的场景。
- Autonomous Agent（自主Agent）：能够根据设定的高级目标自行规划、决策并执行复杂任务，适用于需要考虑多种因素和权衡不同选择的场景、环境或要求经常变化从而需要灵活适应新情况的场景、需要创造性思维和非常规解决方案的问题、以及需要理解并响应复杂人类意图的交互场景。

Agentic AI的技术栈

Agentic AI技术栈由多个不同的技术组件组成：

Agent框架（Agent Framework）：提供创建和定义Agent的基本结构、任务管理、环境交互、记忆和状态管理、决策引擎、工具集成、多Agent协作、监控和日志、安全和控制机制、可扩展性等功能。
Agent托管（Agent Hosting）：将Agent部署至本地服务器或云端基础设施，实现内外部系统的便捷调用与无缝访问。
模型服务（Model Serving）：通过推理引擎将大语言模型封装成可通过API访问的服务单元，降低Agentic AI应用开发的技术门槛与资源投入。
记忆（Memory）管理：包括传统数据库、向量数据库与语义搜索、知识图谱（Knowledge Graphs）等，用于存储和检索过去的交互信息、知识和经验。
沙箱环境（Sandbox）：提供隔离环境，限制Agent的自主行为所带来的潜在危害，对Agent的执行进行风险管理。
MCP（Model Context Protocol）：建立大模型与数据存储系统之间的统一连接协议，为Agentic AI提供一种与工具、服务和数据连接的一致方式。

Agent 技术延展

Agentic AI技术也诞生了多种前沿的领域：

MCP（Model Context Protocol）：为Agentic AI提供一种与工具、服务和数据连接的一致方式。
Computer Use技术：使AI能够像人类一样操作计算机，通过视觉理解屏幕内容，并通过鼠标和键盘交互执行复杂任务。
Browser Use技术：使Agentic AI能够有效地导航和与网络进行交互，像人类一样浏览网页、填写表格、提取信息，甚至完成复杂的网络任务。
Agent2Agent（A2A）协议：实现不同Agent系统之间的通信和互操作性，允许基于不同框架或由不同供应商构建的Agent发现彼此的能力，协商交互模式，并互相协作完成任务。

Agentic AI的应用形态

Agentic AI主要有两种应用形态：

通用Agent：能够执行各种通用任务的Agent系统，不局限于特定领域，而是能够处理多种类型的请求和任务。通用型个人助手是典型的通用Agent。
垂类Agent：专注于特定领域的任务和服务，为特定行业或功能量身定制的智能系统，基于特定领域的数据、工作流程和标准构建，能够精确地执行复杂的现实世界任务。

构建 Agentic AI 应用

构建Agentic AI应用时，应专注在Agent所处的环境、Agent能使用的工具和给Agent的基本指令，可以先实现一个最低功能的版本，然后根据实际效果和反馈逐步改进完善。在选择Agentic Workflow（Agentic工作流）或者Autonomous Agent（自主Agent）构建时，需要综合考虑任务的确定性、对错误的容忍度、灵活性的需求、复杂性以及用户交互的多样性等因素。

应用 Agentic AI 技术进行构建的客户案例

金蝶国际软件集团：利用Amazon Bedrock Agents构建智能提单系统和智能指标分析系统，以自然语言交互简化用户提单，优化智能指标查询业务流程。
一级方程式赛车（F1®）：利用Amazon Bedrock Agents和Amazon Bedrock Knowledge Bases开发了智能根因分析（RCA：Root Cause Analysis）助手，从而实现了用自然语言交互式进行问题的诊断。

总结和展望

Agentic AI代表了人工智能领域的一次重大飞跃，它不再局限于被动响应指令，而是能够主动感知环境、制定目标、规划行动并自主执行复杂任务。通过结合大型语言模型（LLM）、多模态感知、强化学习和自动化工作流技术，Agentic AI能够以更接近人类决策的方式运作，从而在各行各业都展现出来巨大潜力。Agentic AI的未来应用场景也将更加广泛，它将在未来深刻地改变我们的工作方式、商业模式和社会结构。

021.1 Agentic AI是什么1.2 Agentic AI的技术原理1.3 Agent的分类1.4 Agentic AI的技术栈1.5 Agent技术延展1.6 Agentic AI的应用形态050710121720263752626466042463682.1.专用Agent：Amazon Q2.2.全托管的Agent服务：Amazon Bedrock和Amazon Bedrock Agents2.3完全由自己构建的Agent2.4选择适合不同场景的方案3.1金蝶国际软件集团利用Agent技术优化ERP系统智能提单和指标分析流程3.2 Formula 1利用Agent技术加速比赛日各种问题的根因分析Agentic AI概述构建Agentic AI应用应用Agentic AI技术进行构建的客户案例总结和展望01020304目录CONTENTS 在人工智能飞速发展的今天，Agentic AI正成为下一代生成式AI技术的核心范式。它超越了传统AI的被动响应模式，通过赋予AI自主规划、记忆、工具调用及协作能力，使其能够像人类一样主动理解、分解并解决复杂问题。从提升企业效率的垂类Agent到多Agent协同的生态系统，Agentic AI正在重塑人机交互的边界，并为各行各业带来前所未有的智能化变革。本文旨在系统性地梳理Agentic AI的技术框架、应用场景及落地路径。第1章深入解析Agentic AI的核心技术原理，包括其依赖的规划、记忆、工具调用等能力，并分类探讨了不同自主程度的Agent技术栈，以及介绍了Agent的应用形态，包括通用Agent与垂类Agent；第2章提供实践指南，从专用的Agent（Amazon Q），到开箱即用的托管服务（如Amazon Bedrock Agents），再到完全自建Agent的方案设计，进行了详细的实践介绍；第3章则通过公开的客户案例，验证Agentic AI在优化流程、加速决策中的实际价值；第4章则是对本文的总结和展望，需要特别指出的是，本文在2025年6月发布，而Agentic AI的技术发展非常迅速，对于更新的Agentic AI的技术动向，可以访问亚马逊云科技的主页来了解最新的信息。无论您是技术开发者、企业决策者还是AI研究者，本文将帮助您理解Agentic AI的底层逻辑，掌握其落地方法论，并预见这一技术如何驱动未来的智能化浪潮。让我们共同探索Agentic AI如何成为人类能力的延伸，开启人机协作的新篇章。迎接Agentic AI时代的技术革命导读 0303 04Agentic AI概述104 Agentic AI的概念由AI Agent（也称为智能体）发展而来。AI Agent技术并非一个全新的概念，其理论基础可以追溯到20世纪90年代初的人工智能研究。早期的Agent系统主要基于规则引擎、专家系统和符号逻辑构建，受限于当时计算能力和算法的局限性，只能在特定的、结构化的环境中发挥作用。大型语言模型（LLM）的出现引发了Agent技术的根本性变革，从面向过程的架构转变为面向目标的架构。现代Agent不再局限于单一规则或算法，而是能够理解自然语言指令，进行复杂推理，并通过灵活调用各类工具来实现目标。在当今大语言模型的环境下，Agentic AI是利用AI技术来推理、规划和代表人类或系统完成任务的自主软件系统。它们可以从头到尾执行各种操作，比如进行代码评审、编撰研究报告、处理申报、规划行程或管理企业应用程序。这些Agent具有反复思考的能力，包括评估结果、调整方法并继续朝着既定目标努力。它们不仅回答问题，还通过探索和细化的过程来解决问题。Agentic AI是什么1.1 0505 06新竞争模式由于技术的进步（如基础大语言模型具有增强的推理能力）、不断提升的性价比以及能够安全可靠的集成数据的基础设施，从而推动了Agentic AI的飞跃发展。借助先进的开发工具，简化了部署Agent的过程，使得各种规模的企业现在都可以实施这些Agentic AI系统。根据Gartner的预测，到2028年，企业软件应用中将有33%集成Agentic AI功能（来源：Gartner研究报告《2025年顶级战略技术趋势》，2024年10月发布），日常工作决策中的15%将由Agentic AI系统自主完成（来源：Gartner研究报告《顶级战略技术趋势：Agentic AI――用户体验的演变》，2025年2月发布）。现代Agentic AI是一种智能系统，能够感知环境、做出决策并采取行动以实现特定目标。与传统的AI系统相比，Agent强调自主性、交互性和持续学习能力。当前的Agent系统通常由四个核心组成部分构建：大型语言模型作为推理引擎、规划能力、记忆机制和工具使用能力。这四个组件相互协作，形成了一个完整的Agent系统架构，使其能够理解复杂指令、制定执行计划、保持上下文连贯性，并与外部系统和资源交互。大型语言模型是现代Agentic AI系统的核心，作为推理引擎驱动Agent的智能行为。大语言模型在Agentic AI架构中的核心功能体现在自然语言理解从而将非结构化的自然语言转化为系统可理解的意图和目标、推理与决策（进行逻辑分析、因果推断和假设验证）、预训练阶段获取的广泛世界知识的应用、对话历史维护从而理解上下文并进行连贯的多轮对话。Agentic AI的技术原理1.21.2.1大型语言模型作为推理引擎规划能力是Agentic AI系统的关键组成部分，使其能够分解复杂问题、设计解决方案路径并有条理地执行多步骤任务，展现出很高的灵活性和适应性。在实现规划能力的过程中，通常都会利用到思维链（Chain of Thought, CoT）技术，这是一种提示词技术，引导大语言模型生成一系列中间的推理步骤，而不是直接产生最终答案。这种技术模拟人类的逐步思考和推理过程，极大提升了复杂任务的解决质量。通过在Agent的编排提示中嵌入类似的思维链指令，可以显著提升Agent在复杂任务处理中的表现。在Agentic AI系统中，思维链规划主要应用于以下场景：•任务拆解：将复杂任务拆解为有序的子任务，便于逐步依次执行。•推理验证：通过展示中间推理过程，验证推理的正确性和完整性。•决策透明度：使Agent的决策过程可见，增强可解释性和可信度。1.2.2规划能力（Planning） 07 08记忆机制是Agentic AI系统的关键组成部分，使其能够存储和检索过去的交互信息、知识和经验，从而实现上下文感知的连续对话和长期学习。通过记忆机制，使Agent能够维持长时间的一致性互动。记忆机制分为短期记忆和长期记忆。短期记忆主要负责维护当前对话或任务中的上下文信息，是Agent保持对话连贯性的基础。短期记忆通常在内存和提示词中存储对话历史数据，从而记录用户的输入信息和Agent响应的完整或摘要信息。随着对话进行，提示词的上下文窗口会面临容量限制。为了有效管理会话上下文，通常会保留最近N轮对话并丢弃较早的内容，或者保留对话中的关键信息并压缩或删除不重要的细节，也可以定期生成对话历史摘要，用摘要替代详细历史。长期记忆扩展了Agent的能力范围，使其能够存储和检索超出单次会话范围的信息，形成持久化的知识库。长期记忆系统在实现中，可以将信息以结构化形式进行存储，比如存储在关系型数据库或者NoSQL数据库中，便于高效检索。也通常会选择将文本信息转换为语义向量并存储在向量数据库中，以及支持相似性搜索。检索增强生成（RAG：Retrieval-Augmented Generation）是结合长期记忆和大语言模型的重要技术，使Agent能够处理超出大语言模型的训练数据范围的问题，在生成响应前先检索相关的知识，并基于检索到的信息生成更准确和详细的答案，从而提高准确性并减少幻觉。ReAct（Reasoning and Acting）框架是目前常用的Agent规划框架之一。该框架通过思维链的方式，引导模型将复杂问题进行拆分，一步一步地进行推理（Reasoning）和行动（Action，比如工具调用、信息检索等），同时还引入了观察（Observation）环节，在每次行动（Action）之后，都会先观察（Observation）当前现状并了解环境变化，根据观察结果进行下一步新的思考和推理（reasoning），从而形成闭环反馈机制。这种把推理（Reasoning）和行动（Action）结合起来，通过交替进行思考和行动，在处理复杂任务时展现出更高的灵活性和适应性。通过使用ReAct框架，可以让大语言模型根据当前状况进行推理，然后采取行动与外界环境互动。1.2.3记忆机制（Memory）工具使用能力是现代Agentic AI系统的关键特性，使Agent能够超越纯文本交互的限制，与外部系统和资源进行交互，执行相关操作并访问实时信息。这一能力将Agent从简单的对话系统转变为能够完成实际任务的智能助手。Agentic AI系统通过调用外部提供的API接口来完成对各种工具的使用。Agent需要理解API的端点（endpoint）、参数、认证要求和响应格式，以及能够从用户输入中提取必要的参数，并确保其有效性。从而正确的构造API请求，包括URL、头部和请求体。在Agent系统中调用API时，可以直接构造和发送API请求以及处理响应，也可以通过中间层（如MCP：Model Context Protocol）间接与API交互，增加安全性和灵活性。1.2.4工具使用（Tools） 090909 101.3.1基于交互模式分类Agent的分类1.3根据交互模式可以把Agent分为两大类：单Agent（Single Agent）和多Agent（Multi-Agent）系统。这种分类方式主要是基于Agent之间的协作方式以及任务分配方式而得出的。单Agent是指以单个Agent为核心处理单元的系统架构。在这种架构中，所有的任务处理、决策制定和外部交互均由同一个Agent完成。单Agent拥有完整的功能集，包括自然语言理解、知识检索、工具调用和响应生成等能力，可以独立完成从用户输入到最终输出的全部流程。单Agent架构的优势在于决策路径简短从而提供较快的响应速度，简单的架构带来较低的配置和维护成本，相对固定的行为模式使得测试和优化更加简便，单一模型的调用带来较少的资源消耗，单一决策流程便于追踪和监控。不过单Agent架构也存在一定的局限性，比如在处理跨多个专业领域的复杂任务时效率较低，功能的不断增加会导致提示词变得更加复杂，单Agent难以同时精通多个专业领域，协调多个工具使用时的能力有限，以及无法像多Agent系统那样提供多维度的思考和解决方案。因此单Agent架构适用的场景包括：特定领域的任务场景（比如客户服务或者产品推荐等），任务步骤清晰且相对固定的应用场景，需要快速响应且不需要复杂协作的场景等。多Agent系统是指由多个协作的Agent共同组成的复杂系统架构。在这种架构中，每个Agent负责不同的任务或领域，并针对特定领域优化，通过协作共同完成复杂的问题解决过程。多Agent系统通常采用“主管-协作者”（Supervisor-Collaborator）模型，不同的协作者并行处理不同的任务。多Agent的优势主要在于把复杂问题分解以后交给更专业的、不同的Agent执行，提高解决效率。因为多个Agent可并行工作，因此系统整体处理效率得到提高。多Agent的挑战则在于每个Agent交互都计为单独的API调用而导致的成本和延迟增加，多Agent交互时的跟踪、监控以及问题排查变得更加复杂。多Agent系统架构适用的场景包括需要多种专业知识协作的任务（比如综合性咨询服务）、需要多个步骤和决策点的复杂业务流程、需要多角度思考的场景（比如风险评估等）。除了基于交互模式的分类外，Agentic AI系统还可以根据自主程度进行分类，这种分类方式侧重于Agent的决策自由度、学习能力和适应性。主要区分为两类：Agentic Workflo

点击免费查看完整报告