021.1 Agentic AI是什么1.2 Agentic AI的技术原理1.3 Agent的分类1.4 Agentic AI的技术栈1.5 Agent技术延展1.6 Agentic AI的应用形态050710121720263752626466042463682.1.专用Agent:Amazon Q2.2.全托管的Agent服务:Amazon Bedrock和Amazon Bedrock Agents2.3完全由自己构建的Agent2.4选择适合不同场景的方案3.1金蝶国际软件集团利用Agent技术优化ERP系统智能提单和指标分析流程3.2 Formula 1利用Agent技术加速比赛日各种问题的根因分析Agentic AI概述构建Agentic AI应用应用Agentic AI技术进行构建的客户案例总结和展望01020304目 录CONTENTS 在人工智能飞速发展的今天,Agentic AI正成为下一代生成式AI技术的核心范式。它超越了传统AI的被动响应模式,通过赋予AI自主规划、记忆、工具调用及协作能力,使其能够像人类一样主动理解、分解并解决复杂问题。从提升企业效率的垂类Agent到多Agent协同的生态系统,Agentic AI正在重塑人机交互的边界,并为各行各业带来前所未有的智能化变革。本文旨在系统性地梳理Agentic AI的技术框架、应用场景及落地路径。第1章深入解析Agentic AI的核心技术原理,包括其依赖的规划、记忆、工具调用等能力,并分类探讨了不同自主程度的Agent技术栈,以及介绍了Agent的应用形态,包括通用Agent与垂类Agent;第2章提供实践指南,从专用的Agent(Amazon Q),到开箱即用的托管服务(如Amazon Bedrock Agents),再到完全自建Agent的方案设计,进行了详细的实践介绍;第3章则通过公开的客户案例,验证Agentic AI在优化流程、加速决策中的实际价值;第4章则是对本文的总结和展望,需要特别指出的是,本文在2025年6月发布,而Agentic AI的技术发展非常迅速,对于更新的Agentic AI的技术动向,可以访问亚马逊云科技的主页来了解最新的信息。无论您是技术开发者、企业决策者还是AI研究者,本文将帮助您理解Agentic AI的底层逻辑,掌握其落地方法论,并预见这一技术如何驱动未来的智能化浪潮。让我们共同探索Agentic AI如何成为人类能力的延伸,开启人机协作的新篇章。迎接Agentic AI时代的技术革命导读 0303 04Agentic AI概述104 Agentic AI的概念由AI Agent(也称为智能体)发展而来。AI Agent技术并非一个全新的概念,其理论基础可以追溯到20世纪90年代初的人工智能研究。早期的Agent系统主要基于规则引擎、专家系统和符号逻辑构建,受限于当时计算能力和算法的局限性,只能在特定的、结构化的环境中发挥作用。大型语言模型(LLM)的出现引发了Agent技术的根本性变革,从面向过程的架构转变为面向目标的架构。现代Agent不再局限于单一规则或算法,而是能够理解自然语言指令,进行复杂推理,并通过灵活调用各类工具来实现目标。在当今大语言模型的环境下,Agentic AI是利用AI技术来推理、规划和代表人类或系统完成任务的自主软件系统。它们可以从头到尾执行各种操作,比如进行代码评审、编撰研究报告、处理申报、规划行程或管理企业应用程序。这些Agent具有反复思考的能力,包括评估结果、调整方法并继续朝着既定目标努力。它们不仅回答问题,还通过探索和细化的过程来解决问题。Agentic AI是什么1.1 0505 06新竞争模式由于技术的进步(如基础大语言模型具有增强的推理能力)、不断提升的性价比以及能够安全可靠的集成数据的基础设施,从而推动了Agentic AI的飞跃发展。借助先进的开发工具,简化了部署Agent的过程,使得各种规模的企业现在都可以实施这些Agentic AI系统。根据Gartner的预测,到2028年,企业软件应用中将有33%集成Agentic AI功能(来源:Gartner研究报告《2025年顶级战略技术趋势》,2024年10月发布),日常工作决策中的15%将由Agentic AI系统自主完成(来源:Gartner研究报告《顶级战略技术趋势:Agentic AI――用户体验的演变》,2025年2月发布)。 现代Agentic AI是一种智能系统,能够感知环境、做出决策并采取行动以实现特定目标。与传统的AI系统相比,Agent强调自主性、交互性和持续学习能力。当前的Agent系统通常由四个核心组成部分构建:大型语言模型作为推理引擎、规划能力、记忆机制和工具使用能力。这四个组件相互协作,形成了一个完整的Agent系统架构,使其能够理解复杂指令、制定执行计划、保持上下文连贯性,并与外部系统和资源交互。大型语言模型是现代Agentic AI系统的核心,作为推理引擎驱动Agent的智能行为。大语言模型在Agentic AI架构中的核心功能体现在自然语言理解从而将非结构化的自然语言转化为系统可理解的意图和目标、推理与决策(进行逻辑分析、因果推断和假设验证)、预训练阶段获取的广泛世界知识的应用、对话历史维护从而理解上下文并进行连贯的多轮对话。Agentic AI的技术原理1.21.2.1大型语言模型作为推理引擎规划能力是Agentic AI系统的关键组成部分,使其能够分解复杂问题、设计解决方案路径并有条理地执行多步骤任务,展现出很高的灵活性和适应性。在实现规划能力的过程中,通常都会利用到思维链(Chain of Thought, CoT)技术,这是一种提示词技术,引导大语言模型生成一系列中间的推理步骤,而不是直接产生最终答案。这种技术模拟人类的逐步思考和推理过程,极大提升了复杂任务的解决质量。通过在Agent的编排提示中嵌入类似的思维链指令,可以显著提升Agent在复杂任务处理中的表现。在Agentic AI系统中,思维链规划主要应用于以下场景:•任务拆解:将复杂任务拆解为有序的子任务,便于逐步依次执行。•推理验证:通过展示中间推理过程,验证推理的正确性和完整性。•决策透明度:使Agent的决策过程可见,增强可解释性和可信度。1.2.2规划能力(Planning) 07 08记忆机制是Agentic AI系统的关键组成部分,使其能够存储和检索过去的交互信息、知识和经验,从而实现上下文感知的连续对话和长期学习。通过记忆机制,使Agent能够维持长时间的一致性互动。记忆机制分为短期记忆和长期记忆。短期记忆主要负责维护当前对话或任务中的上下文信息,是Agent保持对话连贯性的基础。短期记忆通常在内存和提示词中存储对话历史数据,从而记录用户的输入信息和Agent响应的完整或摘要信息。随着对话进行,提示词的上下文窗口会面临容量限制。为了有效管理会话上下文,通常会保留最近N轮对话并丢弃较早的内容,或者保留对话中的关键信息并压缩或删除不重要的细节,也可以定期生成对话历史摘要,用摘要替代详细历史。长期记忆扩展了Agent的能力范围,使其能够存储和检索超出单次会话范围的信息,形成持久化的知识库。长期记忆系统在实现中,可以将信息以结构化形式进行存储,比如存储在关系型数据库或者NoSQL数据库中,便于高效检索。也通常会选择将文本信息转换为语义向量并存储在向量数据库中,以及支持相似性搜索。检索增强生成(RAG:Retrieval-Augmented Generation)是结合长期记忆和大语言模型的重要技术,使Agent能够处理超出大语言模型的训练数据范围的问题,在生成响应前先检索相关的知识,并基于检索到的信息生成更准确和详细的答案,从而提高准确性并减少幻觉。ReAct(Reasoning and Acting)框架是目前常用的Agent规划框架之一。该框架通过思维链的方式,引导模型将复杂问题进行拆分,一步一步地进行推理(Reasoning)和行动(Action,比如工具调用、信息检索等),同时还引入了观察(Observation)环节,在每次行动(Action)之后,都会先观察(Observation)当前现状并了解环境变化,根据观察结果进行下一步新的思考和推理(reasoning),从而形成闭环反馈机制。这种把推理(Reasoning)和行动(Action)结合起来,通过交替进行思考和行动,在处理复杂任务时展现出更高的灵活性和适应性。通过使用ReAct框架,可以让大语言模型根据当前状况进行推理,然后采取行动与外界环境互动。1.2.3记忆机制(Memory) 工具使用能力是现代Agentic AI系统的关键特性,使Agent能够超越纯文本交互的限制,与外部系统和资源进行交互,执行相关操作并访问实时信息。这一能力将Agent从简单的对话系统转变为能够完成实际任务的智能助手。Agentic AI系统通过调用外部提供的API接口来完成对各种工具的使用。Agent需要理解API的端点(endpoint)、参数、认证要求和响应格式,以及能够从用户输入中提取必要的参数,并确保其有效性。从而正确的构造API请求,包括URL、头部和请求体。在Agent系统中调用API时,可以直接构造和发送API请求以及处理响应,也可以通过中间层(如MCP:Model Context Protocol)间接与API交互,增加安全性和灵活性。1.2.4工具使用(Tools) 090909 101.3.1基于交互模式分类Agent的分类1.3根据交互模式可以把Agent分为两大类:单Agent(Single Agent)和多Agent(Multi-Agent)系统。这种分类方式主要是基于Agent之间的协作方式以及任务分配方式而得出的。单Agent是指以单个Agent为核心处理单元的系统架构。在这种架构中,所有的任务处理、决策制定和外部交互均由同一个Agent完成。单Agent拥有完整的功能集,包括自然语言理解、知识检索、工具调用和响应生成等能力,可以独立完成从用户输入到最终输出的全部流程。单Agent架构的优势在于决策路径简短从而提供较快的响应速度,简单的架构带来较低的配置和维护成本,相对固定的行为模式使得测试和优化更加简便,单一模型的调用带来较少的资源消耗,单一决策流程便于追踪和监控。不过单Agent架构也存在一定的局限性,比如在处理跨多个专业领域的复杂任务时效率较低,功能的不断增加会导致提示词变得更加复杂,单Agent难以同时精通多个专业领域,协调多个工具使用时的能力有限,以及无法像多Agent系统那样提供多维度的思考和解决方案。因此单Agent架构适用的场景包括:特定领域的任务场景(比如客户服务或者产品推荐等),任务步骤清晰且相对固定的应用场景,需要快速响应且不需要复杂协作的场景等。多Agent系统是指由多个协作的Agent共同组成的复杂系统架构。在这种架构中,每个Agent负责不同的任务或领域,并针对特定领域优化,通过协作共同完成复杂的问题解决过程。多Agent系统通常采用“主管-协作者”(Supervisor-Collaborator)模型,不同的协作者并行处理不同的任务。多Agent的优势主要在于把复杂问题分解以后交给更专业的、不同的Agent执行,提高解决效率。因为多个Agent可并行工作,因此系统整体处理效率得到提高。多Agent的挑战则在于每个Agent交互都计为单独的API调用而导致的成本和延迟增加,多Agent交互时的跟踪、监控以及问题排查变得更加复杂。多Agent系统架构适用的场景包括需要多种专业知识协作的任务(比如综合性咨询服务)、需要多个步骤和决策点的复杂业务流程、需要多角度思考的场景(比如风险评估等)。 除了基于交互模式的分类外,Agentic AI系统还可以根据自主程度进行分类,这种分类方式侧重于Agent的决策自由度、学习能力和适应性。主要区分为两类:Agentic Workflo