AI智能总结
为什么代理人是生成AI的下一个前沿 通过从信息转变为行动-认为虚拟同事能够完成复杂的工作流程-该技术有望带来新一波的生产力和创新。 由Lareina Yee,Michael Chui和Roger Roberts与Stephen Xu 在过去的几年里,世界对生成AI(generativeAI)释放的能力和可能性感到惊讶。基础模型,例如大型语言模型(LLM),可以实现令人印象深刻的壮举,在文本,音频,图像和视频等多种媒介中提取见解并生成内容。但是genAI的下一阶段可能更具变革性。 代理系统来完成复杂的工作流。 然后,多代理系统可以将此工作流程解释并组织为可操作的任务,将工作分配给专门的代理,使用数字工具生态系统执行这些细化的任务,并与其他代理和人类协作以迭代地提高其操作质量。 我们正在开始从基于知识的,由AI驱动的工具演变-例如,可以回答问题的聊天机器人并生成内容-到一代AI启用的“代理”,这些代理使用基础模型在数字世界中执行复杂的多步骤工作流程。简而言之,该技术正在从思想转变为行动。 在本文中,我们探讨了使用gen AI代理所带来的机会。尽管该技术仍处于起步阶段,需要进一步的技术开发才能准备好进行业务部署,但它很快 吸引注意力。仅在过去的一年里,谷歌、微软、OpeAI和其他公司就投资了软件库和框架来支持代理功能。LLM支持的应用程序,如Microsoft Copilot,Amazo Q和Google即将推出的Project Astra,正在从基于知识的转变为基于行动的转变。诸如Adept,crewAI和Imbe之类的公司和研究实验室也在开发基于代理的模型和多代理系统。考虑到一代AI的发展速度,代理可能会像今天的聊天机器人一样司空见惯。 从广义上讲,“agentic ”系统是指可以在动态世界中独立交互的数字系统。虽然这些软件系统的版本已经存在多年,但 ge AI的自然语言功能揭示了新的可能性,使系统能够计划他们的行动,使用在线工具来完成这些任务,与其他代理和人员合作,并学习提高他们的表现。Ge AI代理最终可以充当熟练的虚拟同事,以无缝和自然的方式与人类合作。例如,虚拟助手可以计划和预订复杂的个性化旅行行程,处理跨多个旅行平台的物流。使用日常语言,工程师可以向程序员代理描述新的软件功能,然后程序员代理将编码,测试,迭代和部署它帮助创建的工具。 代理商能为企业带来什么价值? 代理商可以释放的价值来自他们的潜力,即自动化大量复杂用例的潜力,这些复杂用例的特征是输入和输出高度可变-这些用例历来很难以成本或时间高效的方式解决。例如,像商务旅行这样简单的事情可能涉及许多可能的行程,包括不同的航空公司和航班,而不是提到酒店奖励计划、餐厅预订和非工作时间活动,所有这些都必须在不同的在线平台上处理。虽然已经努力使这一过程的部分自动化,但其中大部分仍然必须手动完成。这在很大程度上是因为潜在输入和输出的广泛变化使得该过程过于复杂、昂贵或耗时而无法自动化。 传统上,机构系统很难实现,需要费力的、基于规则的编程或机器学习模型的高度特定培训。Gen AI改变了这一点。 当使用基础模型(已经在极其庞大和多样的非结构化数据集上训练)而不是预定义的规则来构建代理系统时,它们有可能适应 to different scenario in the same way that LLM can responseintellightly to prompts on which they have not been explicitlytrained. Furthermore, using natural language rather thanprogramming code, 支持AI的Gen代理可以通过三种重要方式简化复杂和开放式用例的自动化: 人类用户可以指导一个gener AI - enabled 定义代理人的特征(这是他们在世界上行动的一种方式),也是他们的一代人工智能能力可以独特地发挥作用的一种方式。基础模型可以学习如何与工具交互,无论是通过自然语言还是其他接口。如果没有基础模型,这些功能将需要大量的手动工作来集成系统(例如,使用提取,转换和加载工具)或繁琐的手动工作来整理来自不同软件系统的输出。 —代理可以管理多重性。许多业务用例和流程的特点是线性工作流,具有清晰的开始和一系列导致特定解决方案或结果的步骤。这种相对简单性使得它们在基于规则的系统中易于编码和自动化。但是基于规则的系统通常表现出 “脆性” -也就是说,当面对明确规则的设计者没有考虑到的情况时,它们会崩溃。例如,许多工作流程的可预测性要低得多,其特征是意外的曲折和一系列可能的结果;这些工作流程需要特殊的处理和细微差别的判断,这使得基于规则的自动化具有挑战性。但是Gene AI代理系统,因为它们基于基础模型,有可能处理给定用例的各种不太可能的情况,实时适应执行完成流程所需的专门任务。 基于AI的代理如何工作 代理可以支持跨行业和业务功能的高复杂性用例,特别是对于涉及耗时任务或需要各种专门类型的定性和定量分析的工作流。代理通过递归地分解复杂的工作流并跨专门的指令和数据源执行子任务来达到预期目标。该过程通常遵循这四个。 —代理系统可以用自然语言指导。当前,要自动化用例,首先必须将其分解为一系列可以编码的规则和步骤。这些步骤通常被转换为计算机代码并集成到软件系统中,这是一个通常昂贵且费力的过程,需要大量的技术专长。由于代理系统使用自然语言作为一种指令形式,即使是复杂的工作流程也可能 1.用户提供说明:用户通过提供自然语言提示与AI系统进行交互,就像指示受信任的员工一样。系统识别预期的用例,要求用户在需要时进行额外的澄清。 更快速,更轻松地进行编码。而且,该过程可能由非技术员工而不是软件工程师完成。这使得更容易集成主题专业知识,授予更广泛的gen AI和AI工具访问权限,并简化技术和非技术团队之间的协作。 2.代理系统计划、分配和执行工作:代理系统将提示处理为工作流,将其分解为任务和子任务,由经理子代理分配给其他专门的子代理。这些子代理配备了必要的领域知识和工具,利用先前的“经验”并编纂了领域专业知识,相互协调并使用组织数据和系统来执行这些分配。 —代理可以使用现有的软件工具和平台。除了分析和生成知识外,代理系统还可以使用工具并在更广泛的数字生态系统中进行通信。例如,可以指导代理使用软件应用程序(例如绘图和图表工具),在网络上搜索信息,收集和编译人类反馈,甚至利用其他基础模型。数字工具的使用既是一种 3.代理系统迭代地改进输出:在整个过程中,代理可以请求额外的用户输入以确保准确性和相关性,该过程可以结束于代理向用户提供最终输出,迭代用户共享的任何反馈。 附件1 需要,这往往是一个耗时和高度协作的努力,要求关系经理与借款人,利益相关者和信贷分析师进行专门的分析,然后提交给信贷经理进行审查和额外的专业知识。 4.代理执行操作:代理在世界范围内执行任何必要的操作以完全完成用户请求的任务。 可能的艺术:三个潜在的用例 潜在的基于代理的解决方案:一个代理系统-包括多个代理,每个代理都承担一个专门的、基于任务的角色-可能有可能 这些系统对企业意味着什么?以下三个假设用例提供了在不远的将来可能发生的事情的一瞥。 被设计为处理广泛的信用风险场景。人类用户将通过使用自然语言来启动该过程,以提供具有特定规则,标准和条件的任务的高级工作计划。然后,该代理团队将工作分解为可执行的子任务。 用例1:贷款承销 金融机构准备信用风险备忘录,以评估向借款人提供信贷或贷款的风险。该过程包括汇编、分析和审查与借款人、贷款类型和其他因素有关的各种形式的信息。鉴于信用风险情景和分析的多样性 例如,一个代理可以充当关系经理来处理通信 在借款人和金融机构之间。执行代理人可以编制必要的文件,并将其转发给财务分析师代理人,例如,从现金流量表中检查债务并计算相关的财务比率,然后由评论家代理人进行审查,以识别差异和错误并提供反馈。这个分解,分析,完善和审查的过程将被重复,直到。最终信用备忘录完成(附件2)。 用例2:代码文档和现代化 大型企业的传统软件应用程序和系统通常会带来安全风险,并可能减慢业务创新的步伐。但是对这些系统进行现代化可能是复杂的、昂贵的和耗时的,需要工程师审查和理解数百万行的旧代码库和业务逻辑的手动文档,然后将这些逻辑转换为更新的代码库,并将其与其他系统集成。 与更简单的一代AI架构不同,代理可以产生高质量的内容,从而将审核周期减少20%至60%。代理还能够遍历多个系统并理解从多个来源提取的数据。最后,代理可以展示他们的工作:信用分析师可以快速钻取输入任何生成的文本或数字,访问完整的任务链并使用数据源生成生成的见解。这有助于快速验证输出。 潜在的基于代理的解决方案:AI代理商有 显着简化这一过程的潜力。可以将专门的代理部署为遗留软件专家,分析旧代码和记录和翻译各种代码段。同时,质量保证代理可以批评此文档并生成测试用例,帮助AI系统迭代地改进其输出并确保其准确性和遵守 附件2 生成的AI代理有可能通过提高生产力来改变我们的工作方式。 说明性用例:信用风险备忘录 因此,对于业务领导者来说,了解更多关于代理的信息,并考虑他们的一些核心流程或业务需求是否可以通过代理系统和能力来加速,现在还为时过早。这种理解可以为未来的路线图规划或方案提供信息,并帮助领导者保持在创新准备的边缘。一旦确定了这些潜在的用例,组织就可以开始探索不断发展的代理环境,利用API、工具包和库(例如,Microsoft Atoge、Hggig Face和LagChai)来开始了解相关的内容。 同时,该过程的可重复性质可能会产生飞轮效应,其中代理框架的组件被重新用于整个组织中的其他软件迁移,从而显着提高了生产率并降低了软件开发的总成本。 用例3:在线营销活动创建设计、启动和运行在线营销活动往往涉及一系列 不同的软件工具、应用程序和平台。在线营销活动的工作流程非常复杂。商业目标和市场趋势必须转化为创造性的运动想法。必须为不同的细分市场和地理位置创建和定制书面和视觉材料。必须使用跨各种平台的用户组对活动进行测试。为了完成这些任务,营销团队经常使用不同形式的软件,并且必须将输出从一个工具转移到另一个工具,这通常是乏味和耗时的。 为了为代理系统的出现做准备,组织应该考虑这三个因素,如果这样的系统要发挥其潜力,这将是关键: —相关知识的编纂:实施复杂的用例可能需要组织定义业务流程并将其记录到编码的工作流中,然后用于培训代理。同样,组织可能会考虑如何获取主题专业知识,这些专业知识将用于以自然语言指导代理,从而简化复杂的流程。 潜在的基于代理的解决方案:代理可以帮助连接这个数字营销生态系统。例如,营销人员可以用自然语言描述目标用户、初始想法、预期渠道和其他参数。然后,代理系统-在营销的帮助下 专业人员-将帮助开发,测试和迭代不同的运动想法。数字营销策略代理可以利用在线调查,客户关系管理解决方案的分析以及其他市场研究平台,旨在使用多式联运基础模型收集制定策略的见解。然后,内容营销,文案撰写和设计的代理商可以构建量身定制的内容,评估人员将对其进行品牌调整。这些代理商将协作以迭代和完善输出,并朝着优化活动影响同时将品牌风险降至最低的方法保持一致。 —战略技术规划:组织将需要组织其数据和IT系统,以确保代理系统可以与现有基础架构有效连接。这包括捕获用户交互以获得连续反馈,并在不中断现有操作的情况下创建集成未来技术的灵活性。 —人在回路控制机制:As 一代AI代理开始与现实世界互动,控制机制对于平衡自主性和风险至关重要(参见侧栏,“了解代理系统带来的独特风险”)。 人类必须验证输出的准确性,合规性和公平性;与主题专家合作以维护和扩展代理系统;并创建一个持续改进的学习飞轮。组织应该开始考虑在什么条件下以及如何使用这种人工机制部署。 企业领导者应该如何为代理人的年龄做准备?