AI智能总结
阿里·贾瓦赫里分析师,新兴技术 ali.javaheri@pitchbook.com 原发表于2024年9月18日 概述 趋势公司 大型语言模型(LLM)代理代表了人工智能领域的一种新兴技术。这些系统使用高级语言模型来处理复杂的指令,制定计划并在各个领域执行任务。LLM代理的关键特征包括任务分解能力、与外部工具和API的集成、适应性学习潜力以及交互过程中的上下文保持。 LLM代理的发展对提高各行业的生产力和运营流程简化具有潜在影响。 背景 LLM代理的演变根植于自然语言处理和机器学习的进步。虽然代理在强化学习研究中是一个古老的概念,但LLM代理是近期出现的,与Transformer模型同步发展。LLM代理的发展有可能提高各行业的生产力和简化运营流程。 现代概念的一些关键里程碑包括: • 2010年代初:深度学习技术和神经网络的发展,为更高级的语言模型奠定了基础。 • 2017:Transformer 架构被引入,显著提高了训练大型语言模型(LLM)的效率。DeepMind 的代理模型 AlphaZero 学习掌握了包括围棋、国际象棋和将棋(日本象棋)在内的游戏,在这三种游戏中都实现了超人类的表现,并展示了人工智能利用蒙特卡洛树搜索进行强化学习执行任务的能力。1 为了访问更多数据和PitchBook的“新兴领域”工具,请访问免费试用链接这里. • 2018-2020:OpenAI发布GPT(生成预训练转换器)系列,展示了增强的语言理解和生成能力。 • 2020-2022:特定任务的微调和提示工程技巧出现,使得语言模型的应用更加精准。 • 2023年4月:开源LLM代理项目Auto-GPT成为史上增长最快的GitHub仓库,展示了自主AI代理完成多步骤任务的潜力。2 • 2023年7月:OpenAI发布Code Interpreter,展示了大型语言模型代理理解并生成复杂代码的能力。3 • 2024年3月:LLM原生软件工程项目Devin使用代理架构在代码生成基准测试上创造新纪录。 这一进展表明从聊天界面到更复杂的、以任务为导向的系统的发展迅速。该领域包括了探索各种领域LLM代理应用的传统技术公司和初创企业。 技术和工艺 作为连接基础模型与软件工具的系统,LLM代理通常包含几个关键组件: • 大型语言模型:作为语言理解和生成的主要处理单元。 • 快速系统:允许用户提供指令以引导代理行为和目标。 • 记忆机制:包括短期记忆以处理即时任务,以及长期记忆以保留跨交互信息。 • 知识库:用户存储库,可通过微调集成到模型中,或通过检索外部访问。 • 规划模块:通过诸如思维链或思维树技术等技术,实现复杂任务分解和解决方案制定。4 • 工具集成:允许与外部系统进行交互。 关于LLM代理市场机遇的分析,请参阅我们的2023年第三季度人工智能与机器学习报告代理商只是PitchBook AI分析师Brendan Burke在其LLM操作(LLMOps)市场地图中概述的LLMOps堆栈的一部分,该地图可在他的[此处]获取。分析师工作空间. • 代理框架:低代码软件开发套件,用于构建智能系统。 • 多模型编排器:框架,例如微软的AutoGen,5使多个专业模型在复杂任务中实现协作。 近期该领域的科技发展包括增强的工具功能,如函数调用和浏览,改善的长期记忆和学习框架,以及用于处理复杂、多步骤问题的多代理系统。 应用 LLM代理在各个领域展现了潜在的应用前景: •客户服务:在情境感知支持系统中使用,这是初创企业中的一个常见焦点。 •金融服务:应用于自动化金融咨询和投资组合管理;如Generative ALPHA这样的初创公司正在这个领域工作。 •医疗保健:用于Health Force和thoughtful.ai等公司行政系统的应用。 •软件开发:用于自动化编码和调试流程。由初创公司Cognition开发的代理Devin使用,用于编写和评估代码。 •销售与营销:协助个性化内容创作和宣传活动管理。 •法律服务:促进合同分析和法律研究协助。法律初创公司Harvey目前正在使用OpenAI的o1开发法律代理。6 • 教育:支持适应性学习系统和个性化辅导。 •科学研究:助文献综述、假设生成和实验研究。 LLM代理的多功能性表明了将手动流程工程化到可编程系统中的潜力。 限制 LLM代理具有巨大的潜力,但它们的更广泛采用取决于解决几个关键挑战。在这些挑战中,准确性和可靠性是突出的关键问题。确保这些代理能够持续执行任务而不出错是至关重要的,尤其是在医疗和金融等高风险环境中,即使微小的错误也可能产生严重后果。另一个主要问题是可扩展性。在大规模部署LLM代理需要大量的计算资源,并自动使用昂贵的云信用额度。组织需要仔细评估代理可能带来的成本节约。 数据隐私和安全也是至关重要的考虑因素,尤其是在大型语言模型(LLM)代理经常处理敏感或机密信息的情况下。必须采取强有力的安全措施来防止泄露,特别是在具有严格监管要求的行业,如银行和医疗保健行业。有效保护数据的能力将是维持合规性和信任的关键。 道德考量进一步复杂化了LLM代理的部署。随着这些系统在决策方面越来越自主,关于偏见、公平性和问责制的问题变得越来越重要。在公正性至关重要的领域,如法律和公共政策,解决这些担忧尤为迫切。用户信任是LLM代理采用中的一个无形但至关重要的因素。建立对这些系统可靠性和决策过程的信心对于它们的成功实施至关重要。建立信任可能需要提高对代理如何运作和作出决策的透明度,确保用户对其能力感到自信。 将大型语言模型(LLM)代理整合到现有工作流程中带来了额外的挑战。成功实施需要这些代理不仅补充而且增强现有流程。不良的整合可能导致效率低下并扰乱业务运营,削弱这些代理带来的潜在效益。合规性监管代表了一个更复杂的层面。随着政府和监管机构完善人工智能治理框架,组织将需要在不断变化的规则和法规环境中航行。对于在多个司法管辖区运营的公司,这可能会使部署战略复杂化,特别是在人工智能相关立法不一致的地区。 近期交易活动和市场展望 人工智能代理市场在智能流程自动化领域拥有庞大的潜在市场。目前,AI驱动的自动化占流程自动化市场的19.2%,到2023年达到55亿美元,预计到2026年将达到24.3%,这一增长得益于生成式AI的进步,据我们分析。2023年第三季度AI与机器学习报告尽管LLM代理尚未抢占市场份额,但供应商正在考虑推出LLM集成功能。竞争格局包括 Established technology companies, enterprise software providers, and emerging startups。 基础模型领导者OpenAI、Anthropic和微软正在提升人工智能代理的能力。OpenAI为其模型推出了工具使用应用,而Anthropic已与亚马逊云计算服务合作开发亚马逊Bedrock的代理。此外,微软、英伟达和Salesforce等公司正在研发高级代理应用,以便为企业管理用户提供定制服务。Salesforce首席执行官马克·贝尼奥夫最近宣布,公司将进行“硬转型”,专注于定制代理。7 初创公司可能通过行动导向的模型来定义这一领域,这些模型可以减轻定制智能体工程的需求。例如,Adept在2023年初实现了独角兽地位,这主要归功于其智能体能力和开源Fuyu模型的发布。此后,它与亚马逊签订了许可协议。Imbue在2023年10月完成了一轮2120万美元的B轮融资,由Astera Institute、NVIDIA和Further Future Foundation领投,该机构专注于构建能够进行推理和智能体行为的模型。Norm Ai在2024年6月完成了一轮3830万美元的A轮融资,由Coatue Management领投,专门用于开发能够进行自主合规性决定的智能体,以满足严格监管行业的核心需求。 标准。其他方法概述于我们的文档中。分析师关于基础模型架构的笔记. 若干趋势正在影响AI代理市场未来的发展方向。一个显著的发展趋势是转向多模型协调器,这些协调器协调不同专业模型之间的行动,从而实现更复杂的自动化。8也存在一项持续的努力,以融入先进功能,如视觉模型,这些模型使AI代理能够与更广泛的各种数字内容互动。如AutoGPT和AgentGPT等开源项目在开发者社区中逐渐获得势头,进一步扩展了AI代理的生态系统。 随着技术的不断发展,预计人工智能代理将被更广泛地集成到商业运营和日常活动中。这种集成有可能颠覆传统的商业模式和数字界面,同时为各行业的生产率提升做出贡献。然而,实现这些成果将取决于克服与准确性、安全性、可扩展性和合规性相关的问题。市场的轨迹可能会受到这些领域技术进步的影响,以及更广泛社会对人工智能在决策角色中接受度的影响。对于投资者和行业利益相关者来说,监测多模型编排、高级推理能力和行业特定应用的发展至关重要。这些因素很可能会推动人工智能代理市场下一阶段的创新。 推荐阅读 • “基于LLM的代理的未来:让盒子更大,”Arcus,2024年7月17日。 •引言:LLM代理介绍,Nvidia开发者,Tanay Varshney,2023年11月30日。 •大型语言模型革命了人工智能。LLM代理是下一个趋势,IBM,Kim Martineau,2024年7月18日。 • “由LLM驱动的自主代理,”GitHub Lil’Log,李雯,2023年6月23日。