您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[PitchBook]:PitchBook - 新闻间简报 : LLM 代理(汉) - 发现报告

PitchBook - 新闻间简报 : LLM 代理(汉)

2024-11-18-PitchBook李***
AI智能总结
查看更多
PitchBook - 新闻间简报 : LLM 代理(汉)

Ali Javaheri新兴技术分析师 ali. javaheri @ pitchbook. com 最初发布于 2024 年 9 月 18 日 趋势公司 Overview 大型语言模型(LLM)代理代表了人工智能领域的新兴技术。这些系统利用先进的语言模型处理复杂的指令、制定计划并跨多个领域执行任务。大型语言模型代理的关键特性包括任务分解能力、与外部工具和API的集成、适应性学习潜力以及在交互中保留上下文的能力。 LLM代理的发展可能对各行各业的生产效率提升和运营流程优化产生潜在影响。 背景 大型语言模型(LLM)代理的发展根植于自然语言处理和机器学习的进步。尽管代理在强化学习研究中是一个古老的概念,但LLM代理是相对较新的产物,与变压器模型同步发展。LLM代理的发展有望在各行各业提升生产效率并简化运营流程。 现代概念中的一些关键里程碑包括 : •2010 年初 :深度学习技术和神经网络的进步 , 为更复杂的语言模型奠定了基础。 •2017:变压器架构被引入,显著提高了大型语言模型(LLMs)训练的效率。DeepMind的代理模型AlphaZero学会了掌握围棋、国际象棋和将棋(日本国际象棋)等游戏,分别在这三种游戏中达到了超人类的表现,并展示了AI利用蒙特卡洛树搜索进行基于强化学习的任务执行能力。1 要访问更多此类数据和 PitchBook 的新兴空间工具 , 请访问免费试用链接here. •2018-2020:OpenAI 发布了 GPT(生成性预训练变换器)系列,展示了增强的语言理解与生成能力。 •2020-2022:任务特定的微调和提示工程技术 emergence,使语言模型的应用更加针对性。 •••2024 年 3 月 :LLM原生软件工程项目Devin在使用代理架构的情况下,在代码生成基准测试中创下新纪录。2023 年 4 月 :开源大语言模型代理项目Auto-GPT成为历史上增长最快的GitHub仓库,展示了自主AI代理完成多步任务的潜力。2July 2023:OpenAI 发布了代码解释器 , 它展示了 LLM 代理理解和生成复杂代码的能力。3 这一进展表明聊天界面正迅速发展为更加复杂且以任务为导向的系统。该领域涵盖了各类公司,既有成熟的技术企业,也有初创公司在探索大型语言模型代理在各个行业的应用。 技术和流程 作为将基础模型连接到软件工具的系统,LLM代理通常包含几个关键组件: •大型语言模型 :作为语言理解和生成的主要处理单元。 •提示系统:允许用户提供指导代理行为和目标的说明。 •内存机制 :包括用于即时任务的短期记忆和用于交叉交互信息保留的长期记忆。 •知识库:可以通过微调集成到模型中或通过检索从外部访问的用户存储库。 •规划模块 :通过使用链式思维或树状思维等技术实现复杂任务的分解与解决方案的制定。4 •工具集成 : 允许与外部系统交互。 有关 LLM 代理商市场机会的分析 , 请参阅我们的2023 年第三季度人工智能与机器学习报告. 代理商仅是PitchBook AI分析师Brendan Burke概述的LLM运营(LLMOps)栈中的一部分,相关市场地图详见他的文章。分析师工作区. •代理框架 :低代码软件开发工具包 , 用于构建代理系统。 •多模型编排器:框架 , 如微软的 AutoGen ,5在复杂任务上实现多个专门模型之间的协作。 近期该领域的技术进步包括增强的工具功能,如函数调用和浏览能力,改进的长期记忆和学习框架,以及用于处理复杂多步骤问题的多代理系统。 Applications LLM 代理展示了不同行业的潜在应用 : ••••••••教育 : 支持自适应学习系统和个性化辅导。销售和营销 :协助个性化内容创建和营销活动管理。科学研究 :协助文献综述、假设生成和实验。客户服务 :用于上下文感知支持系统 , 这是初创公司共同关注的焦点。软件开发 :用于自动化编码和调试过程。由初创公司Cognition开发的代理Devin用于编写和评估代码。金融服务 :应用于自动化财务建议和投资组合管理;诸如Generative ALPHA之类的初创公司正在这一领域开展工作。法律服务 :促进合同分析和法律研究支持。法律创业公司Harvey目前正使用OpenAI的o1来开发法律代理。6医疗保健 :在 Health Force 和 thoughtful. ai 等公司的管理系统中使用。 LLM 代理的多功能性表明有可能将手动流程设计到可编程系统中。 局限性 大语言模型代理展现出显著的潜力,但其更广泛的采用取决于解决若干关键挑战。其中,准确性和可靠性尤为关键。确保这些代理能够一致地执行任务且不出错至关重要,尤其是在医疗保健和金融等高风险环境中,即使是细微的错误也可能产生严重后果。另一个主要问题是可扩展性。大规模部署大语言模型代理需要大量的计算资源,并且需要自动使用昂贵的云信用额度。组织将需要仔细评估代理带来的潜在成本节约。 数据隐私和安全也是至关重要的考虑因素,尤其是在LLM代理经常处理敏感或机密信息的情况下。必须采取 robust 的安全措施以防止数据泄露,特别是在有严格监管要求的行业,如银行业和医疗保健业。有效保护数据的能力将是维持合规性和信任的关键。 伦理考虑进一步复杂化了LLM代理的部署。随着这些系统在决策方面变得更加自主,关于偏见、公平性和问责制的问题变得越来越重要。在需要公正性至关重要的领域,如法律和公共政策,解决这些问题尤为紧迫。用户信任是采用LLM代理的一个无形但至关重要的因素。建立对这些系统可靠性和决策过程的信心对于其成功实施至关重要。建立信任可能需要增加对代理运作和决策过程的透明度,以确保用户对其能力感到信心满满。 LLM代理的集成到现有工作流程中带来了额外的挑战。成功的实施不仅要求这些代理能够补充当前的过程,还需要提升现有流程。不良的集成可能导致效率低下,并扰乱业务运营,从而削弱这些代理带来的潜在益处。监管合规性构成了另一层复杂性。随着各国政府和监管机构细化人工智能治理框架,组织将需要应对不断变化的规则和法规环境。对于在多个司法管辖区运营的公司来说,这可能会使部署策略复杂化,尤其是在人工智能相关立法存在不一致的情况下。 近期交易活动和市场前景 The AI代理市场在智能过程自动化领域拥有庞大的可addressable市场。目前,基于AI的自动化占过程自动化市场的19.2%,达到2023年的55亿美元,并预计到2026年将达到24.3%,这主要是由于生成式AI技术的进步,据我们所知。2023 年第三季度 AI & ML 报告虽然LLM代理尚未捕获市场份额,但供应商正在考虑推出集成LLM的功能。竞争格局包括传统科技公司、企业软件提供商以及新兴初创企业。 基础模型领导者OpenAI、Anthropic和微软正在提升AI代理的能力。OpenAI推出了其模型的工具使用应用,而Anthropic则与亚马逊网络服务(AWS)合作开发了亚马逊Bedrock代理。此外,包括微软、英伟达和Salesforce在内的公司正在研发高级代理应用,以实现对企业用户的定制化功能。Salesforce首席执行官马克·贝尼奥夫最近宣布,该公司将进行“硬性转向”,专注于定制代理。7 初创企业可能通过以行动为导向的模型来定义这一领域,从而减少对定制代理工程的需求。例如,Adept 在早期 2023 年实现了独角兽企业的地位,主要得益于其代理能力以及开源 Fuyu 模型的发布。此后,它与亚马逊达成了授权协议。Imbue 在 2023 年 10 月完成了一轮 2.12亿美元的 B 轮融资,由 Astera 研究院、NVIDIA 和 Further Future 基金领投,这些机构专注于构建能够进行推理和代理行动的模型。Norm AI 在 2024 年 6 月完成了由 Coatue 管理公司领投的 3830 万美元的 A 轮融资,旨在开发能够自主进行合规性判断的代理,以应对严格监管领域的关键需求。 标准。其他方法在我们的关于基础模型体系结构的分析师说明. 几种趋势正在影响AI代理市场的未来发展方向。一个重要的发展是向多模型协调器的转变,这些协调器协调专门模型之间的行动,从而实现更复杂的自动化。8还有持续的努力将先进的能力融入其中,例如视觉模型,这些模型使AI代理能够与更多种类的数字内容进行交互。开源项目如AutoGPT和AgentGPT在开发者社区中势头增强,进一步扩展了AI代理的生态系统。 随着技术的不断发展,AI代理预计将在业务运营和日常活动中得到更广泛的整合。这一整合有可能颠覆传统商业模式和数字界面,同时为各行业带来生产率提升。然而,实现这些成果将取决于克服与准确度、安全性、可扩展性和合规性相关的一系列挑战。市场的发展轨迹将受到这些领域技术进步以及更广泛的社会对AI在决策角色中接受程度的影响。对于投资者和行业利益相关者而言,监控多模型编排、高级推理能力和行业特定应用的发展至关重要。这些因素很可能推动AI代理市场的下一阶段创新。