您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[Bernstein]:全球软件:与领先人工智能研究员关于智能体人工智能讨论的要点 - 发现报告

全球软件:与领先人工智能研究员关于智能体人工智能讨论的要点

信息技术2025-06-02Bernstein�***
AI智能总结
查看更多
全球软件:与领先人工智能研究员关于智能体人工智能讨论的要点

2025年6月2日 全球软件 我们与一位领先的人工智能研究员就自主式人工智能的讨论要点 马克·L·莫德勒博士 +19173448506mark.moerdler@bernsteinsg.com FirozValliji,CFA +19173448316firoz.valliji@bernsteinsg.com 唐雪,CFA +19173448342shelly.tang@bernsteinsg.com 代理式人工智能是生成式人工智能领域的最新热门话题,我们领域中的大多数软件公司已经推出某种形式的人工智能代理或代理式平台来帮助提高生产力。但是到目前为止,除了早期测试者的轶事和反馈之外,我们对这项技术的需求及其成熟程度知之甚少。正如我们在最近的入门指南中讨论的全球软件入门:生成式人工智能301——推理模型,我们相信,具身智能(AgenticAI)仍处于形成初期。 为了进一步深入了解底层运作机制和前沿研究动态,我们最近举办了一场非常有趣的关于自主型人工智能的讨论,与嘉宾是哈佛脑科学中心的AI研究员拉乌里德·巴特拉戴博士以及麻省理工学院脑、心智与机器研究中心。我们在此总结了讨论要点。您也可以观看这里重播. 尽管关于这一主题的讨论既深入又广泛,但关键要点涉及:(1)什么是自主人工智能;(2)幻觉的问题;(3)我们何时会看到人工智能代理的爆发;(4)多代理系统和代理间通信;(5)关于Deepseek影响的评论;以及其他主题。 参见本报告的披露附录,其中包含所需的披露信息、分析师认证以及其他重要信息。或者,您可以访问我们的全球研究披露网站首次出版:2025年6月2日08:00UTC完成日期:2025年6月1日17:49UTC www.bernsteinresearch.com 股票 评分 5月30日 2025 关闭 目标价 价格 TTM 相关性能。 调整后每股收益调整后的市盈率(x) 2024A2025E2026E2024A202 BERNSTEIN股票行情表 5E2026E ADBDE O美元415.09525.00(19.8%)美元18.4321.1324.10 22.5 19.6 17.2 HUBS M美元589.90708.00(15.6%)美元8.129.5011.34 11.3 9.6 8.2 MSFT O美元460.36520.00(1.9)%美元11.8013.4515.38 39.0 34.2 29.9 MDB O美元188.83312.00(52.0)%美元2,0062,3592,768 6.6 5.6 4.8 ORCL O美元165.53207.0028.5%美元5.566.017.06 29.8 27.5 23.4 CRM U美元265.37美元255.008.8%美元10.19美元11.34美元12.68 26.0 23.4 20.9 SAP O美元302.86324.0055.1%欧元4.496.817.66 59.5 39.2 34.8 SNOW M美元205.67191.0033.0%美元3,6264,6105,722 18.6 14.6 11.8 WDAY O美元247.71325.006.5%美元7.289.0110.62 34.0 27.5 23.3 SPX 5,911.69 O-表现优于市场,M-市场表现,U-表现逊于市场,NR-未评级,CS-覆盖暂停的MDB,SNOW预测为收入(M);HUBS,MDB,SNOW估值为EV/销售额(x);MDB,CRM,SNOW,WDAY基准年为2025年;来源:彭博,伯恩斯坦估计和分析。 投资影响 代理式人工智能仍处于早期阶段,未来还有大量技术创新。现在可以构建非常精准的代理来解决非常专门的问题。我们将此视为SAP、Oracle、Workday和Adobe的重点。微软、Oracle、SAP和Salesforce也在为组织构建代理式人工智能平台,但如本文所述,虽然精准代理现在可以构建,平台需要时间才能足够强大,以及复杂的客户定制代理足够可靠。换句话说,平台是长期目标,可能需要3年(或更长时间)才能达到公司想要成熟水平。 估值可比表格 5/30/2025 每股净现金 自由现金流(最近12个月) 收入增长 估值倍数 公司 分享价格 $ 占比 价格 每股(美元) %收率 NTM(%) 市盈率/非经常性收入 损益 P/FE 价格/自由现金流(LTM) PEG比率 伯恩斯坦覆盖率 艾德鲁意 $415.09 1.96 0.5% 20.66 5.0% 8.8% 7.3x 19.9x 19.2x 1.5x 微软 $460.36 (3.40) (0.7%) 9.29 2.0% 13.4% 11.3x 31.7x 49.3x 2.6x 甲骨文 $165.53 (27.46) (16.6%) 2.03 1.2% 12.6% 8.6x 25.9x 79.9x 3.3x MongoDB $188.83 30.35 16.1% 1.62 0.9% 13.3% 5.8x 72.7x 127.9x 11.5x saasforce.com $265.37 5.55 2.1% 13.02 4.9% 9.0% 5.9x 22.8x 20.1x 2.0x HubSpot $589.90 26.79 4.5% 9.45 1.6% 15.9% 9.4x 59.9x 63.6x 2.9x SAP $302.53 2.64 0.9% 4.50 1.5% 9.0% 9.6x 41.4x 70.1x 4.1x 雪花 $205.67 3.68 1.8% 2.21 1.1% 24.3% 14.1x 170.8x 93.3x 8.6x 工作日 $247.71 17.01 6.9% 8.63 3.5% 12.9% 6.3x 27.7x 28.5x #N/AN/A 其他组件 Autodesk $296.12 (2.33) (0.8%) 7.55 2.5% 12.8% 8.9x 29.8x 38.7x 2.1x 服务现在 $1,011.09 20.11 2.0% 17.64 1.7% 18.6% 15.1x 58.5x 56.9x #N/AN/A 阿马杜斯 $83.29 (4.87) (5.9%) 4.64 5.6% 7.0% 5.9x 21.5x 17.9x 3.0x datadog $117.88 7.15 6.1% 2.32 2.0% 19.0% 11.3x 65.9x 48.9x 8.6x 来源:彭博,伯恩斯坦分析 详细信息 我们最近与哈佛大学脑科学中心的人工智能研究员RuairidhBattleday博士以及麻省理工学院的脑、心智与机器中心进行了一场非常有趣的关于自主式人工智能的讨论。我们总结了关键的要点如下,完整的网络研讨会请关注网络研讨会回放链接在此. 什么是智能体AI? •什么是人工智能代理?一个代理是某种通过作用于数字或物理世界,以智能方式进行行动,从而服务于人类目标的工具,可能需要多步推理和潜在新颖工具的使用。思考代理式人工智能随着时间发展的一个有益方式是思考我们要求计算机系统完成的任务。如果该任务需要多步推理、在数字世界中复杂工具的使用,那么就需要一个代理。在那之前可能有其他任务一个代理可能不是必需的,但可能比普通的生成式人工智能模型做得更好。 •这里有三个主要组件:模型(LLM)、工具和推理过程。一个AI代理的完整形式不仅仅是一个直射生成工具,而能通过一个复杂任务进行推理,并以动态的方式适应环境。因此,除了模型之外,它们还有两个额外的组件:推理和工具。 •推理:自从OpenAI发布o1模型以来,很多推理算法开始尝试模拟人类前额叶皮层的作用,即尝试理解被呈递的记忆是否真 实;是否有用;以及如何通过推理过程进行更广泛的泛化。我们最近写了一篇关于什么是推理模型以及它是如何构建的入门指南:全 球软件入门:生成式人工智能301——推理模型 •工具使用:智能体将比人类拥有更多工具,因为它们的输出空间是无边界的数字空间,而人类的输出空间仅限于运动。未来我们将在这一领域看到非常有趣的发展。目前,很多范式都基于智能体像人类一样使用鼠标和光标(例如OpenAI的Operator)。这仅仅是因为我们有更多关于人类行为的数据,但数字世界还有更多的结构等待我们去发掘并让智能体使用。 幻觉问题 •目前幻觉率仍然很高。最新版OpenAI模型GPT-4.5仍然经常出现幻觉(有些人说有三分之一的时间)。这种幻觉率取决于任务 ,在文本摘要时可能较低,而在要求具体知识或当前新闻时可能较高。 •为什么会产生幻觉?答案部分与数据相关,部分与训练算法相关。在数据方面,会有杂乱的数据,模型学习了错误的信息。在算法方面,有两部分。首先,transformer架构(LLM的基础)在学习能力上存在一个基本限制。其次,在发展阶段(预训练或微调)中的LLM被鼓励具有一定的可变性,以便产生创造力,但这会影响其回答绝对问题时精确的程度。 •如何减少幻觉?事实是无人知晓。一部分人认为这是在优化当前配置。这一派认为我们已拥有合适的底层架构,即Transformer架构。虽然它本身总会产生幻觉,但我们可以通过添加推理(自我批评、逐步推理、利用推理进行网络搜索)等模块来减少幻觉。 另一派人则认为这是数据问题。认为幻觉的产生仅仅是因为数据还不够,我们需要收集更多数据。还有第三派人认为也许Transformer并非最佳架构,当前预训练加后训练的设置最终并非正确方案。目前尚无定论。 智能体AI时间线:我们何时会见证AI智能体的爆发? •我们处于“晚期婴儿期”的阶段广义而言,人工智能研究人员似乎已经掌握了正确的组件(转换器模型、微调、工具使用、推理、MCP框架等)。虽然它们都不是完美的,但它们已经达到了一个相当成熟的阶段并且正在协同工作。 •泛化挑战:在机器学习的历史中,一个苦涩的教训是更通用的算法总会取代更具体的算法,目前许多代理系统都是为了非常具体的任务而设立的。也就是说,在提示中,人类用自然语言向代理详细说明它需要做什么,每个工具如何工作以及它应该如何与其他代理进行沟通。这种设置,即在一个基于自然语言描述的旧系统上构建代理系统,非常脆弱,因为系统在不断变化,而以这 种方式构建使得泛化变得困难。 •什么时候能力会成熟?有没有指标?巴特拉博士认为,直到智能体能力能够达到可以按设定后无需再管的方式部署的水平,大约需要三年时间。目前,在数学和科学等正式学科方面取得了显著进展,但它尚未完全转移到常识领域的推理上。例如,当类似OpenAI的Operator在非常普遍的方式下运行良好时,这将是一个好迹象,表明用于智能体人工智能的核心算法已经成熟。 •我们什么时候会看到人工智能代理的爆炸式增长?一旦能力开始趋于平稳(成熟),就需要后续发展基础设施才能实现这一点。除了算法的进步,我们还必须理解实现下一代互联网所必需的基础设施,在这种互联网中,人类与智能体互动,智能体与智能体互动 ,并构建该基础设施。这会花费更长的时间,或许比能力发展3年时间线多出几年。 多智能体系统与智能体间通信 •从单智能体到多智能体系统。如果一个任务可以被真正地规定好并且可以收集大量数据,那么这是一个可以很快实现的自主工作流程。然而,接下来需要更多时间的阶段是一个多智能体系统,其中计算随着智能体数量的增加而扩展。 •使用多个智能体一起是否会减少或增加幻觉?答案取决于在智能体之间付出的努力量。如果一个了解问题的结构或工作流程,以及智能体可能犯的错误,那么已有研究表明,通过推理将智能体连接起来可以减少错误。相反,在复杂环境中以非常一般、开放的方式将它们连接在一起还不太有效。我们还没有用于将它们对齐的算法。 •什么是多智能体通信?我们理解,目前例如OpenAI,致力于一个非常集中的计算范式,其中所有智能体都使用相同的基础模型 ,它们可以通过上下文或提示进行个性化或定制。没有额外的学习,但信息以文本形式提供(上下文学习)