您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国信证券]:2026全球模型巨头Anthropic、Google、OpenAI对比分析报告 - 发现报告

2026全球模型巨头Anthropic、Google、OpenAI对比分析报告

信息技术 2026-03-07 国信证券 我是传奇
报告封面

•一、A n t h r o p i c : 凭 专 业 生 产 力 打 造 高 毛 利 护 城 河 •核 心 团 队 成 员 、 经 营 理 念 、 算 力 储 备•模 型 能 力 : C o d i n g 、 A g e n t 场 景 下 的 S O T A 模 型•商 业 模 式 : 极 简 产 品 矩 阵 , A P I 贡 献 主 要 收 入•财 务 表 现 : 最 强 模 型 带 来 t o k e n 溢 价 , 2 8 年 有 望 迎 来 现 金 流 转 正 •二、谷 歌 : 多 模 态 能 力 领 先 , 生 态 优 势 明 显 •模 型 能 力 : 围 绕 多 模 态 能 力 打 造 模 型 矩 阵 , 综 合 性 能 领 先•商 业 模 式 : 原 生 A I 应 用 + G e m i n i 赋 能 传 统 产 品 , 云 与 广 告 受 益 增 长 •三、O p e n A I : C 端 产 品 领 导 者 , 开 始 发 力 企 业 市 场 •模 型 能 力 : 模 型 路 线 从 分 化 到 统 一•商 业 模 式 : C 端 产 品 领 导 者 , 发 力 企 业 市 场•财 务 表 现 : 收 入 预 测 持 续 上 修 ,预计2030年超过2800亿•算 力 储 备 : 星际之门项目持续推进 •四、静态理解模型的商业化市场空间 Anthropic:核心团队成员来自OpenAI,当前估值3800亿美元 •Anthropic成立于2021年5月,核心团队成员来自OpenAI,联合创始人Amodei兄妹曾分别担任OpenAI研发副总裁和安全与政策副总裁。20年末由于对认为OpenAI对安全的投入不足,以及与微软过度绑定会导致公司过度商业化,对技术的控制减弱,因此选择离开创建Anthropic。24年开始,陆续引入了外部来自谷歌、Meta、Salesforce等公司的高管。 •估值:26年2月Anthropic完成300亿美元G轮融资,其中包含25年11月来自微软和英伟达的150亿美元融资,投后估值已达到3800亿美元。 “安全与对齐”是Dario对Anthropic的绝对主张 通过梳理Anthropic创始人Dario在不同时期访谈传递的内容主旨,我们总结Anthropic在AI发展趋势下有以下几点重要思考和策略: 1.当OpenAI认为要“大力出奇迹”,先把模型弄聪明,再用人类反馈(RLHF)去修补它;Google 认为要融入全家桶生态时,Dario认为模型必须从底层架构上就是可控的、讲逻辑的、严格遵守规则的。 2.Anthropic 专注于提供企业端服务,认为 AI 在企业端的应用(主要是在企业、初创公司、开发者和高效能用户之间的生产力场景里)会超过消费端。因为商业客户的需求(如在生物化学等专业领域)能为提升模型核心智能提供更强的激励,这比面向普通消费者的应用更能推动技术突破。 3.重视编程:1)编程是AI构建的基础技能,因此也最快会被颠覆。技能与构建AI的人员距离越远,AI对其造成颠覆性影响所需的时间就越长;2)模型在编程上变强后,也会帮助训练下一个更强的模型,形成正循环。 4.定位平台公司,针对客户的核心需求开发垂直产品。对Anthropic的定位是一家平台型公司,在部分领域推出自己的产品(例如Claude code等)主要是因为:1)直接触达终端用户,能精准了解用户的使用场景、核心需求;2)很多传统企业直接基于 API 进行开发,门槛较高,需要为他们提供更易上手的方案,要么是配套的开发工具包,要么是现成的应用程序。 5.商业模式选择的思考:由于模型的快速变化,任何固定的产品形态,都有可能很快变得过时。API 的价值在于,它始终提供最接近底层能力的接口,让开发者基于最新技术构建。 6.Dario认为,我们正站在指数曲线的终点,而技术曲线与经济曲线之间存在天然的时间差,所以很多人还处于体感不明显的阶段,但是技术已经达到难以想象的水平。1)技术对生产力的提升需要形成闭环,如果只是在某个中间环节插入AI,而没有重构整个工作方式,收益会很有限,甚至是负的;2)AI完成90%的代码到完成100%的代码是生产力数量级的差异。 Anthropic模型和产品发展历程 数据来源:Anthropic、The Information、国信证券经济研究所整理 Anthropic采取多云路线,25年末加大算力建设投入 •Anthropic采取多云路线,同时使用多家芯片。根据SemiAnalysis报道,Anthropic算力来源最初主要是作为投资方的谷歌和亚马逊,25H1及以前谷歌占比较多。 •25年开始Anthropic随着收入的快速增长,25年末连续签订了多笔算力采购/建设合同。分别与谷歌(获得100万TPU/1GW支持)、微软+英伟达(300亿美元/1GW合同)签订了新的合作协议,同时宣布将投资500亿美元与Fluidstack合作进行自有数据中心的建设。 资料来源:SemiAnalysis、国信证券经济研究所整理 Anthropic:专注模型编程能力训练,企业大模型API市场份额不断攀升 •Anthropic Coding能力突出,是代码开发场景的首选。Anthropic 的势头起于 2024 年 6 月发布的Claude Sonnet 3.5,到了 2025 年 2 月的Claude Sonnet 3.7更是首次展示出“Agent 优先”的 LLM 雏形。到 2025 年 5 月,随着ClaudeSonnet 4、Opus 4 以及 Claude Code的推出,其领先优势已被彻底坐实。根据Anthropic数据,44%的流量都是与计算机和数学类职业相关,细分的使用场景中前三名的分别是调试 Web 应用程序、解决技术问题以及构建专业商业软件。此外,得益于在编程场景中的出色表现,根据Menlo Ventures,25年Anthropic在企业大模型API市场份额已经达到40%,Coding市场份额则达到54%。 资料来源:Menlo Ventures、国信证券经济研究所整理 资料来源:Anthropic、国信证券经济研究所整理 Anthropic:25年Opus系列的迭代引领了Agent时代的开启 •首款Claude模型上线于23年3月,并在24年3月Claude3开始分为不同尺寸的版本,Claude 3 Opus首次全面超越同时期的GPT-4。 •25年Opus系列的迭代引发了Agent的拐点。25年5月,Opus时隔一年推出了新一代版本,开启Agent时代,并且在年末的Opus 4.5推出后在编程、工具调用等维度均达到了SOTA水平,此后开始基于Opus4.5出现OpenClaw、ClaudeCowork等优秀的Agent产品。 资料来源:lifearchitect.ai、国信证券经济研究所整理 Opus 4.5在复杂任务的交付率上实现质的飞跃 •Opus 4.5在编码上扮演了自主性极高的AI工程师角色。举例:以前让模型“写一个 Python 函数来抓取网页”,然后“把这个基于 Django 的老项目迁移到 FastAPI,并重构数据库模型”,模型容易混淆格式,导致代码跑不起来。但是Opus 4.5 能“脑补”出整个项目的 50+ 个文件之间的引用关系。修改 A 文件时,它会自动意识到 B、C、D 文件也需要调整。Opus代码的一次性通过率显著优于其他代模型。 •此外,Opus 4.5在定价上采取了更平衡性的市场策略,通过“effort”参数提供了前所未有的成本与性能调控精度。 “effort”参数 编码能力 性价比 Opus 4.5引入“effort”参数通过资源调控器,实现精细化成本与性能管理。 ·场景化性能匹配:根据任务的重要与复杂性,在高、中、低模式间灵活切换。·高效的资源利用:在各模式下,都能在性能超越前代模型的同时,大幅减少资源消耗,极大提升计算资源投入效率。·企业级部署优化:使企业IT基于业务实现大规模、可持续的AI应用部署。 Opus 4.5的编码优势为一种端到端从高效执行到全流程的自主软件工程能力。 Opus 4.5的定价策略实现性能与成本平衡的突破,以低成本提供旗舰级智能。 ·价格门槛大幅降低:以显著低价提供同等甚至更优的顶级智能体验。 ·重塑市场竞争力:企业用户获得行业领先的编码、推理与多模态能力,降低了尖端AI技术投入的总体拥有成本。 Opus 4.5与不同工具的交互能力达到生产级别可用 •Opus 4.5在工具与生态上的演进,对内模型能力、对外开发生态、对下部署平台三位一体的协同设计,让AI Agent从概念验证,更近一步走向了规模化落地,标志其角色从单一的模型调用转变为智能体生态系统的核心引擎。 •Claude 3.5 时期推出的 Computer Use(操作电脑)在 4.5 Opus 上达到了生产级可用。Claude 4.5 Opus 的能力包含:1)像人一样看屏幕:它能直接看 GUI(图形界面),它能处理“去 SAP 系统里把上个月的财务报表导出来,然后发邮件给张总”;2)视觉与逻辑的融合:如果网页弹出了一个“从没见过的广告窗”挡住了按钮,以前的 Agent会卡死或报错。Opus 4.5 能理解弹窗。并模拟人类点 X 把它关掉,再继续操作。意义:这直接打通了所有没有 API的老旧企业软件(Legacy Enterprise Software)。它就是一个不知疲倦的 RPA 机器人,但不需要写规则。 图:Opus4.5工具与生态 模型内核 企业平台 开发生态 Opus 4.5从API延伸到开发者日常工具中,将顶尖能力无缝嵌入专业工作流。 Opus 4.5设计与Amazon Bedrock深度集成,提供生产级智能体的部署与管理底座。 Opus 4.5在底层能力上更强大可靠,为智能体注入自主发现与精准执行的能力。 ·深度集成开发环境:通过全面升级,将编码与智能体能力嵌入IDE,能获得从代码生成、bug修复到系统重构的端到端AI辅助。 · AgentCore基础设施:提供持久化内存、Tool Gateway以及内置的安全与访问控制。 · 动态工具发现:支持动态工具搜索,按需筛选并加载当前任务工具,不背负冗余资源。 ·生产级可观测性:通过集成,企业可以实时跟踪智能体工作流中的Token信息,实现透明的成本与性能管理。 · 精准工具调用:支持直接嵌入调用示例,显著提升复杂工具调用的准确性和可靠性。 ·赋能浏览器与办公软件:通过Chrome扩展和Excel升级,直接作用于网页内容分析、浏览器任务自动化以及复杂的电子表格处理。 · 编程式工具调用:支持编程式工具调用,开发者可以在代码中直接结构化地调用工具。 ·支持长时任务:提供长时间工作流支持,处理数小时的复杂分析、开发或自动化流程。 资料来源:Anthropic官网、Openrouter、X,国信证券经济研究所整理 Opus 4.5模型性能对比、测评成绩 •根据官方测试反馈,Opus 4.5对模糊需求的理解力得到了明显提升,复杂Bug自行定位也更稳定。 •在真实场景的软件工程测试SWE-Bench Verified里,它是第一个拿到80%以上分数的模型;在视觉、推理和数学方面的测试都比前代模型更强,并且在多个重要领域都达到业界领先水平。 资料来源:Anthropic官网,国信证券经济研究所整理 Claude系列模型支持Agent独立完成任务长度的时间明显领先 •Claude模型迭代的一个非常重要的变化是:能够完成的任务时长增加。根据METR,过去六年里,这一指标持续呈指数级增长,平均每七个月翻一番,目前Opus 4.6已经突破了1小时,由此推断,不到十年,我们将看到人工智能代理能够独立完成目前人类需要花费数天甚至数周才能完成的大部分软件任务。 资料来源:METR、国信证券