证券研究报告 行业专题报告/2025.10.12 核心观点 投资评级:看好(维持) ❖全球大模型Agent能力产业化加速落地。2025年9月以来,全球大模型领域发展主线从“参数规模竞赛与榜单跑分”转向“Agent能力嵌入系统与核心入口”,海外厂商如OpenAI、Anthropic、Google各有技术与商业化推进,国内厂商围绕“模型—入口—算力”协同布局且产业三角架构初成。本轮变革核心是大模型从“单一语言交互的能说会答”升级为“多模态感知的能看会做、全链路可控可管”,并从单点技术突破转向系统化能力构建,产业化落地持续加速。 内容、Agent、入口三线推进:海外头部厂商的AI系统升级路径。OpenAI、Anthropic、Google等海外厂商的共同方向,是用产品形态与系统接口承载Agent,让模型从“能说会答”升级到“能看会做、可控可管”,并把入口(浏览器/家庭)与工具链(SDK/测试/安全)做厚,推动从技术演示向产业化落地的迁移。 分析师杨烨SAC证书编号:S0160522050001yangye01@ctsec.com 联系人陈梦笔chenmb01@ctsec.com 模型—入口—算力三线合围的中国路径。阿里巴巴、腾讯、字节、百度、快手、华为等国内厂商的共同方向,是以“旗舰基模”确立能力上限,以“Agent/ADP/ADK”打通开发与运维,以“算力与计量服务”稳定供给,再辅以“视频/图像生成的性价比迭代”打开应用规模。整体链路从“模型→平台→入口/场景→供给侧”逐步闭合,向“能看会做、可控可管”的系统能力收敛。 相关报告 1.《数据库与AI的深度融合》2025-09-262.《2025三季度板块业绩前瞻》2025-09-243.《坚定国产AI芯片主线信心》2025-09-21 海内外AI升级共振:从“会说”到“会做”,由点到链的系统化升级。当前AI产业已步入规模化落地关键阶段,下一阶段竞争核心聚焦“工程化的三角”体系构建——涵盖Agent工程化、入口承载力、供给侧计量三大维度,叠加资本与资源耦合的差异化路径,最终将收敛至“通用智能即基础设施”的产业终局。海内外发展核心差异体现在节奏与财务结构选择:海外企业凭资本、技术优势加速通用智能前沿探索,但需承担高研发投入与财务风险;国内企业依托场景复用及成本控制,以稳健节奏推进并侧重“规模化盈利”,却需警惕技术迭代滞后风险。未来,在“节奏把控”与“财务健康”间实现平衡者,将在“通用智能基础设施”终局竞争中占据主导地位。 ❖投资建议:见正文。 ❖风险提示:技术迭代不及预期的风险;商业化落地不及预期的风险;政策支持不及预期风险;全球宏观经济风险。 内容目录 1全球大模型Agent能力产业化加速落地......................................................................32内容、Agent、入口三线推进:海外头部厂商的AI系统升级路径....................................43模型—入口—算力三线合围的中国路径.......................................................................64海内外AI升级共振:从“会说”到“会做”,由点到链的系统化升级...............................105投资建议.............................................................................................................136风险提示.............................................................................................................13 图表目录 图1:Claude、Gemini、GPT、Qwen等海内外大模型在LMArena中排名前列...............3图2:OpenAI CEO Sam Altman以自己为素材,Sora 2为基座,生成不同场景的AI视频.4图3:Claude Sonnet 4.5 SWE-bench获SOTA.......................................................5图4:Claude Sonnet 4.5错误行为得分再上台阶.........................................................5图5:Gemini in Chrome(个人网页版AI助理).........................................................5图6:Gemini 2.5 Computer Use循环推进任务...........................................................5图7:Qwen3-Max-Instruct测评表现.......................................................................6图8:Qwen3-Max-Thinking (Heavy)测评表现..........................................................6图9:腾讯云智能体战略全景图..................................................................................7图10:腾讯混元3.0生成其自画像............................................................................7图11:百度文心大模型X1.1测评表现优势明显...........................................................7图12:可灵2.5 Turbo效果显著提升.........................................................................8图13:可灵2.5 Turbo提示词理解与运动能力更强.......................................................8图14:CloudMatrix384 AI Token推理服务全面上线..................................................9图15:Seedream 4.0测评表现优异........................................................................10图16:Seedream 4.0生成效果提升明显..................................................................10图17:英伟达与OpenAI在AI领域与其他科技公司的关联和相关交易情况......................11 1全球大模型Agent能力产业化加速落地 2025年9月以来,全球大模型领域发展主线已从“参数规模竞赛与榜单跑分”转向“Agent能力嵌入系统与核心入口”,行业重心加速从技术演示向产业化落地迁移。海外市场方面,OpenAI以Sora2模型及独立SoraApp为核心,推动视频生成技术进入商业化可运营期,不仅整合了长镜头物理一致性、音画同步优化与内容分发功能,还配套了明确的合规管理方案;Anthropic发布ClaudeSonnet4.5模型,强化“模拟电脑操作、长时任务执行”的工程化能力,同步完善Agent开发与运维链路,聚焦“从榜单分数领先转向生产环境可用”;Google将Gemini深度融入Chrome浏览器,以高频场景承载内容理解、跨标签协作,并推出专用模型实现浏览器内表单提交、流程测试等操作,拓展“从回答到执行”的能力边界。国内大模型厂商围绕“模型—入口—算力”展开协同布局:阿里在云栖大会发布Qwen3-Max旗舰基模;腾讯既面向全球开放企业级智能体平台ADP3.0,其混元Image3.0也在开源图像生成榜单登顶;快手可灵2.5Turbo在视频生成质量 与 成 本 控 制 上 双 向 突 破 , 推 动 技 术 从“可 看”向“可 用”过 渡 ; 华 为 依 托CloudMatrix384架构与推理计量服务夯实算力基础;百度发布文心大模型X1.1加码推理性能与多Agent协同,国内产业三角架构已初步成形。综上,本轮变革核心是大模型从“单一语言交互的能说会答”,升级为“多模态感知的能看会做、全链路可控可管”,从单点技术突破转向系统化能力构建,产业化落地不断加速。 2内容、Agent、入口三线推进:海外头部厂商的AI系统升级路径 OpenAI:视频生成进入“产品—合规—分发”三位一体的运营期。9月末,OpenAI以Sora2为底座,推出独立SoraApp,将长镜头物理一致性、角色跨镜头延续与音画同步等核心能力收拢到一个面向大众的产品形态中:用户不仅能“生成”,还能在应用内浏览、复用与二次创作,并通过“客串式”素材插入(cameos)打通社交传播链路。伴随下载量在发布后数天即跃升至百万量级,平台侧的治理与合规被前置为同等重要的工程任务——OpenAI在发布页明确“负责任上线”框架,强调内容标记与权利方控制;主流媒体对未成年人与名人肖像等敏感场景的讨论,也倒逼平台建立更细粒度的创作边界与审核机制。整体看,Sora不再是“演示级模型”,而是“可持续运营的内容平台能力”,一端是视频生成的质量与可控性,另一端是分发与合规的系统化建设。 数据来源:OpenAI官方,财通证券研究所 Anthropic:从“会答题”到“会做事”,以工程化链路把Agent落到生产。9月29日,Anthropic发布ClaudeSonnet4.5,官方定位为其“最佳编码与电脑使用”模型:在大体量代码生成与重构、长时多步任务、工具/终端操作等方面做了系统增强,并同步推出ClaudeAgentSDK、ClaudeCode/终端接口与检查点回滚等能力,明确把“能写、能调、能跑”的闭环纳入可运维的研发流程。与此同时,模型在长时任务上的稳定性(“连续数十小时保持同一项目上下文”)以及 面向企业使用的价格与接入路径(API/控制台/Bedrock),共同指向从“分数领先”向“生产可用”的迁移。就方法论而言,这一代迭代不再将“模型效果”与“系统治理”割裂,而是通过可回溯、可观察与安全分级,降低Agent在实际业务中的引入成本与运维风险。 数据来源:Anthropic官方,财通证券研究所 数据来源:Anthropic官方,财通证券研究所注:“错位行为”分数由自动化工具评估得出,分数越低越好,代表被评估对象的错位行为更少,行为合规性及与人类价值观、安全准则的对齐性更强。 Google(Gemini):把智能嵌入浏览器入口,并以“ComputerUse”从回答迈向执行。9月,Google将Gemini深度融入Chrome:在地址栏与浏览器侧边栏内提供对页理解、跨标签比较与摘要能力,配合“AIMode”在搜索端的视觉—文本联动,形成“高频入口上的轻量Agent”。10月,GoogleDeepMind又发布Gemini2.5ComputerUse专用模型,面向“在受控环境内操控UI”的Agent场景:模型通过对界面截图的视觉理解与推理,循环地产生“点击、输入、滚动、下拉选择”等13类原子动作,