您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国金证券]:GPT-5.4:执行型AI加速落地,OpenClaw绝佳搭档 - 发现报告

GPT-5.4:执行型AI加速落地,OpenClaw绝佳搭档

信息技术2026-03-08刘高畅国金证券王***
GPT-5.4:执行型AI加速落地,OpenClaw绝佳搭档

行业观点: GPT-5.4发布,迈向“可执行AI”的重要升级 GPT-5.4的发布标志着大模型能力从“对话生成”向“任务执行”的重要跃迁。本次升级在推理能力、编程能力以及智能体工作流方面进行了系统性强化,并首次在模型层面大规模整合Computer Use、工具调用与联网搜索能力,使AI可以在真实软件环境中完成复杂任务。具体来看:1)原生Computer Use能力使模型能够通过视觉理解屏幕并执行鼠标点击、键盘输入等操作,在OSWorld等桌面操作基准测试中成功率接近人类水平,意味着AI具备在真实系统中执行任务的能力;2)Tool Search机制大幅优化工具调用流程,通过按需检索工具定义的方式减少上下文Token消耗,从而提升多工具Agent系统的效率并降低成本;3)联网搜索能力与推理能力进一步增强,使模型能够通过多轮搜索整合全网信息解决复杂问题;4)知识型工作能力显著提升,在电子表格、文档、演示文稿等专业办公任务中的表现接近甚至超过部分行业专业人士水平。整体来看,GPT-5.4验证了AI发展的两大趋势:一是模型迭代节奏持续加快,二是Computer Use与工具调用能力正在打通AI从“对话”走向“执行”的关键环节,Agent商业化落地路径日益清晰。 OpenClaw + GPT-5.4:Agent时代的绝佳组合 随着AI行业进入Agent时代,市场关注点逐渐从单一模型能力转向“模型+ Agent框架”的系统能力。在这一背景下,开源Agent框架OpenClaw与GPT-5.4的组合被开发者社区和媒体认为是当前极具潜力的技术路径之一。OpenClaw作为一个完全开源且可本地运行的AI Agent框架,核心目标是让AI能够直接操作电脑完成真实工作任务。GPT-5.4在多个关键能力上的升级,使其与OpenClaw形成高度互补:1)原生Computer Use能力使模型可以直接操作桌面软件,减少传统Agent框架需要复杂适配和自动化脚本的技术成本;2)100万Token的超长上下文为长期运行的Agent提供了更大的“工作记忆”,能够在复杂任务链和长时间任务执行过程中保持稳定的上下文理解;3)Tool Search机制显著降低多工具调用带来的Token成本,使OpenClaw在接入大量Skills与工具时仍能保持较高效率;4)模型推理与专业任务能力的提升,使Agent能够胜任更复杂、更高价值的知识工作场景。整体来看,OpenClaw与GPT-5.4的结合有望推动AI Agent从实验性工具逐步走向真实生产力系统,加速AI在办公自动化、软件开发和复杂知识工作的落地应用。 投资建议: 国内算力:寒武纪、东阳光、海光信息、协创数据、豫能控股、华丰科技、亿田智能、星环科技、网宿科技、宏景科技、首都在线、神州数码、百度集团、大位科技、润建股份、中芯国际、华虹半导体、中科曙光、润泽科技、浪潮信息、东山精密、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。 海外算力/存储:中际旭创、新易盛、兆易创新、大普微、天孚通信、源杰科技、胜宏科技、景旺电子、英维克等;Lumentum、闪迪、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。 CPU:海光信息、中科曙光、澜起科技、禾盛新材、中国长城、龙芯中科、兴森科技、深南电路、宏和科技、广合科技。 AI应用:1)超级入口:腾讯控股、Minimax、智谱、阿里巴巴、科大讯飞。2)星环科技、德才股份、美年健康、中控技术、卓易信息、昆仑万维等AI INFRA&高增长&高壁垒。其他:空天时代、具身智能等。 风险提示 行业竞争加剧的风险;技术迭代不及预期的风险;特定行业下游资本开支周期性波动的风险。 一、GPT-5.4发布,迈向“可执行AI”的重要升级 2026年3月5日,OpenAI发布GPT-5.4,定位为面向复杂工作任务的旗舰模型。GPT-5.4将OpenAI近 期 在 推 理 、 编 程 及 智 能 体 工 作 流 领 域 的 顶 尖 性 能 集 于 一 身 。 整 合了GPT-5.3-Codex行业领先的编程能力,同时优化了模型在各类工具、软件环境以及专业任务(电子表格、ppt和文档等)中的表现,支持高达100万Token的上下文,能够准确高效地完成复杂的实际工作。 1.1原生Computer Use:AI具备真实操作电脑能力 GPT-5.4最重要的升级之一是原生“Computer Use”能力。模型可以通过视觉理解屏幕截图,识别界面中的按钮、文本框和菜单,并执行鼠标点击、键盘输入等操作,从而在真实操作系统环境中完成任务。 在OSWorld桌面操作基准测试中,GPT-5.4的成功率达到约75%,已经接近甚至超过人类平均水平。这意味着Agent在真实软件环境中的执行能力具备可用性。 来源:OpenAI,国金证券研究所 1.2工具搜索:大规模工具调用能力 GPT-5.4在API层面引入工具搜索机制。在此之前,当模型调用工具时,所有的工具定义都必须预先包含在提示词中。对于拥有大量工具的系统,这会导致每次请求都额外增加数千甚至数万个Token,不仅推高了成本、减慢了响应速度,还让上下文中充斥着模型可能永远用不到的冗余信息。 通过工具搜索,GPT-5.4不再需要预加载完整定义,而是接收一份精简的可选工具列表及工具搜索能力。当模型需要调用特定工具时,它会即时查找该工具的定义,并将其添加到当前的对话上下文。这种方法大幅减少了重度工具调用工作流程所需的Token数量,并有效保留了缓存,使请求变得更快、成本更低。这一能力对于构建复杂AI Agent系统具有关键意义,因为真实应用往往需要调用大量工具。 1.3更强的联网搜索能力 GPT-5.4在智能体联网搜索方面表现更佳。在实际应用中,这意味着GPT-5.4 Thinking能够更强有力地解答那些需要整合全网多方信息的复杂问题。它能以更强的持久性进行多轮搜索, 从而锁定最相关的信源—尤其是在处理“大海捞针”式的问题时,它能高效提炼核心信息,并给出逻辑清晰、论证严密的回答。 1.4知识型工作能力大幅提升 在GDPval测试中(涵盖44种职业的知识工作任务),GPT-5.4在83%的案例中或达到超越行业专业人士水准,比GPT-5.2的71%有显着的跃升。 OpenAI还重点提升了GPT-5.4创建和编辑表格、演示文稿及文档的能力。针对初级投行分析师水平的电子表格建模任务得分从68.4%提升至87.5%。 来源:OpenAI,国金证券研究所 1.5可控性提升 GPT-5.4 Thinking现在也会在处理更长、更复杂的查询时,通过“前言”来简述其工作方案。此外,还可以在模型生成过程中实时添加指令或调整其方向。让用户能更轻松地引导模型达成预期的结果,而无需推倒重来,或通过多轮额外对话进行补救。 总结:从聊天模型到执行型AI、我们认为GPT-5.4的发布验证了两个核心趋势:一是模型迭代节奏显著加快(GPT-5系列自2025年8月以来已迭代至5.4版本),前沿模型竞争从"智商比拼"转向"场景落地效率";二是Computer Use +工具调用的组合正在打通AI从"对话"到"执行"的最后一公里,Agent商业化路径日趋清晰。 二、OpenClaw+GPT 5.4,Agent绝佳组合 随着AI行业进入Agent时代,市场关注点开始从单纯的大模型能力转向“模型+ Agent框架”的系统能力。开源AI Agent框架OpenClaw与GPT-5.4的组合就是极具具潜力的技术路线之一。 由独立开发者Peter Steinberger在2025年11月推出的OpenClaw,定位为完全开源且本地运行的AI Agent框架。它具备真正的行动力,电脑在它眼中变作了可以肆意发挥的沙盒,执行终端命令、读写文件、收发邮件乃至代替主人管理日程,一切均在自然的对话间完成。 据新浪财经报道,OpenClaw就仅用两月击败Linux,登顶GitHub星标榜,正式加冕史上最受欢迎开源项目。 图表4:OpenClaw的GitHub星标增长速度 GPT-5.4与Computer Use能力与OpenClaw高度契合。IT之家报道认为,GPT-5.4可能是2026年目前为止,最适合跑OpenClaw的模型。 模型的推理能力、工具调用准确度、长程任务的上下文保持能力,直接决定了OpenClaw的实际工作能力。而GPT-5.4恰恰在OpenClaw最需要的每一个维度上,都踩中了甜蜜点。 原生电脑操控: OpenClaw的核心价值就是让AI操作你的电脑。GPT-5.4原生具备这一能力,这意味着接入GPT-5.4的OpenClaw,不再需要通过复杂的适配和Hack来实现桌面自动化,从底层就是为这个场景而生。 100万Token上下文: OpenClaw是一个持续运行的Agent,需要维持长对话、记住复杂指令链、处理大量文件内容。以前用其他模型,跑着跑着就忘了前面的任务。100万Token的上下文窗口,意味着OpenClaw终于有了足够大的工作台来铺开所有材料。 Tool Search: OpenClaw的强大之处在于它可以接入数十种Skills和工具。但工具越多,每次调用消耗的Token就越多,成本飙升。GPT-5.4的Tool Search机制天然解决了这个问题——不用把所有工具定义都塞进上下文,按需取用,Token消耗直降47%。对于长期运行的OpenClaw来说,可以大幅减少API调用费用 推理能力跃升: 低端模型运行OpenClaw,遇到稍微复杂的任务就卡壳。GPT-5.4在专业工作任务中超过83%的人类专家表现,配合其在数学、编程、文档处理等领域的全面提升,意味着OpenClaw可以胜任更复杂、更高价值的工作场景。 OpenClaw之父Peter也评价GPT-5.4在编程能力提升不小外,在其他能力方面更加统一、更加智能: 图表5:OpenClaw之父Peter对GPT-5.4的评论 OpenClaw的官方文档已经提供了GPT-5.4的接入配置方案,OpenAI的Responses API也已全面支持。 我们认为,在AI Agent生态中GPT-5.4 + OpenClaw是当前极具潜力的技术组合之一,有望推动AI从对话助手向自动执行复杂任务的智能系统演进。 风险提示 行业竞争加剧的风险:在信创等政策持续加码支持计算机行业发展的背景下,众多新兴玩家参与到市场竞争之中,若市场竞争进一步加剧,竞争优势偏弱的企业或面临出清,某些中低端品类的毛利率或受到一定程度影响。技术研发进度不及预期的风险:计算机行业技术开发需投入大量资源,如果相关厂商新品研发进程不及预期,表观层面将呈现出投入产出在较长时期的滞后特征。特定行业下游资本开支周期性波动的风险:部分计算机公司系顺周期行业,下游资本开支波动与行业周期性相关性 较强,或在个别年份对于上游软件厂商的营收表现产生扰动。李可夫2026-02-08 01:31李可夫2026。 行业投资评级的说明: 买入:预期未来3-6个月内该行业上涨幅度超过大盘在15%以上;增持:预期未来3-6个月内该行业上涨幅度超过大盘在5%-15%;中性:预期未来3-6个月内该行业变动幅度相对大盘在-5%-5%;减持:预期未来3-6个月内该行业下跌幅度超过大盘在5%以上。 特别声明: 国金证券股份有限公司经中国证券监督管理委员会批准,已具备证券投资咨询业务资格。 形式的复制、转发、转载、引用、修改、仿制、刊发,或以任何侵犯本公司版权的其他方式使用。经过书面授权的引用、刊发,需注明出处为“国金证券股份有限公司”,且不得对本报告进行任何有悖原意的删节和修改。 本报告的产生基于国金证券及其研究人员认为可信的公开资料或实地调研资料,但国金证券及其研究人员对这些信息的准确性和完整性不作任何保证。本报告反映撰写研究人员的不同设想、见解及分析方法,故本报告所载观点可