您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国盛证券]:计算机行业点评:OpenAI最新布局:GPT-5.6刷新代码能力上限,Jalapeno补齐推理算力短板 - 发现报告

计算机行业点评:OpenAI最新布局:GPT-5.6刷新代码能力上限,Jalapeno补齐推理算力短板

信息技术 2026-06-29 孙行臻 国盛证券 话唠
报告封面

OpenAI最新布局:GPT-5.6刷新代码能力上限,Jalapeño补齐推理算力短板 GPT-5.6正式发布,刷新模型代码能力边界。2026年6月26日OpenAI推出分层GPT-5.6系列模型Sol、Terra、Luna,产品形成清晰梯度定位。价格上看,各款整体定价相比前代与竞品更具优势,但仍高于国内前沿大模型。对比Claude Mythos 5,GPT5.6在代码能力上实现超越;在安全层面,GPT 5.6大幅强化模型安全管控能力并投入大量算力资源用于安全性测试并重点针对可跨场景泛化的“通用越狱”攻击路径,并配有覆盖整个预览期的第三方人工专家红队测试。 增持(维持) 自研AI推理芯片Jalapeño补齐模型厂商算力短板。OpenAI依托自身长期深耕大模型赛道积累的研发、运营经验,以自有大模型作为底层工具加速Jalapeño芯片从零起步的设计,携手博通完成芯片的生产制造,由此完成从基础算力硬件到大模型产品端的全栈闭环布局,并构建 模型-自研芯片-营收”正向飞轮。 国模追赶加速:DeepSeek、Kimi、GLM、Minimax多强格局初现。国产大模型厂商DeepSeek、Kimi、GLM、Minimax于2026年围绕企业端商用核心需求,集中在代码生成、自主Agent、超长上下文三大关键能力完成模型迭代升级;从技术实力上看,GLM-5.2综合得分超越Claude Sonnet4.6,紧跟全球前列的GPT-5.5,并且凭借国产芯片+国产电力成本优势及更方便的企业部署优化构建起差异化壁垒。 作者 分析师孙行臻执业证书编号:S0680526010001邮箱:sunxingzhen1@gszq.com 相关研究 1、《计算机:中报窗口临近,AI链高景气领跑》2026-06-272、《计算机:金融科技:交投活跃、外资放开、科技牛市》2026-06-233、《计算机:算租盈利飞轮加速,Token运营价值重估》2026-06-20 我们认为,海外层面OpenAIGPT-5.6持续突破性能上限,自研AI推理芯片Jalapeño完成大模型全栈布局,模型-自研芯片-营收”飞轮有望推动产品能力显著提升,带动全球市场规模持续扩容。国产大模型代码能力正在持续追赶国际头部产品,头部厂商模型在标准化代码评测中已跻身全球第一梯队,叠加定价成本、企业私有化部署两大核心优势,国产大模型已初步建立“性能对标国际一线、定价具备成本优势、部署轻量化便捷”的差异化竞争壁垒。长期维度看,国产大模型将在全球AI模型竞争格局中持续占据优势地位,承接行业规模扩张带来的红利。 建议关注: 建议关注具备前沿模型研发能力的大模型厂商:例如智谱,Minimax,科大讯飞等。 风险提示:技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。 内容目录 一、最新模型GPT-5.6正式发布:代码能力刷新上限.........................................................................................3二、自研AI推理芯片Jalapeño亮相:从纯模型”迈向全栈巨头”.............................................................5三、国模追赶加速:DeepSeek、Kimi、GLM、Minimax多强格局初现................................................................6建议关注...........................................................................................................................................................8风险提示...........................................................................................................................................................8 图表目录 图表1:GPT 5.6正式发布...............................................................................................................................3图表2:GPT-5.6价格对比...............................................................................................................................3图表3:GPT 5.6在Terminal-Bench 2.1测评结果超过Claude Mythos.............................................................4图表4:OpenAI联合博通发布推理芯片Jalapeño............................................................................................5图表5:国产模型正在快速追赶海外前沿模型..................................................................................................6图表6:Kimi 2.6代码能力显著提升.................................................................................................................7 一、最新模型GPT-5.6正式发布:代码能力刷新上限 2026年6月26日OpenAI推出分层GPT-5.6系列模型Sol、Terra、Luna,全系三款分层模型有限预览,产品形成清晰梯度定位:Sol主打顶尖前沿能力,Terra兼顾综合性能与日常使用效率,Luna侧重低成本、高吞吐,适配大规模业务需求。OpenAI短期仅向报备伙伴有限开放GPT-5.6,官方称该准入模式非长期机制,并且此举是为配合美方监管、搭建标准化发布流程,最终目标是数周内实现全量开放。 资料来源:OpenAIX官方账号,国盛证券研究所 各款整体定价相比前代与竞品更具优势,但仍高于国内前沿大模型。Terra性能对标前代GPT-5.5、成本减半;Luna主打低成本通用能力。对比行业产品价格,GPT 5.6最具性价比的Luna版本价格仍略高于国内前沿大模型GLM-5.2、kimi-k2.6、DeepSeek-v4-pro;GPT 5.6 Sol价格较GPT 5.5并未提升,相较于Claude Fable 5仍具备价格优势,但比GLM 5.2高出数倍。 相较于前代产品,在安全性上,GPT-5.6 Sol搭载了Open AI截至目前最完备的安全防护体系。公司加强了对高风险活动、敏感网络请求和反复滥用的保护,并用数周时间寻找漏洞,进行系统压力测试,并加固其对真实攻击的防御。 在模型能力上,GPT-5.6旗舰模型Sol新增Max深度推理机制,赋予模型更长思考周期以实现深度推演;同时配套推出Ultra模式,通过智能体协同架构突破单智能体能力上限,大幅提升复杂任务处理效率。 OpenAI模型代码实操能力实现再度突破,最强版本超越Claude Mythos 5。Terminal-Bench 2.1基准聚焦复杂编码工作流,侧重考核模型任务规划、迭代调试与多工具协同调度能力,可深度衡量大模型落地工程实操水平。本次测评数据显示,GPT-5.6 Sol Ultra、GPT-5.6 Sol得分分别为91.90%、88.80%,超越Claude Mythos 5的88.00%,再度刷新行业大模型终端代码能力边界。 资料来源:OpenAI官网,国盛证券研究所 对比Anthropic产品,GPT-5.6除代码性能具备优势外,新版本大幅强化模型安全管控能力以应对政府监管。Anthropic此前推出Claude Fable 5、Mythos 5仅三日便遭一刀切全面封禁,美国前沿大模型商业化受到政府重点监管。在此背景下,GPT 5.6整套防护框架采用多层叠加设计,模型层面训练了对违禁网络攻击请求的拒绝能力,包括针对伪装意图和越狱尝试的识别;生成过程中部署了实时分类器,一旦检测到潜在违规,系统将暂停生成并由更大规模的推理模型进行审查,确认违规后输出内容将在到达用户前被拦截。此外,为验证防护体系的鲁棒性,OpenAI投入了超过70万A100等效GPU小时用于自动化红队测试,重点针对可跨场景泛化的通用越狱攻击路径,并辅以第三方人工专家红队测试,后者将持续覆盖整个预览期。 二、自研AI推理芯片Jalapeño亮相:从“纯模型”迈向“全栈巨头” 2026年6月24日,Open AI宣布其联合博通设计并制造了OpenAI第一款人工智能芯片Jalapeño,根据OpenAI初步测试,该款新品每瓦性能优于现有最先进的设备。 图表4:OpenAI联合博通发布推理芯片Jalapeño 资料来源:OpenAI官方X,国盛证券研究所 Jalapeño由OpenAI从零完成专属架构设计、博通落地量产,充分凸显OpenAI全栈自研布局优势。Jalapeño面向大模型推理从零全新架构打造,并非改造旧有通用AI加速芯片,设计参考ChatGPT、Codex、API及未来Agent产品的真实运行负载,兼容全行业现有及未来大模型,此外芯片兼顾主流高端加速器的算力、吞吐量与专用推理系统的低延迟特性,适配大规模交互式大模型业务。 OpenAI构建起大模型-自研芯片-营收”正向飞轮。一方面,自有大模型大幅加速Jalapeño芯片设计优化,依托软硬件协同与博通工艺,该芯片仅9个月完成设计到流片,刷新高端ASIC研发速度,AI辅助芯片设计可降低全行业算力成本、推动高端AI普惠;另一方面,自研高性能芯片又能训练更强的大模型,依托优质模型打造覆盖个人、开发者、企业的多元产品,用户与营收增长反哺下一代算力基建投入,持续放大全链路循环优势。 三、国模追赶加速:DeepSeek、Kimi、GLM、Minimax多强格局初现 国产大模型技术实力追赶持续加快,成本、部署双维度优势突出: ◼在代码能力层面:根据Artificial Analysis最新发布的代码能力指数,国内标杆大模型GLM-5.2“(max)得分超越Claude Sonnet 4.6“(max),紧跟全球前沿模型GPT-5.5,标志国产大模型代码能力跻身全球头部阵营;◼在价格层面:国产大模型通过使用国产芯片实现更低的每GPU时成本,以及更低电价实现更低的token成本,从而能够以更低产品价格参与市场竞争;◼在企业部署层面:1)深度优化中文工业场景,对工艺、故障、质检类专业术语适配度高,有效规避交互语义偏差;2)配套标准化部署工具与API接口,大幅降低落地调试门槛,缩短企业选型至试点上线周期。 根据OpenRouter在6月15日至6月21日统计周内的数据,中国大模型周调用总量达18.81万亿词元,连续八周蝉联全球第一,彻底确立了我国在全球AI应用落地领域的核心地位,打破了海外模型长期主导全球AI产业的固有格局。 国内大模型头部大模型迭代进展: ◼DeepSeek:强化Agent代码能力、世界知识、推理能力。2026年4月24日,Dee