您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:GPT54mininano发布1GPT54发布12 - 发现报告

GPT54mininano发布1GPT54发布12

2026-03-18未知机构周***
GPT54mininano发布1GPT54发布12

1)GPT-5.4发布12天后,OpenAI发布了mini和nano两个紧凑版模型。 mini在SWE-BenchPro拿到54.4%,只比5.4的57.7%低3个百分点,OSWorld计算机操作72.1%接近5.4的75%,但输入输出都便宜70% ,速度快2倍以上。 nano更极端,$0.20/$1.25的定价,只开放API不进Chat GPT-5.4 mini/nano发布 1)GPT-5.4发布12天后,OpenAI发布了mini和nano两个紧凑版模型。 mini在SWE-BenchPro拿到54.4%,只比5.4的57.7%低3个百分点,OSWorld计算机操作72.1%接近5.4的75%,但输入输出都便宜70% ,速度快2倍以上。 nano更极端,$0.20/$1.25的定价,只开放API不进ChatGPT,专做分类、数据提取、排序。 2)mini之所以值得关注,是因为OpenAI自己在Codex里落地了一个子代理模式:5.4负责规划、协调和最终判断,mini作为子代理并行处理窄任务——搜索代码库、审查文件、处理文档,仅消耗5.4配额的30%。 OpenAI原话是”developers can compose systems where larger models decide what to do and smaller models execute quickly atscale”。 3)5.4的API输入价格从5.2的$1.75涨到$2.50(+43%),输出从$14涨到$15(+7%),但mini和nano的定价逻辑完全不同——这不是价格战,而是产品分层。 旗舰负责拉基准线,小模型吃掉推理侧token消耗的大头。 因此,token增量大概率会以一种比市场预期更低的单价、更高的总量的方式兑现。 4)更值得注意的是,Hebbia CTO在测试后表示mini在部分输出任务的端到端通过率和来源归因上优于更大的GPT-5.4。 mini还直接对ChatGPT的Free/Go用户开放了Thinking功能,对付费用户则作为5.4 Thinking的限流降级。 OpenAI自己也表示,在这些场景下,最好的模型往往不是最大的那个——而是那个能快速响应、可靠地使用工具、同时在复杂专业任务上依然表现出色的模型。