GPT-5.4发布,重点仍在Agent、工具调用、token效率提升。
- 性能表现:GPT-5.4跑分强于Claude Opus 4.6,相比GPT-5.2在很多测评中提升约10%。
- 核心亮点:
- 专业任务能力提升:在电子表格、演示文稿和文档处理等专业任务中表现更优。
- 原生操控电脑:支持原生电脑操作(action)。
- 工具搜索与按需加载:能够按需加载各种工具,类似Anthropic Skills的思路。
- token效率提升:工具搜索在保持相同准确率的同时,将总token使用量减少47%。
- token价格调整:
- 输入token价格上涨约43%,输出token价格上涨约7%。
- 输入prefill(compute-bound)成本上升,输出decode(memory-bound)成本上升较少。
- 结论:尽管token单价上涨,但token用量大幅减少(47%),整体使用模型成本可能更低。