核心观点与关键数据
- 模型发布:OpenAI 发布了 o3 和 o4-mini 两个推理模型,其中 o3 于去年12月发布,今年4月更新;o4-mini 为全新模型,性价比更高。
- 模型参数:两个模型均支持200万上下文输入,输出100万token。
- ChatGPT 替代:ChatGPT 中的 o1 被 o3 替代,o3-mini 被 o4-mini 替代。
最大变化
- 多模态支持:首次支持多模态功能,包括使用和组合工具(如搜索网页、分析文件)、视觉深度推理、生成图像。
- 工具使用:模型经过训练后能自动推理何时及如何使用工具,无需人工指定,提升用户体验。
其他看点
- RL Scaling Law:o3 在训练计算量和推理时间上提升一个数量级,性能显著提升,推测 DS-R2 可能继续扩大RL规模。
- 工具使用训练:RL 可教模型使用工具,国内可借鉴。
- 函数调用与MCP:o3 和 o4-mini 支持函数调用,理论上也能实现 MCP。
- Codex CLI 发布:推出轻量级代码Agent Codex CLI,类似 Anthropic 的 Code,大厂产品形态趋同。