您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:Hua Taiwan计算机o3和o4mini开发管理模型,首次支持多个模型 - 发现报告

Hua Taiwan计算机o3和o4mini开发管理模型,首次支持多个模型

2025-04-17未知机构起***
Hua Taiwan计算机o3和o4mini开发管理模型,首次支持多个模型

跟预测的一样,o3和o4-mini发布。 o3发布会是去年12月开的,今年4月发布,o4-mini是新的,性价比更好,两个模型都是200万上下文,输出100万token。 目前ChatGPT中的o1被o3替代,o3-mini被o4-mini替代。 最大的变化可能就是,之前推 【华泰计算机】o3和o4-mini发布,推理模型首次支持多模态 跟预测的一样,o3和o4-mini发布。 o3发布会是去年12月开的,今年4月发布,o4-mini是新的,性价比更好,两个模型都是200万上下文,输出100万token。 目前ChatGPT中的o1被o3替代,o3-mini被o4-mini替代。 最大的变化可能就是,之前推理模型基本就是纯文本,没啥其他能力。 这次的o3和o4-mini首次能够使用和组合工具(搜索网页、使用Python 分析上传的文件和其他数据)、支持视觉深度推理、生成图像【其实对图像的推理,阿里QVQ实现的更早】。 且模型经过训练后,能够推理何时以及如何使用工具,不用人指定。 【虽然不是新花活,但是推理模型功能明显更全了,用户体验不错,已经可以在ChatGPT使用】 除了刷分,其他看点还有:1)RL也呈现出ScalingLaw,o3在训练计算量和推理时间方面都提升了一个数量级,仍然看到了明显的性能提升。 【推测DS-R2应该也是继续扩大RL规模】;2)RL也能教模型使用工具,国内可以借鉴。 3)o3和o4-mini能函数调用,理论上也能MCP。 4)发布Codex CLI,是可以从终端运行的轻量级代码Agent,有点像Anthropic发布的Code,大厂产品形态也在趋同。