您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中邮证券]:【中邮金工】AI动态汇总:OpenAI发布o3-pro,Mistral推出推理模型Magistral - 发现报告

【中邮金工】AI动态汇总:OpenAI发布o3-pro,Mistral推出推理模型Magistral

2025-06-16肖承志、冯昱文中邮证券郭***
AI智能总结
查看更多
【中邮金工】AI动态汇总:OpenAI发布o3-pro,Mistral推出推理模型Magistral

发布时间:2025-06-16 金工周报标题 研究所研究所 分析师:肖承志SAC 登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文 SAC 登记编号:S1340124100011Email:fengyuwen@cnpsec.com研究所 OpenAI 发布 o3-pro,Mistral 推出推理模型Magistral——AI 动态汇总 20250616【中邮金工】标题摘要 lOpenAI 发布 o3-pro OpenAI 于 2025 年 6 月 11 日正式发布了其最新一代 AI 推理模型o3-pro,这一模型被官方称为“迄今为止最强大的 AI 模型”,并在多个领域展现出卓越性能。o3-pro 是此前推出的 o3 推理模型的升级版,专为深度思考和提供高可靠性响应而设计,尤其适用于数学、科学、编程等需要严谨逻辑的领域。 近期研究报告近期研究报告 《关注基本面支撑,高波风格占优——中邮因子周报 20250615》 -2025.06.16 lMistral 推出推理模型 Magistral 《结合基本面和量价特征的 GRU 模型》 - 2025.06.05 法国人工智能公司 Mistral AI 于 2025 年 6 月 10 日正式推出其首个专注于推理能力的大语言模型系列——Magistral,标志着该公司在 AI 领域的一次重要战略升级。该系列以“透明推理”和“多语言链式思考”为核心设计理念,旨在解决复杂逻辑任务中的可解释性与跨语言一致性难题,同时通过开源与商业并行的双版本策略,试图在竞争激烈的大模型市场中开辟差异化路径。 《Claude 4 系列发布,谷歌上线编程智能体 Jules——AI 动态汇总20250526》 - 2025.05.27 《谷歌发布智能体白皮书,Manus 全面开放注册——AI 动态汇总 20250519》- 2025.05.20 lMeta 推出 LlamaRL 强化学习框架 Meta 公司于 2025 年 6 月 10 日发布的LlamaRL 强化学习框架,标志着大语言模型(LLM)训练技术的一次革命性突破。该框架通过全异步分布式架构与创新性技术组合,将 4050 亿参数模型的强化学习训练时间从 635.8 秒缩短至 59.5 秒,效率提升高达 10.7 倍,同时解决了传统 RLHF(基于人类反馈的强化学习)在资源消耗、内存瓶颈和 GPU 利用率低下等核心难题,为 AI 模型的快速迭代与安全对齐提供了全新基础设施。 《证监会修改《重组办法》,深化并购重组改革——微盘股指数周报20250518》 - 2025.05.19 DeepSeek 发布数理证明大模型——AI动态汇总 20250505》 - 2025.05.06 《基金 Q1 加仓有色汽车传媒,减仓电新食饮通信——公募基金 2025Q1 季报点评》 - 2025.04.30 lAMD 举办 dvancing AI 2025 大会 AMD 于 2025 年 6 月 12 日在加州圣何塞举办的Advancing AI 2025大会,不仅成为挑战英伟达 AI 芯片霸主地位的关键转折点,更通过硬件革新、生态开放与战略合作的全方位布局,重新定义了 AI 计算的未来范式。 《泛消费打开连板与涨幅高度,ETF 资金平铺机器人、人工智能与芯片——行业轮动周报 20250427》 -2025.04.28 l风险提示: 以上内容基于历史数据完成,在政策、市场环境发生变化时存在失效的风险;历史信息不代表未来。摘要 《国家队交易特征显著,短期指数仍交易补缺预期,TMT 类题材仍需等待——行业轮动周报 20250420》 -2025.04.21 《小市值持续,高低波风格交替——中邮因子周报 20250413》 -2025.04.14 目录 1AI 重点要闻 ................................................................................ 41.1OpenAI 发布 o3-pro ..................................................................... 41.2Mistral 推出推理模型 Magistral..........................................................61.3Meta 推出 LlamaRL 强化学习框架 .......................................................... 81.4AMD 举办 dvancing AI 2025 大会 ......................................................... 112企业动态..................................................................................132.1Meta 推出世界模型 V-JEPA 2.............................................................132.2玉盘 AI 推出 SRDA 架构..................................................................153AI 行业洞察 ............................................................................... 183.1七家主流大模型挑战 2025 高考数学.......................................................184技术前沿..................................................................................204.1Apple: The Illusion of Thinking ...................................................... 205风险提示..................................................................................22 图表目录 图表 1: o3-pro 测评跑分..................................................................4图表 2: o3-Pro 价格相比 o1-pro 降低 87% ................................................... 4图表 3: o3-pro 4/4 可靠性评估............................................................5图表 4: o3-pro ARC-AGI 表现..............................................................5图表 5: Magistral 评测跑分...............................................................6图表 6: Magistral 不同训练方式下跑分对比.................................................6图表 7: LlamaRL 架构样例.................................................................9图表 8: LlamaRL vs. baseline 模型:深度学习速度对比 .....................................10图表 9: 相较上一代性能提升 3 倍以上 ..................................................... 12图表 10: MI350 系列参数对比.............................................................12图表 11: V-JEPA 2 架构..................................................................15图表 12: 算力需求缺口较大 .............................................................. 17图表 13: SRDA 架构......................................................................17图表 14: The Illusion of Thinking ...................................................... 20图表 15: 模型"思考"行为提供了观测窗口 .................................................. 21图表 16: 模型在不同复杂度下的推理路径探索模式 .......................................... 21 1AI 重点要闻 1.1OpenAI 发布 o3-pro OpenAI 于 2025 年 6 月 11 日正式发布了其最新一代 AI 推理模型 o3-pro,这一模型被官方称为“迄今为止最强大的 AI 模型”,并在多个领域展现出卓越性能。o3-pro 是此前推出的 o3 推理模型的升级版,专为深度思考和提供高可靠性响应而设计,尤其适用于数学、科学、编程等需要严谨逻辑的领域。 o3-pro 的核心优势在于其“推理模型”特性,能够逐步拆解问题并逻辑严密地得出结论,而非依赖传统 AI 模型的模式匹配方式。例如,在解决复杂数学证明或编写代码时,o3-pro 会先分析条件或需求,再调用相关知识逐步推导,显著减少错误。OpenAI 采用了严格的“4/4 可靠性”评估标准,即模型需在四次尝试中均正确回答问题才算成功。测试结果显示,o3-pro 在数学基准 AIME 2024 中超越谷歌 Gemini 2.5 Pro,在博士级科学测试 GPQA Diamond 中击败 Anthropic的 Claude 4 Opus。 资料来源:OpenAI,中邮证券研究所 资料来源:OpenAI,中邮证券研究所 此外,o3-pro 支持多模态输入(文本和图像),上下文窗口达 200k token,并能调用工具链实现网页搜索、文件分析、Python 代码执行等功能。其记忆个性化功能可根据用户历史交互优化响应,但知识截至时间为 2024 年 6 月 1 日,需依赖外部工具获取更新信息。 o3-pro 的 API 定价为每百万输入 token 20 美元、输出 token 80 美元,较前代 o1-pro 降价 87%。同时,OpenAI 将 o3 模型价格大幅下调 80%(输入 2 美元/百万 token,输出 8 美元),这一策略被解读为降低技术门槛并应对竞争压力。值得注意的是,o3-pro 响应速度较慢,例如有用户测试显示简单问候需等待近 4分钟,官方建议其更适合可靠性优先的复杂任务。 尽管性能强劲,o3-pro 仍存在多项限制:临时聊天功能因技术问题暂时禁用;不支持图像生成(