行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

【中邮金工】AI动态汇总：OpenAI发布o3-pro，Mistral推出推理模型Magistral

2025-06-16 肖承志,冯昱文中邮证券郭小欧

AI重点要闻

OpenAI发布o3-pro

OpenAI发布新一代AI推理模型o3-pro，被誉为“迄今为止最强大的AI模型”，专为深度思考和提供高可靠性响应设计，适用于数学、科学、编程等领域。
o3-pro的核心优势在于其“推理模型”特性，能够逐步拆解问题并逻辑严密地得出结论。
OpenAI采用了严格的“4/4可靠性”评估标准，o3-pro在数学基准AIME2024中超越谷歌Gemini2.5Pro，在博士级科学测试GPQADiamond中击败Anthropic的Claude4Opus。
o3-pro支持多模态输入，上下文窗口达200ktoken，并能调用工具链实现网页搜索、文件分析、Python代码执行等功能。
o3-pro的API定价为每百万输入token20美元、输出token80美元，较前代o1-pro降价87%。
o3-pro的响应速度较慢，例如简单问候需等待近4分钟。
o3-pro仍存在多项限制：临时聊天功能因技术问题暂时禁用；不支持图像生成；与协作平台Canvas不兼容。

Mistral推出推理模型Magistral

MistralAI推出首个专注于推理能力的大语言模型系列Magistral，以“透明推理”和“多语言链式思考”为核心设计理念。
Magistral系列采用纯强化学习（RL）训练框架，摒弃传统RLHF的蒸馏依赖，转而通过自研的GroupRelativePolicyOptimization（GRPO）算法实现推理能力的优化。
MagistralMedium在AIME-24数学基准测试中准确率从旧版的26.8%跃升至73.6%。
Magistral引入“推理语言对齐”技术，强制模型生成结构化思考步骤，增强逻辑自洽性，降低黑箱输出风险。
Magistral支持8种语言的母语级推理，能直接用用户语言生成代码或数学证明。
Magistral系列采用双轨制策略：MagistralSmall（24B参数）以Apache2.0许可证开源；MagistralMedium（参数未公开）作为企业专有版本，通过Mistral的LeChat平台和API提供服务。

Meta推出LlamaRL强化学习框架

Meta公司发布LlamaRL强化学习框架，通过全异步分布式架构与创新性技术组合，将4050亿参数模型的强化学习训练时间从635.8秒缩短至59.5秒。
LlamaRL的设计哲学围绕“全异步并行”与“模块化解耦”展开，通过独立执行器并行处理生成、训练和奖励模型任务。
LlamaRL整合分布式直接内存访问（DDMA）与NVIDIANVLink技术，使405B模型的权重同步时间压缩至2秒。
LlamaRL的实际测试中展现出惊人的效率与质量平衡，在MATH数学推理和GSM8K小学数学测试中，LlamaRL训练的模型表现稳定甚至略有提升。

AMD举办dvancingAI2025大会

AMD举办dvancingAI2025大会，发布InstinctMI350系列GPU，性能指标实现代际飞跃。
MI355X型号在FP4精度下算力达161PFLOPS，FP16精度下为36.8PFLOPS，较前代MI300X实现推理性能提升35倍、训练性能提升4倍。
AMD推出ROCm7软件栈，在推理性能上平均提升3.5倍，训练性能提升3倍，并全面支持PyTorch、Triton等主流框架的FP8数据类型与KernelFusion技术。
AMD与OpenAI的深度合作成为大会焦点，MI350的矩阵计算单元专为OpenAI的Owl-2视觉模型优化。

企业动态

Meta推出世界模型V-JEPA2

Meta发布V-JEPA2，通过自监督学习从海量视频数据中构建对物理规律的抽象表征，实现了机器人零样本规划、复杂动作预测等能力。
V-JEPA2基于联合嵌入预测架构（JEPA）设计，包含编码器与预测器两大核心组件。
V-JEPA2在运动理解、动作预测和机器人控制方面表现出色，在HuggingFace物理推理榜单已超越GPT-4o和Gemini1.5Pro。

玉盘AI推出SRDA架构

玉盘AI推出SRDA（系统级极简可重构数据流架构），从硬件底层重构了传统GPGPU的设计逻辑，以“数据流驱动”为核心哲学。
SRDA强调软硬件超融合，编译器能精确感知硬件的可重构特性、内存架构及互联拓扑，在编译阶段即完成计算图的静态优化。
SRDA的内存架构革命通过QDDM（分布式3D堆叠内存管理）技术，每个计算核心配备私有化的3D-DRAM内存区域，带宽隔离设计彻底消除多核共享内存的竞争问题。

AI行业洞察

七家主流大模型挑战2025高考数学

七家主流大模型（包括国产与国际品牌）的角逐结果揭示了当前AI在数学领域的突破与局限。
DeepSeekR1以143分夺冠，讯飞星火X1以141分紧随其后，两者成为唯二突破140分的模型。
评测涵盖选择题、填空题与解答题，重点关注模型对多步骤逻辑推理的完成度与准确性。
本次测验也反映了多模态短板，所有模型均未在风向图识别题得分。

技术前沿

Apple:TheIllusionofThinking

苹果公司研究团队撰写的论文《TheIllusionofThinking:UnderstandingtheStrengthsandLimitationsofReasoningModelsviatheLensofProblemComplexity》，通过可控的算法谜题环境，对当前前沿的大规模推理模型（LRMs）进行了系统性评估。
研究采用对比实验设计，匹配思考模型（如Claude3.7SonnetThinking）与非思考版本（同架构关闭思考功能）在等效计算预算下的表现。
核心发现之一就是，找到了逻辑大模型三类推理模式，问题复杂度与模型性能的非线性关系。
论文还发现了算法执行的缺陷，即使提供明确解题算法，模型表现未显著改善。
研究团队首次量化了"过度思考"现象，简单问题中，模型早期找到正确答案后仍继续无效探索。

风险提示

以上内容基于历史数据完成，在政策、市场环境发生变化时存在失效的风险；历史信息不代表未来。

发布时间：2025-06-16 金工周报标题研究所研究所分析师:肖承志SAC 登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文 SAC 登记编号:S1340124100011Email:fengyuwen@cnpsec.com研究所 OpenAI 发布 o3-pro，Mistral 推出推理模型Magistral——AI 动态汇总 20250616【中邮金工】标题摘要 lOpenAI 发布 o3-pro OpenAI 于 2025 年 6 月 11 日正式发布了其最新一代 AI 推理模型o3-pro，这一模型被官方称为“迄今为止最强大的 AI 模型”，并在多个领域展现出卓越性能。o3-pro 是此前推出的 o3 推理模型的升级版，专为深度思考和提供高可靠性响应而设计，尤其适用于数学、科学、编程等需要严谨逻辑的领域。近期研究报告近期研究报告《关注基本面支撑，高波风格占优——中邮因子周报 20250615》 -2025.06.16 lMistral 推出推理模型 Magistral 《结合基本面和量价特征的 GRU 模型》 - 2025.06.05 法国人工智能公司 Mistral AI 于 2025 年 6 月 10 日正式推出其首个专注于推理能力的大语言模型系列——Magistral，标志着该公司在 AI 领域的一次重要战略升级。该系列以“透明推理”和“多语言链式思考”为核心设计理念，旨在解决复杂逻辑任务中的可解释性与跨语言一致性难题，同时通过开源与商业并行的双版本策略，试图在竞争激烈的大模型市场中开辟差异化路径。《Claude 4 系列发布，谷歌上线编程智能体 Jules——AI 动态汇总20250526》 - 2025.05.27 《谷歌发布智能体白皮书，Manus 全面开放注册——AI 动态汇总 20250519》- 2025.05.20 lMeta 推出 LlamaRL 强化学习框架 Meta 公司于 2025 年 6 月 10 日发布的LlamaRL 强化学习框架，标志着大语言模型（LLM）训练技术的一次革命性突破。该框架通过全异步分布式架构与创新性技术组合，将 4050 亿参数模型的强化学习训练时间从 635.8 秒缩短至 59.5 秒，效率提升高达 10.7 倍，同时解决了传统 RLHF（基于人类反馈的强化学习）在资源消耗、内存瓶颈和 GPU 利用率低下等核心难题，为 AI 模型的快速迭代与安全对齐提供了全新基础设施。《证监会修改《重组办法》，深化并购重组改革——微盘股指数周报20250518》 - 2025.05.19 DeepSeek 发布数理证明大模型——AI动态汇总 20250505》 - 2025.05.06 《基金 Q1 加仓有色汽车传媒，减仓电新食饮通信——公募基金 2025Q1 季报点评》 - 2025.04.30 lAMD 举办 dvancing AI 2025 大会 AMD 于 2025 年 6 月 12 日在加州圣何塞举办的Advancing AI 2025大会，不仅成为挑战英伟达 AI 芯片霸主地位的关键转折点，更通过硬件革新、生态开放与战略合作的全方位布局，重新定义了 AI 计算的未来范式。《泛消费打开连板与涨幅高度，ETF 资金平铺机器人、人工智能与芯片——行业轮动周报 20250427》 -2025.04.28 l风险提示：以上内容基于历史数据完成，在政策、市场环境发生变化时存在失效的风险；历史信息不代表未来。摘要《国家队交易特征显著，短期指数仍交易补缺预期，TMT 类题材仍需等待——行业轮动周报 20250420》 -2025.04.21 《小市值持续，高低波风格交替——中邮因子周报 20250413》 -2025.04.14 目录 1AI 重点要闻 ................................................................................ 41.1OpenAI 发布 o3-pro ..................................................................... 41.2Mistral 推出推理模型 Magistral..........................................................61.3Meta 推出 LlamaRL 强化学习框架 .......................................................... 81.4AMD 举办 dvancing AI 2025 大会 ......................................................... 112企业动态..................................................................................132.1Meta 推出世界模型 V-JEPA 2.............................................................132.2玉盘 AI 推出 SRDA 架构..................................................................153AI 行业洞察 ............................................................................... 183.1七家主流大模型挑战 2025 高考数学.......................................................184技术前沿..................................................................................204.1Apple: The Illusion of Thinking ...................................................... 205风险提示..................................................................................22 图表目录图表 1： o3-pro 测评跑分..................................................................4图表 2： o3-Pro 价格相比 o1-pro 降低 87% ................................................... 4图表 3： o3-pro 4/4 可靠性评估............................................................5图表 4： o3-pro ARC-AGI 表现..............................................................5图表 5： Magistral 评测跑分...............................................................6图表 6： Magistral 不同训练方式下跑分对比.................................................6图表 7： LlamaRL 架构样例.................................................................9图表 8： LlamaRL vs. baseline 模型：深度学习速度对比 .....................................10图表 9：相较上一代性能提升 3 倍以上 ..................................................... 12图表 10： MI350 系列参数对比.............................................................12图表 11： V-JEPA 2 架构..................................................................15图表 12：算力需求缺口较大 .............................................................. 17图表 13： SRDA 架构......................................................................17图表 14： The Illusion of Thinking ...................................................... 20图表 15：模型"思考"行为提供了观测窗口 .................................................. 21图表 16：模型在不同复杂度下的推理路径探索模式 .......................................... 21 1AI 重点要闻 1.1OpenAI 发布 o3-pro OpenAI 于 2025 年 6 月 11 日正式发布了其最新一代 AI 推理模型 o3-pro，这一模型被官方称为“迄今为止最强大的 AI 模型”，并在多个领域展现出卓越性能。o3-pro 是此前推出的 o3 推理模型的升级版，专为深度思考和提供高可靠性响应而设计，尤其适用于数学、科学、编程等需要严谨逻辑的领域。 o3-pro 的核心优势在于其“推理模型”特性，能够逐步拆解问题并逻辑严密地得出结论，而非依赖传统 AI 模型的模式匹配方式。例如，在解决复杂数学证明或编写代码时，o3-pro 会先分析条件或需求，再调用相关知识逐步推导，显著减少错误。OpenAI 采用了严格的“4/4 可靠性”评估标准，即模型需在四次尝试中均正确回答问题才算成功。测试结果显示，o3-pro 在数学基准 AIME 2024 中超越谷歌 Gemini 2.5 Pro，在博士级科学测试 GPQA Diamond 中击败 Anthropic的 Claude 4 Opus。资料来源：OpenAI，中邮证券研究所资料来源：OpenAI，中邮证券研究所此外，o3-pro 支持多模态输入（文本和图像），上下文窗口达 200k token，并能调用工具链实现网页搜索、文件分析、Python 代码执行等功能。其记忆个性化功能可根据用户历史交互优化响应，但知识截至时间为 2024 年 6 月 1 日，需依赖外部工具获取更新信息。 o3-pro 的 API 定价为每百万输入 token 20 美元、输出 token 80 美元，较前代 o1-pro 降价 87%。同时，OpenAI 将 o3 模型价格大幅下调 80%（输入 2 美元/百万 token，输出 8 美元），这一策略被解读为降低技术门槛并应对竞争压力。值得注意的是，o3-pro 响应速度较慢，例如有用户测试显示简单问候需等待近 4分钟，官方建议其更适合可靠性优先的复杂任务。尽管性能强劲，o3-pro 仍存在多项限制：临时聊天功能因技术问题暂时禁用；不支持图像生成（

点击免费查看完整报告

【中邮金工】AI动态汇总：OpenAI发布o3-pro，Mistral推出推理模型Magistral

AI重点要闻

OpenAI发布o3-pro

Mistral推出推理模型Magistral

Meta推出LlamaRL强化学习框架

AMD举办dvancingAI2025大会

企业动态

Meta推出世界模型V-JEPA2

玉盘AI推出SRDA架构

AI行业洞察

七家主流大模型挑战2025高考数学

技术前沿

Apple:TheIllusionofThinking

风险提示

你可能感兴趣

AI动态汇总【中邮金工】：谷歌更新Gemini 2.5 Pro，阿里开源Qwen3新模型

AI动态汇总20250818：智元推出机器人世界模型平台genie envesioner，智谱上线GLM-4.5a视觉推理模型

AI动态汇总20250728：英伟达推出 OpenReasoning-Nemotron 推理模型， Qwen3 Coder 开源

AI动态汇总：Anthropic公开多智能体构建全流程，MiniMax推出推理模型M1

AI产业跟踪：海外：openAI发布o3-pro，Tolan获500万下载量

AI动态汇总20250421：OpenAI发布GPT-4.1，智谱发布GLM-4-32B-0414系列

AI动态汇总：openAI发布GPT-5，Claude Opus 4.1上线

OpenAI发布GPT-5，Claude Opus 4.1上线——AI动态汇总20250811

AI动态汇总：OpenAI发布搭建智能体新工具，谷歌发布轻量级模型Gemma 3

金工周报：AI动态汇总-通义千问发布Qwen-3模型，DeepSeek发布数理证明大模型