您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中邮证券]:金工周报:AI动态汇总-通义千问发布Qwen-3模型,DeepSeek发布数理证明大模型 - 发现报告

金工周报:AI动态汇总-通义千问发布Qwen-3模型,DeepSeek发布数理证明大模型

2025-05-06肖承志、冯昱文中邮证券庄***
AI智能总结
查看更多
金工周报:AI动态汇总-通义千问发布Qwen-3模型,DeepSeek发布数理证明大模型

发布时间:2025-05-06 金工周报 研究所 分析师:肖承志SAC 登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文 SAC 登记编号:S1340124100011Email:fengyuwen@cnpsec.com 通义千问发布 Qwen-3 模型,DeepSeek 发布数理证明大模型——AI 动态汇总 20250505 l通义千问发布 Qwen-3 模型 4 月 29 日,通义千问发布 Qwen-3 模型,可以看到本次发布的旗舰模型为 Qwen3-235B-A22B,在诸多基准测试中表现超越 DeepSeek-R1、o1、o3-mini、Grok-3、Gemini-2.5-Pro 等模型。除此之外,小型模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一 筹 , 甚 至 像 Qwen3-4B 这 样 的 小 模 型 也 能 匹 敌 Qwen2.5-72B-Instruct 的性能。 近期研究报告 《基金 Q1 加仓有色汽车传媒,减仓电新食饮通信——公募基金 2025Q1 季报点评》 - 2025.04.30 《泛消费打开连板与涨幅高度,ETF 资金平铺机器人、人工智能与芯片——行业轮动周报 20250427》 -2025.04.28 lDeepSeek 发 布 数 理 证 明 大 模 型 DeepSeek-Prover-V2-671B 4 月 30 日,DeepSeek 发布了应用于数理问题形式化定理证明场景的大模型 DeepSeek-Prover-V2-671B。所谓形式化定理证明是指在数理逻辑中,不以自然语言书写而是以形式化语言书写的论证:这种语言包含了由一个给定的字母表中的字符所构成的字符串。而证明则是一种由该些字符串组成的有限长度的序列。这种定义使得人们可以谈论严格意义上的“证明”,而不涉及任何逻辑上的模糊之处。研究证明的形式化和公理化的理论称为证明论。 《国家队交易特征显著,短期指数仍交易补缺预期,TMT 类题材仍需等待——行业轮动周报 20250420》 -2025.04.21 《小市值持续,高低波风格交替——中邮因子周报 20250413》 -2025.04.14 lGrok 3.5 将于本周推出 4 月 29 日,马斯克在社交平台 X 上表示,Grok 3.5 早期测试版将将于本周向 SuperGrok 订阅者发布,同时,马斯克称“Grok 3.5 是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能”且“Grok 是从第一性原理推理并得出互联网上根本不存在的答案”。 《4 月是否还会有“最后一跌”?——微盘股指数周报 20250406》- 2025.04.07 《“924”以来融资资金防守后均见到行情低点,仍关注科技配置机会——行业轮动周报 20250330》 -2025.03.31 l小米开源推理大模型 MiMo-7B-RL 4 月 30 日,小米开源其首个推理大模型 Xiaomi MiMo,该模型发布版本为 MiMo-7B-RL,虽然模型参数量不大,但在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)基准上超过了 o1-mini 模型和通义千问的 QwQ-32B-Preview 模型。目前模型已开源。 《英伟达召开 GTC 2025 大会,Skywork-R1V、混元 T1 等推理模型接连上线——AI 动态汇总 20250324》 -2025.03.25 l风险提示: 以上内容基于历史数据完成,在政策、市场环境发生变化时存在失效的风险;历史信息不代表未来。 《反转效应强势,GRU 模型新高——中邮因子周报 20250323》 - 2025.03.24 《微盘领涨创下历史新高,4 月临近仍有调整压力——微盘股指数周报20250316》 - 2025.03.17 《小市值强势,动量风格依旧——中邮因子周报 20250309》 - 2025.03.10 目录 1AI 重点要闻 ................................................................................ 41.1通义千问发布 Qwen-3 模型................................................................41.2DeepSeek 发布数理证明大模型 DeepSeek-Prover-V2-671B.....................................61.3Grok 3.5 将于本周推出 .................................................................. 81.4小米开源推理大模型 MiMo-7B-RL .......................................................... 92企业动态..................................................................................112.1亚马逊发布 Amazon Nova Premier 模型....................................................112.2Meta 发布 ReasonIR-8B 模型 ............................................................. 132.3FutureHouse 发布科学家智能体 .......................................................... 143AI 行业洞察 ............................................................................... 153.1智能数据标注产业发展观察报告: 传统模式迈向智能化新业态................................153.2InfiGUI-R1:利用强化学习,让 GUI 智能体学会规划任务、反思错误..........................164技术前沿..................................................................................184.1Paper2Code: 科研报告代码复现智能体....................................................185风险提示..................................................................................22 图表目录 图表 1: Qwen-3-235B-A22B 测评............................................................4图表 2: Qwen-3-30B-A3B 测评..............................................................4图表 3: Qwen-3 混合思考模式..............................................................5图表 4: Qwen-3 训练框架..................................................................6图表 5: DeepSeek-Prover-V2 模型表现......................................................7图表 6: DeepSeek-Prover-V2 冷启动........................................................8图表 7: 宣布 Grok-3.5 即将推出 ........................................................... 9图表 8: MiMo-7B 模型测评................................................................10图表 9: MiMo-7B 训练架构................................................................10图表 10: Seamless Rollout 系统..........................................................11图表 11: Nova Premier 对比..............................................................12图表 12: RAG 检索性能不足...............................................................13图表 13: ReasonIR-8B 训练数据架构 .......................................................14图表 14: liteQA 基准测试................................................................15图表 15: Actor2Reasoner 架构............................................................17图表 16: Paper2Code .................................................................... 18图表 17: Paper2Code .................................................................... 19图表 18: 第一阶段:规划阶段 ............................................................ 20图表 19: 第二阶段:分析阶段 ............................................................ 21图表 20: 第三阶段:编码阶段 ............................................................ 21 1AI 重点要闻 1.1通义千问发布 Qwen-3 模型 4 月 29 日,通义千问发布 Qwen-3 模型,可以看到本次发布的旗舰模型为Qwen3-235B-A22B,在诸多基准测试中表现超越 DeepSeek-R1、o1、o3-mini、Grok-3、Gemini-2.5-Pro 等模型。除此之外,小型模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌Qwen2.5-72B-Instruct 的性能。 本次开源了两个 MoE 模型:Qwen3-235B-A22B 以及 Qwen3-30B-A3B,其中 A22B和 A3B 指的是最小激活参数为 2