行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

金工周报：AI动态汇总-通义千问发布Qwen-3模型，DeepSeek发布数理证明大模型

2025-05-06 肖承志,冯昱文中邮证券庄晓瑞

AI重点要闻

通义千问发布Qwen-3模型

通义千问于4月29日发布Qwen-3模型，旗舰模型为Qwen3-235B-A22B，在多项基准测试中超越DeepSeek-R1、o1、o3-mini、Grok-3、Gemini2.5-Pro等模型。
小型模型Qwen3-30B-A3B参数量仅为QwQ-32B的10%，表现更优，甚至Qwen3-4B也能匹敌Qwen2.5-72B-Instruct的性能。
Qwen-3支持多种思考模式，是全球第三个混合推理模型，也是国内首款混合推理模型。
Qwen-3在智能体开发方面针对Agent协同与代码能力进行了优化，全面适配AIAgent生态。
训练方面，Qwen-3使用的数据量达36万亿个token，涵盖119种语言和方言，预训练过程分为三个阶段，并进行后训练以增强推理能力。

DeepSeek发布数理证明大模型DeepSeek-Prover-V2-671B

DeepSeek于4月30日发布应用于数理问题形式化定理证明场景的大模型DeepSeek-Prover-V2-671B。
该模型训练思路模仿人类数学家，构建递归子目标分解框架，将复杂定理分解为可管理的子目标（Lemma）。
训练过程中使用课程学习与强化学习增强推理解题能力，引入双模式推理架构，简单问题采用非链式思考模式，复杂问题采用链式思考模式。
DeepSeek-Prover-V2模型成功证明AMC竞赛题和高等数学问题。

Grok3.5将于本周推出

马斯克于4月29日在社交平台X表示，Grok3.5早期测试版将向SuperGrok订阅者发布。
马斯克称Grok3.5是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能，并能从第一性原理推理并得出互联网上根本不存在的答案。

小米开源推理大模型MiMo-7B-RL

小米于4月30日开源其首个推理大模型XiaomiMiMo，发布版本为MiMo-7B-RL。
MiMo-7B-RL在数学推理和代码竞赛基准上超过o1-mini模型和通义千问的QwQ-32B-Preview模型。
训练数据包括25Ttokens的网页、论文、代码和合成数据，采用三阶段数据混合策略，后训练部分精选13万道数学和代码题。
设计了SeamlessRollout系统，加速强化学习训练。

企业动态

亚马逊发布AmazonNovaPremier模型

亚马逊于5月3日推出AmazonNovaPremier，是Nova系列功能最强大的模型，适用于处理复杂任务，可作为模型蒸馏的教师模型。
NovaPremier能处理文本、图像和视频，擅长深度理解上下文、多步骤规划以及跨多工具和数据来源精确执行的任务。
NovaPremier的上下文长度为100万个token，能处理超长文档或大型代码库。

Meta发布ReasonIR-8B模型

MetaAI于4月30日推出ReasonIR-8B模型，专为推理密集型检索设计，在检索精度、成本和效率上取得突破。
ReasonIR-8B采用双编码器架构，训练数据包括长达2000个token的多样长度查询和需逻辑推理的困难查询。
MetaAI已开源ReasonIR-8B模型、训练代码及合成数据工具。

FutureHouse发布科学家智能体

FutureHouse于5月3日发布四个超人类的AI科学家智能体：Crow（乌鸦）、Falcon（猎鹰）、Owl（猫头鹰）和Phoenix（凤凰）。
Crow负责精确文献检索，Falcon完成深度文献综述与知识整合，Owl聚焦科研历史脉络梳理，Phoenix为多模态药物研发引擎。
Crow、Falcon和Owl在搜索精度和准确性上超越顶级搜索模型，如o3-mini、GPT-4.5、Claude-3.7。

AI行业洞察

智能数据标注产业发展观察报告

传统人力密集型标注模式加速向智能驱动和平台化转型，产业转型核心路径依托技术驱动革新与平台化新业态。
政策端发力，四部门联合发布《关于促进数据标注产业高质量发展的实施意见》，明确提出到2027年产业规模年均复合增长率超20%。
市场生态重构，国有企业、政府部门加速释放标注需求，公共数据标注目录编制及政务大模型协同开发成为重点方向。
未来挑战在标准化与质量监管与人才培养与就业拉动方面。

InfiGUI-R1

InfiGUI-R1是基于Actor2Reasoner框架训练的GUI智能体，旨在让AI像人一样在行动前思考，行动后反思。
Actor2Reasoner框架分为两个阶段：推理注入和深思熟虑增强。
推理注入阶段采用空间推理蒸馏技术，将GUI智能体从“行动者”转变为“基础推理者”。
深思熟虑增强阶段利用强化学习提升模型的规划和反思能力，通过目标引导和错误回溯方法。
InfiGUI-R1-3B模型在多个关键基准测试中展现卓越性能。

技术前沿

Paper2Code:科研报告代码复现智能体

韩国科学技术院和DeepAuto.ai开发的PaperCoder框架能自动从机器学习论文中生成高质量的代码仓库。
PaperCoder采用多代理LLM框架，分为规划、分析和生成三个阶段。
规划阶段构建高层次路线图，绘制类图和序列图，识别文件依赖关系，生成配置文件。
分析阶段对每个文件和函数进行细致解析，理解其预期功能。
生成阶段根据先前确定的执行顺序和工件合成整个代码库。
PaperCoder在实验和评估中表现遥遥领先于其他基线模型。

发布时间：2025-05-06 金工周报研究所分析师:肖承志SAC 登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文 SAC 登记编号:S1340124100011Email:fengyuwen@cnpsec.com 通义千问发布 Qwen-3 模型，DeepSeek 发布数理证明大模型——AI 动态汇总 20250505 l通义千问发布 Qwen-3 模型 4 月 29 日，通义千问发布 Qwen-3 模型，可以看到本次发布的旗舰模型为 Qwen3-235B-A22B，在诸多基准测试中表现超越 DeepSeek-R1、o1、o3-mini、Grok-3、Gemini-2.5-Pro 等模型。除此之外，小型模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%，表现更胜一筹，甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。近期研究报告《基金 Q1 加仓有色汽车传媒，减仓电新食饮通信——公募基金 2025Q1 季报点评》 - 2025.04.30 《泛消费打开连板与涨幅高度，ETF 资金平铺机器人、人工智能与芯片——行业轮动周报 20250427》 -2025.04.28 lDeepSeek 发布数理证明大模型 DeepSeek-Prover-V2-671B 4 月 30 日，DeepSeek 发布了应用于数理问题形式化定理证明场景的大模型 DeepSeek-Prover-V2-671B。所谓形式化定理证明是指在数理逻辑中，不以自然语言书写而是以形式化语言书写的论证：这种语言包含了由一个给定的字母表中的字符所构成的字符串。而证明则是一种由该些字符串组成的有限长度的序列。这种定义使得人们可以谈论严格意义上的“证明”，而不涉及任何逻辑上的模糊之处。研究证明的形式化和公理化的理论称为证明论。《国家队交易特征显著，短期指数仍交易补缺预期，TMT 类题材仍需等待——行业轮动周报 20250420》 -2025.04.21 《小市值持续，高低波风格交替——中邮因子周报 20250413》 -2025.04.14 lGrok 3.5 将于本周推出 4 月 29 日，马斯克在社交平台 X 上表示，Grok 3.5 早期测试版将将于本周向 SuperGrok 订阅者发布，同时，马斯克称“Grok 3.5 是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能”且“Grok 是从第一性原理推理并得出互联网上根本不存在的答案”。《4 月是否还会有“最后一跌”？——微盘股指数周报 20250406》- 2025.04.07 《“924”以来融资资金防守后均见到行情低点，仍关注科技配置机会——行业轮动周报 20250330》 -2025.03.31 l小米开源推理大模型 MiMo-7B-RL 4 月 30 日，小米开源其首个推理大模型 Xiaomi MiMo，该模型发布版本为 MiMo-7B-RL，虽然模型参数量不大，但在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）基准上超过了 o1-mini 模型和通义千问的 QwQ-32B-Preview 模型。目前模型已开源。《英伟达召开 GTC 2025 大会，Skywork-R1V、混元 T1 等推理模型接连上线——AI 动态汇总 20250324》 -2025.03.25 l风险提示：以上内容基于历史数据完成，在政策、市场环境发生变化时存在失效的风险；历史信息不代表未来。《反转效应强势，GRU 模型新高——中邮因子周报 20250323》 - 2025.03.24 《微盘领涨创下历史新高，4 月临近仍有调整压力——微盘股指数周报20250316》 - 2025.03.17 《小市值强势，动量风格依旧——中邮因子周报 20250309》 - 2025.03.10 目录 1AI 重点要闻 ................................................................................ 41.1通义千问发布 Qwen-3 模型................................................................41.2DeepSeek 发布数理证明大模型 DeepSeek-Prover-V2-671B.....................................61.3Grok 3.5 将于本周推出 .................................................................. 81.4小米开源推理大模型 MiMo-7B-RL .......................................................... 92企业动态..................................................................................112.1亚马逊发布 Amazon Nova Premier 模型....................................................112.2Meta 发布 ReasonIR-8B 模型 ............................................................. 132.3FutureHouse 发布科学家智能体 .......................................................... 143AI 行业洞察 ............................................................................... 153.1智能数据标注产业发展观察报告: 传统模式迈向智能化新业态................................153.2InfiGUI-R1：利用强化学习，让 GUI 智能体学会规划任务、反思错误..........................164技术前沿..................................................................................184.1Paper2Code: 科研报告代码复现智能体....................................................185风险提示..................................................................................22 图表目录图表 1： Qwen-3-235B-A22B 测评............................................................4图表 2： Qwen-3-30B-A3B 测评..............................................................4图表 3： Qwen-3 混合思考模式..............................................................5图表 4： Qwen-3 训练框架..................................................................6图表 5： DeepSeek-Prover-V2 模型表现......................................................7图表 6： DeepSeek-Prover-V2 冷启动........................................................8图表 7：宣布 Grok-3.5 即将推出 ........................................................... 9图表 8： MiMo-7B 模型测评................................................................10图表 9： MiMo-7B 训练架构................................................................10图表 10： Seamless Rollout 系统..........................................................11图表 11： Nova Premier 对比..............................................................12图表 12： RAG 检索性能不足...............................................................13图表 13： ReasonIR-8B 训练数据架构 .......................................................14图表 14： liteQA 基准测试................................................................15图表 15： Actor2Reasoner 架构............................................................17图表 16： Paper2Code .................................................................... 18图表 17： Paper2Code .................................................................... 19图表 18：第一阶段：规划阶段 ............................................................ 20图表 19：第二阶段：分析阶段 ............................................................ 21图表 20：第三阶段：编码阶段 ............................................................ 21 1AI 重点要闻 1.1通义千问发布 Qwen-3 模型 4 月 29 日，通义千问发布 Qwen-3 模型，可以看到本次发布的旗舰模型为Qwen3-235B-A22B，在诸多基准测试中表现超越 DeepSeek-R1、o1、o3-mini、Grok-3、Gemini-2.5-Pro 等模型。除此之外，小型模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%，表现更胜一筹，甚至像 Qwen3-4B 这样的小模型也能匹敌Qwen2.5-72B-Instruct 的性能。本次开源了两个 MoE 模型：Qwen3-235B-A22B 以及 Qwen3-30B-A3B，其中 A22B和 A3B 指的是最小激活参数为 2

点击免费查看完整报告

金工周报：AI动态汇总-通义千问发布Qwen-3模型，DeepSeek发布数理证明大模型

AI重点要闻

通义千问发布Qwen-3模型

DeepSeek发布数理证明大模型DeepSeek-Prover-V2-671B

Grok3.5将于本周推出

小米开源推理大模型MiMo-7B-RL

企业动态

亚马逊发布AmazonNovaPremier模型

Meta发布ReasonIR-8B模型

FutureHouse发布科学家智能体

AI行业洞察

智能数据标注产业发展观察报告

InfiGUI-R1

技术前沿

Paper2Code:科研报告代码复现智能体

你可能感兴趣

金工周报：AI动态汇总：Gemini2.5Pro发布即屠榜，DeepSeekV3完成模型更新

AI动态汇总：DeepSeek线上模型升级至V3.1，字节开源360亿参数Seed-OSS系列模型

人工智能周报（24年第19周）：OpenAI推出图片检测专用AI工具，阿里云通义千问2.5大模型发布

计算机行业研究周报：GPTs发布和通义千问升级助推AI大模型应用生态繁荣

AI动态汇总：谷歌推出Gemini Robotics On-Device大模型，快手开源keye-VL多模态模型

AI动态汇总【中邮金工】：谷歌更新Gemini 2.5 Pro，阿里开源Qwen3新模型

AI动态汇总20250804：智谱发布GLM-4.5，蚂蚁数科发布金融推理大模型Agentar-Fin-R1

【中邮金工】AI动态汇总：OpenAI发布o3-pro，Mistral推出推理模型Magistral

传媒行业周观察：阿里通义千问2.5大模型发布，关注OpenAI新产品发布进展，AI产业趋势向上

AI动态汇总：AI模型通过标准图灵测试，智谱发布AI Agent AutoGLM沉思

金工周报：AI动态汇总-通义千问发布Qwen-3模型，DeepSeek发布数理证明大模型

你可能感兴趣

金工周报：AI动态汇总：Gemini2.5Pro发布即屠榜，DeepSeekV3完成模型更新

AI动态汇总：DeepSeek线上模型升级至V3.1，字节开源360亿参数Seed-OSS系列模型

人工智能周报（24年第19周）：OpenAI推出图片检测专用AI工具，阿里云通义千问2.5大模型发布

计算机行业研究周报：GPTs发布和通义千问升级 助推AI大模型应用生态繁荣

AI动态汇总：谷歌推出Gemini Robotics On-Device大模型，快手开源keye-VL多模态模型

AI动态汇总【中邮金工】：谷歌更新Gemini 2.5 Pro，阿里开源Qwen3新模型

AI动态汇总20250804：智谱发布GLM-4.5，蚂蚁数科发布金融推理大模型Agentar-Fin-R1

【中邮金工】AI动态汇总：OpenAI发布o3-pro，Mistral推出推理模型Magistral

传媒行业周观察：阿里通义千问2.5大模型发布，关注OpenAI新产品发布进展，AI产业趋势向上

AI动态汇总：AI模型通过标准图灵测试，智谱发布AI Agent AutoGLM沉思

计算机行业研究周报：GPTs发布和通义千问升级助推AI大模型应用生态繁荣