行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

AI动态汇总：英伟达召开GTC 2025大会，Skywork-R1V、混元T1等推理模型接连上线

2025-03-24 肖承志,冯昱文中邮证券叶剑锋

AI重点要闻

英伟达召开GTC2025大会

英伟达发布Dynamo，号称“AI工厂的操作系统”，与Grace Blackwell NVLink 72超级芯片结合，使Blackwell相比Hopper性能提升25倍，推理模型性能提升40倍。
NVIDIABlackwell DGX系统在单个DGX系统上运行6710亿参数的DeepSeek-R1模型，实现每用户每秒超250token的响应速度，系统最高吞吐量突破每秒3万token。
GraceBlackwell解决方案已全面投产，包括GB200和B200，采用台积电4nm工艺制造，拥有高达2080亿个晶体管。
英伟达发布新一代AI芯片Rubin，并声称下一代芯片架构为Feynman，将于2026年推出。
黄仁勋首次提出Agentic AI与机器人的Physical AI，认为目前处于生成式AI阶段，未来将进入代理式AI阶段，最终进入机器人的物理AI阶段。

昆仑万维开源SkyworkR1V视觉思维链推理模型

SkyworkR1V是首款工业界多模态思维链推理模型，具备视觉思维链能力，能够对视觉输入进行多步逻辑推理，进行数学与科学分析，并实现跨模态理解。

腾讯混元推出全新推理大模型T1

混元T1是基于混元T1-Preview推理模型升级而来，使用了Hybrid-Transformer-MambaMoE大模型TurboS快思考基座，通过大规模后训练显著扩展了推理能力，并进一步对齐人类偏好。
混元T1在各类公开benchmark和内部人工体验集评估上表现优异，尤其在文创指令遵循、文本摘要、agent能力方面略有胜。

MistralSmall3.1登场，24B模型同级别最强

MistralSmall3.1模型主打高效运行，可以在单张RTX4090显卡的PC或者32GB内存的Mac上本地运行，拥有128k上下文能力，适用于虚拟助手等应用。
MistralSmall3.1在多语言理解、视觉推理、图表信息提取和图解分析等方面表现出色，推理速度最高可以实现每秒150个tokens。

企业动态

最贵大模型服务：OpenAI推出o1-pro API

OpenAI推出o1-Pro的API服务，定价为每百万tokens输入150/输出600美元，宣称通过更高计算资源投入实现“更一致且优质的回应”。

豆包编程能力升级：支持HTML代码实时预览、交互

豆包宣布AI编程功能迎来三项升级：HTML实时预览与交互、Python代码直接运行+一键修复、生成完整项目。

文心大模型4.5&X1发布

百度文心一言发布文心大模型4.5和文心大模型X1，文心4.5具备更精进的语言能力，理解、生成、逻辑、记忆能力全面提升，去幻觉、逻辑推理、代码能力显著提升。
文心大模型4.5运用了FlashMask动态注意力掩码、多模态异构专家扩展技术、时空维度表征压缩技术、基于知识点的大规模数据构建技术、基于自反馈的Post-training技术等核心技术。
文心大模型X1是首个运用工具的深度思考模型，运用递进式强化学习方法，进行基于思维链和行动链的端到端训练，并设置了多元统一的奖励系统。

AI行业洞察

Roblox发布AI建模工具，简单提示词即可生成3D模型

Roblox推出3D模型工具“Cube”，旨在帮助创作者利用生成式AI制作3D物体，支持直接从文本生成3D模型和环境。

技术前沿

谷歌推出全新ScalingLaws

谷歌团队发表论文研究了DiLoCo在固定计算预算下训练大语言模型时的缩放规律，发现DiLoCo随模型规模的扩展具有可预测性和稳健性，在多个方面优于数据并行训练。

大模型与人类交互过程中表现欠佳，反馈修正率低下

新加坡国立团队发表论文提出InterFeedback框架及基准测试，用于评估大型多模态模型（LMMs）在与人类交互中的智能表现，发现现有LMMs在理解和利用反馈方面能力欠佳。

借鉴DeepSeek-R1训练方法，小米团队推出7B模型登顶MMAU榜单

小米大模型团队对阿里的Qwen2-Audio-7B模型进行了微调，并利用DeepSeek-R1的训练方式，得到表现优秀的音频处理模型，在MMAU上的准确率为64.5%，比以前霸榜的GPT-4o还高出近10个百分点。

2025 年 3 月 24 日研究所研究所金工周报标题分析师:肖承志SAC 登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文 SAC 登记编号:S1340124100011Email:fengyuwen@cnpsec.com研究所英伟达召开 GTC 2025 大会，Skywork-R1V、混元T1 等推理模型接连上线——AI 动态汇总 20250324标题摘要 l英伟达召开 GTC 2025 大会英伟达于 2025 年 3 月 17 日至 3 月 19 日在美国加州圣何塞举行GTC AI 大会，会议内容包括发布最新 AI 芯片，量子计算论坛，机器人领域内容发布等。近期研究报告近期研究报告《反转效应强势，GRU 模型新高——中邮因子周报 20250323》 - 2025.03.24 l昆仑万维开源 Skywork R1V 视觉思维链推理模型昆仑万维于 3 月 18 日开源了视觉思维链推理 Skywork R1V，该模型是首款工业界多模态思维链推理模型。据介绍，Skywork R1V 模型具备视觉思维链能力，能够对视觉输入进行多步逻辑推理，将基于图像的复杂问题分解为可处理的步骤；同时，模型可以进行数学与科学分析，能够高精度地解决视觉数学问题，并解读科学/医学图像；除此之外，Skywork R1V 还可以做到跨模态理解，可以无缝整合文本和图像，实现更丰富、情境感知的理解。《小市值强势，动量风格依旧——中邮因子周报 20250309》 - 2025.03.10 《泛科技大幅回调，融资资金和 ETF资金逆市流入行业轮动周报20250302》 - 2025.03.03 l腾讯混元推出全新推理大模型 T1 3 月 21 日，腾讯混元开源全新推理大模型 T1，是业内首个强化学习驱动，超大规模混合 Mamba 推理模型。T1 是基于今年 2 月上线的混元 T1-Preview（Hunyuan-Thinker-1-Preview）推理模型升级而来，使用了 3 月初发布的业界首个超大规模 Hybrid-Transformer-Mamba MoE 大模型 TurboS 快思考基座，通过大规模后训练显著扩展了推理能力，并进一步对齐人类偏好。《高波不再持续，多数风格切换——中邮因子周报 20250302》–2025.03.03 《3 月胜率最高的策略：多微盘空1000——微盘股指数周报 20250302》– 2025.03.02 lMistral Small 3.1 登场，24B 模型同级别最强《Deepseek 背景综述及在金融领域应用场景初探》 - 2025.02.26 3 月 17 日，Mistral 宣布开源 Mistral Samll 3.1 模型，该模型主打高效运行，可以在单张 RTX 4090 显卡的 PC 或者 32GB 内存的 Mac上本地运行，同时拥有 128k 上下文能力，适用于虚拟助手等需要快速、准确响应的应用，让其成为预算有限的中小型企业和开发者的理想选择。 l风险提示：本报告所有信息基于网络内容整理，不构成投资建议。摘要《全面牛市正在到来，微盘有望修复前高——微盘股指数周报 20250209》- 2025.02.10 《基本面表现强势，风格切换加速——中邮因子周报 20250126》 -2025.01.27近期研究报告目录 1AI 重点要闻 ................................................................................ 41.1英伟达召开 GTC 2025 大会................................................................41.2昆仑万维开源 Skywork R1V 视觉思维链推理模型.............................................71.3腾讯混元推出全新推理大模型 T1 .......................................................... 91.4Mistral Small 3.1 登场，24B 模型同级别最强.............................................102企业动态..................................................................................112.1最贵大模型服务：OpenAI 推出 o1-pro API................................................112.2豆包编程能力升级：支持 HTML 代码实时预览、交互.........................................122.3文心大模型 4.5 & X1 发布...............................................................123AI 行业洞察 ............................................................................... 143.1Roblox 发布 AI 建模工具，简单提示词即可生成 3D 模型 ..................................... 144技术前沿..................................................................................154.1谷歌推出全新 Scaling Laws ............................................................. 154.2大模型与人类交互过程中表现欠佳，反馈修正率低下........................................164.3借鉴 DeepSeek-R1 训练方法，小米团队推出 7B 模型登顶 MMAU 榜单............................185风险提示..................................................................................19 图表目录图表 1： Blackwell 的性能是 Hopper 的 40 倍 .................................................4图表 2： B200 DeepSeek-R1 跑分............................................................5图表 3： TPS 显著提升.....................................................................6图表 4： Blackwell 投产展示...............................................................6图表 5：全新 AI 芯片 ..................................................................... 7图表 6： AI 发展历程......................................................................7图表 7： Skywork R1V 评测对比.............................................................8图表 8： Skywork R1V 评测对比 2 ........................................................... 8图表 9：混元 T1 评测对比 ................................................................. 9图表 10：混元 T1 评测对比 2..............................................................10图表 11：同级别模型对比 ................................................................ 11图表 12：推理方案架构 .................................................................. 11图表 13：文心 4.5 多模态能力对比 ........................................................ 13图表 14： Cube 效果展示..................................................................14图表 15： DiLoCo 论文....................................................................15图表 16： DiLoCo 架构....................................................................16图表 17： InterFeedback 论文.............................................................17图表 18： INTERFEEDBACK 框架.............................................................17图表 19：数据集构建 .................................................................... 18图表 20：小米 AQA 论文 .................................................................. 19 1AI 重点要闻 1.1英伟达召开 GTC 2025 大会英伟达于 2025 年 3 月 17 日至 3 月 19 日在美国加州圣何塞举行 GTC AI 大会，会议内容包括发布最新 AI 芯片，量子计算论坛，机器人领域内容发布等。其中值得关注的内容包括以下部分： Dynamo 是一个“分布式推理服务库”。本质上，它是一个针对用户需求 token 而无法生产足够 token 之间问题的开源解决方案。黄仁勋表示，在 Dynamo、Grace Blackwell NVLink72 超级芯片的加持下，Blackwell 相比 Hopper 可实现 25 倍的性能提升。而在推理模型中，Blackwell 的性能是 Hopper 的 40 倍。资料来源：The Register，中邮证券研究所 ·NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度，系统最高吞吐量突破每秒 3 万 token。英伟达表示，随着

点击免费查看完整报告

AI动态汇总：英伟达召开GTC 2025大会，Skywork-R1V、混元T1等推理模型接连上线

AI重点要闻

英伟达召开GTC2025大会

昆仑万维开源SkyworkR1V视觉思维链推理模型

腾讯混元推出全新推理大模型T1

MistralSmall3.1登场，24B模型同级别最强

企业动态

最贵大模型服务：OpenAI推出o1-pro API

豆包编程能力升级：支持HTML代码实时预览、交互

文心大模型4.5&X1发布

AI行业洞察

Roblox发布AI建模工具，简单提示词即可生成3D模型

技术前沿

谷歌推出全新ScalingLaws

大模型与人类交互过程中表现欠佳，反馈修正率低下

借鉴DeepSeek-R1训练方法，小米团队推出7B模型登顶MMAU榜单

你可能感兴趣

电子行业周报：英伟达GTC大会成功举办，腾讯混元推出深度思考模型T1正式版

AI动态汇总20250818：智元推出机器人世界模型平台genie envesioner，智谱上线GLM-4.5a视觉推理模型

全球科技行业周报：英伟达GTC 2025召开，腾讯等厂商持续加码AI布局

通信行业研究：英伟达召开GTC大会，国内云厂商及大厂加大AI算力投入

行业周报：OpenClaw催化AI终端热度，英伟达GTC大会召开在即

AI动态汇总20250728：英伟达推出 OpenReasoning-Nemotron 推理模型， Qwen3 Coder 开源

英伟达黄仁勋GTC 2025大会（NVIDIA GTC 2025）演讲核心要点：AI工厂、机器人革命与算力的未来

互联网传媒研究周报：英伟达召开GTC大会，硬件升级促进VR行业发展

中小盘周报：英伟达GTC大会召开，小鹏G9发布，智能汽车加速演进

TMT行业周报（3月第3周）：英伟达召开GTC大会