AI智能总结
2025 年 3 月 24 日 研究所研究所 金工周报标题 分析师:肖承志SAC 登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文 SAC 登记编号:S1340124100011Email:fengyuwen@cnpsec.com研究所 英伟达召开 GTC 2025 大会,Skywork-R1V、混元T1 等推理模型接连上线——AI 动态汇总 20250324标题摘要 l英伟达召开 GTC 2025 大会 英伟达于 2025 年 3 月 17 日至 3 月 19 日在美国加州圣何塞举行GTC AI 大会,会议内容包括发布最新 AI 芯片,量子计算论坛,机器人领域内容发布等。 近期研究报告近期研究报告 《反转效应强势,GRU 模型新高——中邮因子周报 20250323》 - 2025.03.24 l昆仑万维开源 Skywork R1V 视觉思维链推理模型 昆仑万维于 3 月 18 日开源了视觉思维链推理 Skywork R1V,该模型是首款工业界多模态思维链推理模型。据介绍,Skywork R1V 模型具备视觉思维链能力,能够对视觉输入进行多步逻辑推理,将基于图像的复杂问题分解为可处理的步骤;同时,模型可以进行数学与科学分析,能够高精度地解决视觉数学问题,并解读科学/医学图像;除此之外,Skywork R1V 还可以做到跨模态理解,可以无缝整合文本和图像,实现更丰富、情境感知的理解。 《小市值强势,动量风格依旧——中邮因子周报 20250309》 - 2025.03.10 《泛科技大幅回调,融资资金和 ETF资金逆市流入行业轮动周报20250302》 - 2025.03.03 l腾讯混元推出全新推理大模型 T1 3 月 21 日,腾讯混元开源全新推理大模型 T1,是业内首个强化学习驱动,超大规模混合 Mamba 推理模型。T1 是基于今年 2 月上线的混元 T1-Preview(Hunyuan-Thinker-1-Preview)推理模型升级而来,使用了 3 月初发布的业界首个超大规模 Hybrid-Transformer-Mamba MoE 大模型 TurboS 快思考基座,通过大规模后训练显著扩展了推理能力,并进一步对齐人类偏好。 《高波不再持续,多数风格切换——中邮因子周报 20250302》–2025.03.03 《3 月胜率最高的策略:多微盘空1000——微盘股指数周报 20250302》– 2025.03.02 lMistral Small 3.1 登场,24B 模型同级别最强 《Deepseek 背景综述及在金融领域应用场景初探》 - 2025.02.26 3 月 17 日,Mistral 宣布开源 Mistral Samll 3.1 模型,该模型主打高效运行,可以在单张 RTX 4090 显卡的 PC 或者 32GB 内存的 Mac上本地运行,同时拥有 128k 上下文能力,适用于虚拟助手等需要快速、准确响应的应用,让其成为预算有限的中小型企业和开发者的理想选择。 l风险提示: 本报告所有信息基于网络内容整理,不构成投资建议。摘要 《全面牛市正在到来,微盘有望修复前高——微盘股指数周报 20250209》- 2025.02.10 《基本面表现强势,风格切换加速——中邮因子周报 20250126》 -2025.01.27近期研究报告 目录 1AI 重点要闻 ................................................................................ 41.1英伟达召开 GTC 2025 大会................................................................41.2昆仑万维开源 Skywork R1V 视觉思维链推理模型.............................................71.3腾讯混元推出全新推理大模型 T1 .......................................................... 91.4Mistral Small 3.1 登场,24B 模型同级别最强.............................................102企业动态..................................................................................112.1最贵大模型服务:OpenAI 推出 o1-pro API................................................112.2豆包编程能力升级:支持 HTML 代码实时预览、交互.........................................122.3文心大模型 4.5 & X1 发布...............................................................123AI 行业洞察 ............................................................................... 143.1Roblox 发布 AI 建模工具,简单提示词即可生成 3D 模型 ..................................... 144技术前沿..................................................................................154.1谷歌推出全新 Scaling Laws ............................................................. 154.2大模型与人类交互过程中表现欠佳,反馈修正率低下........................................164.3借鉴 DeepSeek-R1 训练方法,小米团队推出 7B 模型登顶 MMAU 榜单............................185风险提示..................................................................................19 图表目录 图表 1: Blackwell 的性能是 Hopper 的 40 倍 .................................................4图表 2: B200 DeepSeek-R1 跑分............................................................5图表 3: TPS 显著提升.....................................................................6图表 4: Blackwell 投产展示...............................................................6图表 5: 全新 AI 芯片 ..................................................................... 7图表 6: AI 发展历程......................................................................7图表 7: Skywork R1V 评测对比.............................................................8图表 8: Skywork R1V 评测对比 2 ........................................................... 8图表 9: 混元 T1 评测对比 ................................................................. 9图表 10: 混元 T1 评测对比 2..............................................................10图表 11: 同级别模型对比 ................................................................ 11图表 12: 推理方案架构 .................................................................. 11图表 13: 文心 4.5 多模态能力对比 ........................................................ 13图表 14: Cube 效果展示..................................................................14图表 15: DiLoCo 论文....................................................................15图表 16: DiLoCo 架构....................................................................16图表 17: InterFeedback 论文.............................................................17图表 18: INTERFEEDBACK 框架.............................................................17图表 19: 数据集构建 .................................................................... 18图表 20: 小米 AQA 论文 .................................................................. 19 1AI 重点要闻 1.1英伟达召开 GTC 2025 大会 英伟达于 2025 年 3 月 17 日至 3 月 19 日在美国加州圣何塞举行 GTC AI 大会,会议内容包括发布最新 AI 芯片,量子计算论坛,机器人领域内容发布等。其中值得关注的内容包括以下部分: Dynamo 是一个“分布式推理服务库”。本质上,它是一个针对用户需求 token 而无法生产足够 token 之间问题的开源解决方案。黄仁勋表示,在 Dynamo、Grace Blackwell NVLink72 超级芯片的加持下,Blackwell 相比 Hopper 可实现 25 倍的性能提升。而在推理模型中,Blackwell 的性能是 Hopper 的 40 倍。 资料来源:The Register,中邮证券研究所 ·NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录 在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。英伟达表示,随着