您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中邮证券]:AI动态汇总20250512:英伟达Llama-Nemotron模型表现优异,小米Mi-BRAG智能引擎亮相 - 发现报告

AI动态汇总20250512:英伟达Llama-Nemotron模型表现优异,小米Mi-BRAG智能引擎亮相

2025-05-14-中邮证券程***
AI智能总结
查看更多
AI动态汇总20250512:英伟达Llama-Nemotron模型表现优异,小米Mi-BRAG智能引擎亮相

市场有风险,投资需谨慎研究所分析师:肖承志SAC 登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文SAC 登记编号:S1340124100011Email:fengyuwen@cnpsec.com近期研究报告《通义千问发布 Qwen-3 模型,DeepSeek 发布数理证明大模型——AI动态汇总 20250505》 - 2025.05.06《基金 Q1 加仓有色汽车传媒,减仓电新食饮通信——公募基金 2025Q1 季报点评》 - 2025.04.30《泛消费打开连板与涨幅高度,ETF 资金平铺机器人、人工智能与芯片——行业轮动周报 20250427》 -2025.04.28《国家队交易特征显著,短期指数仍交易补缺预期,TMT 类题材仍需等待——行业轮动周报 20250420》 -2025.04.21《小市值持续,高低波风格交替——中邮因子周报 20250413》 -2025.04.14《4 月是否还会有“最后一跌”?——微盘股指数周报 20250406》- 2025.04.07《“924”以来融资资金防守后均见到行情低点,仍关注科技配置机会——行业轮动周报 20250330》 -2025.03.31《英伟达召开 GTC 2025 大会,Skywork-R1V、混元 T1 等推理模型接连上线——AI 动态汇总 20250324》 -2025.03.25《反转效应强势,GRU 模型新高——中邮因子周报 20250323》 - 2025.03.24《微盘领涨创下历史新高,4 月临近仍有调整压力20250316》 - 2025.03.17 金工周报DeepSeek-R1。l小米 Mi-BRAG 智能引擎亮相代。l风险提示:失效的风险;历史信息不代表未来。 ——微盘股指数周报 目录1AI 重点要闻 ................................................................................ 41.1英伟达开源模型 Llama-Nemotron 超越 DeepSeek-R1 .......................................... 41.2小米 Mi-BRAG 智能引擎亮相...............................................................71.3星动纪元联合清华发布首个 AIGC 机器人大模型..............................................91.4华为联合清华打造首个园区网络智能体....................................................122企业动态..................................................................................152.1Mistral 发布 Medium 3 大模型 ........................................................... 152.2阿里开源创新大模型搜索引擎 ZeroSearch ................................................. 173AI 行业洞察 ............................................................................... 193.1腾讯技术团队协助 DeepEP 通信框架,性能显著提升.........................................193.2Anysphere 完成 9 亿美元融资,估值达 90 亿美元.........................................204技术前沿..................................................................................204.1RepliBench: 检测大模型“自我复制”能力................................................205风险提示..................................................................................24 请务必阅读正文之后的免责条款部分2 图表目录图表 1: 人工分析智能指数 ................................................................ 4图表 2: LN-Ultra 253B 测评...............................................................4图表 3: Puzzle 框架......................................................................5图表 4: GPQA-Diamond 准确率与处理吞吐量之间的权衡 ........................................ 6图表 5: 预训练效果对比 .................................................................. 6图表 6: 训练过程中 GPQA-Diamond 的准确率得分 ............................................. 7图表 7: Mi-BRAG 系统流程.................................................................8图表 8: 知识问答框架 .................................................................... 9图表 9: SuperCLUE-RAG 生成能力排行榜 .....................................................9图表 10: VPP 两阶段学习框架.............................................................10图表 11: 高频预测和执行 ................................................................ 11图表 12: VPP 定量结果...................................................................12图表 13: 园区网络智能体架构 ............................................................ 13图表 14: 网络数字地图时空分析 .......................................................... 14图表 15: 网络智能体的网络运维 Copilot...................................................15图表 16: Mistral Medium 3 模型测评......................................................16图表 17: Mistral vs. Llama 4 Maverick 能力对比..........................................17图表 18: PPO/GRPO 无搜索引擎训练架构....................................................18图表 19: DeepSeek 致谢腾讯技术团队......................................................19图表 20: ReoliBench .................................................................... 21图表 21: Fault Tree Analysis ........................................................... 21图表 22: Pass@10 表现 .................................................................. 23图表 23: RepliBench 模型表现............................................................24 请务必阅读正文之后的免责条款部分3 请务必阅读正文之后的免责条款部分1AI 重点要闻1.1英伟达开源模型 Llama-Nemotron 超越 DeepSeek-R12025 年 4 月,英伟达发布了开源模型 Llama-Nemotron,发布后该模型入选人工分析智能指数评选的“最智能”开源模型。Llama-Nemotron 系列共有三个模型,分别是 LN-Nano 8B,LN-Super 49B 和 LN-Ultra 253B,从英伟达公布的技术报告看,LN-Ultra 253B 全面赶超 DeepSeek-R1。资料来源:英伟达,中邮证券研究所就在 5 月 6 日,英伟达发布了最新的技术报告,从技术报告中可以看出,英伟达团队分析了 OpenAI 的 o1 模型和 DeepSeek-R1 模型,发现现有推理大模型在推理能力方面取得了显著进展,但在推理效率和内存占用方面仍有改进空间。因此,Llama-Nemotron 旨在研究如何在不牺牲推理能力的前提下减少模型的内存占用。在训练中,Llama-Nemotron 利用合成数据监督微调加强化学习,全面提升模型的推理能力,并且从头构建完善的后训练流程。Llama-Nemotron 模型的构建,分为五个阶段:第一阶段:神经架构搜索(NAS)。使用神经架构搜索从 Llama 3 模型中进行优化,以实现加速推理。通过块级局部蒸馏构建替代 Transformer 块的库,并使用混合整数规划(MIP)求解器选择最有效的配置。第二阶段:垂直压缩与 FFN 融合。对于 LN-Ultra 模型,引入了 FFN 融合技术,通过识别并替换连续的 FFN 块来减少序列深度,提高计算利用率。 图表2:LN-Ultra 253B 测评资料来源:英伟达,中邮证券研究所 4 请务必阅读正文之后的免责条款部分5第三阶段:知识蒸馏与继续预训练。在 NAS 阶段之后,LN-Super 和 LN-Ultra分别进行了知识蒸馏和继续预训练,以提高模型质量并恢复块替换过程中可能引入的质量损失。第四阶段:监督微调(SFT)。使用混合指令数据和来自强教师模型(如DeepSeek-R1)的推理轨迹进行监督微调,使模型能够执行多步推理。第五阶段:大规模强化学习。对 LN-Ultra 进行大规模强化学习训练,特别是在复杂数学和 STEM 数据集上,使其超越教师模型的能力。Llama-Nemotron 借助神经架构搜索 Puzzle 框架,优化了模型推理效率,Puzzle 能够在实际部署限制下,将大语言模型转化为更适配硬件运行的高效版本。通过“逐块局部蒸馏”的方式,开发者利用 Llama 3 Instruct 构建了替