发布时间:2025-06-03 金工周报 研究所 分析师:肖承志SAC 登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文 SAC 登记编号:S1340124100011Email:fengyuwen@cnpsec.com DeepSeek-R1 完成小版本更新,阿里开源自主搜索AI 智能体——AI 动态汇总 20250602 lDeepSeek-R1 完成小版本更新 2025 年 5 月 28 日,DeepSeek 团队在 Hugging Face 平台悄然发布了 R1 推理模型的最新升级版本——DeepSeek-R1-0528。尽管官方将其定位为"小版本试升级",但实测表现远超预期,在推理能力、编程性能、长文本处理和写作质量等方面均有显著提升,被用户称为"重新定义小升级"的一次重大更新。 近期研究报告 《Claude 4 系列发布,谷歌上线编程智能体 Jules——AI 动态汇总20250526》 - 2025.05.27 l阿里开源自主搜索 AI 智能体 《谷歌发布智能体白皮书,Manus 全面开放注册——AI 动态汇总 20250519》- 2025.05.20 阿里巴巴于 2025 年 5 月 30 日正式开源的 WebAgent 代表了自主搜索 AI 领域的一次重大突破。这款具备端到端信息检索与多步推理能力的 AI 智能体,通过模拟人类在网络环境中的感知、决策和行动机制,重新定义了信息获取的方式。其核心创新在于将传统搜索引擎的被动响应模式转变为主动的智能代理服务,能够像专业研究员一样完成从信息检索到分析整合的全流程工作。 《证监会修改《重组办法》,深化并购重组改革——微盘股指数周报20250518》 - 2025.05.19 l我国首个软件开发 AI 智能体标准发布 DeepSeek 发布数理证明大模型——AI动态汇总 20250505》 - 2025.05.06 2025 年 5 月 27 日,中国信息通信研究院联合中国工商银行、百度、腾讯、阿里、华为等二十余家行业领军企业共同发布了《面向软件工程智能体的技术和应用要求 第 1 部分:开发智能体》(标准编号AIIA/T 0219-2025),这是我国首个针对软件开发智能体的全栈技术规范,标志着中国在 AI 智能体标准化建设上迈出了关键一步。该标准的出台既是对生成式 AI 技术快速发展的行业响应,也是推动软件开发范式革新的重要举措,其影响力已从技术领域延伸至产业生态重构层面。 《基金 Q1 加仓有色汽车传媒,减仓电新食饮通信——公募基金 2025Q1 季报点评》 - 2025.04.30 《泛消费打开连板与涨幅高度,ETF 资金平铺机器人、人工智能与芯片——行业轮动周报 20250427》 -2025.04.28 l昆仑万维发布超级智能体 《国家队交易特征显著,短期指数仍交易补缺预期,TMT 类题材仍需等待——行业轮动周报 20250420》 -2025.04.21 2025 年 5 月 22 日,昆仑万维面向全球市场发布的天工超级智能体(Skywork Super Agents)标志着中国在 AI 智能体领域的一次重大突破。这款产品通过创新的"5 专家+1 通用"智能体架构,重新定义了多模态内容生成的技术范式,其核心价值在于将深度研究(DeepResearch)能力与办公场景深度融合,实现了从信息检索到内容生产的全链路智能化。 《小市值持续,高低波风格交替——中邮因子周报 20250413》 -2025.04.14 l风险提示: 《4 月是否还会有“最后一跌”?——微盘股指数周报 20250406》- 2025.04.07 以上内容基于历史数据完成,在政策、市场环境发生变化时存在失效的风险;历史信息不代表未来。 《“924”以来融资资金防守后均见到行情低点,仍关注科技配置机会——行业轮动周报 20250330》 -2025.03.31 目录 1AI 重点要闻 ................................................................................ 41.1DeepSeek-R1 完成小版本更新 ............................................................. 41.2阿里开源自主搜索 AI 智能体..............................................................61.3我国首个软件开发 AI 智能体标准发布......................................................81.4昆仑万维发布超级智能体................................................................102企业动态..................................................................................122.1华为推出昇腾超节点技术................................................................122.2英伟达计划推出 Blackwell 架构特供芯片..................................................143AI 行业洞察 ............................................................................... 163.1Meta 拆分 AI 部门为两大团队,分别聚焦消费级产品与 AGI 基础研究 .......................... 164技术前沿..................................................................................174.1Pangu Light: 全新方法让 LLM 瘦身但不降智...............................................175风险提示..................................................................................20 图表目录 图表 1: DeepSeek-R1-0528 跑分............................................................4图表 2: DeepSeek 等模型的 AIME 2024 跑分 ..................................................4图表 3: WebWalker 架构...................................................................7图表 4: WebDancer 架构:两种网络数据生成流程 ............................................. 7图表 5: 标准编写成员 .................................................................... 9图表 6: 标准架构 ........................................................................ 9图表 7: 天工超级智能体 ................................................................. 11图表 8: 天工超级智能体打通 App 与 PC 端 .................................................. 11图表 9: 华为昇腾 384 超节点技术 ......................................................... 13图表 10: 英伟达计划推出 Blackwell 架构的中国特供芯片 .................................... 15图表 11: Pangu Light 论文...............................................................18图表 12: Pangu Light 核心架构...........................................................19图表 13: Pangu Light 与其他代表性模型在推理基准上的比较 ................................. 20图表 14: 剪枝率 vs.加速率...............................................................20 1AI 重点要闻 1.1DeepSeek-R1 完成小版本更新 2025 年 5 月 28 日,DeepSeek 团队在 Hugging Face 平台悄然发布了 R1 推理模型的最新升级版本——DeepSeek-R1-0528。尽管官方将其定位为"小版本试升级",但实测表现远超预期,在推理能力、编程性能、长文本处理和写作质量等方面均有显著提升,被用户称为"重新定义小升级"的一次重大更新。 在技术架构上,DeepSeek-R1-0528 延续了前代 R1 的混合专家模型(MoE)架构,参数量达 6850 亿(含 140 亿 MTP 层参数),采用稀疏激活机制,实际推理时仅激活约 370 亿参数,兼顾性能与效率。其最大亮点在于对"推理能力"的持续深耕,采用了"链式思维(Chain of Thought)"推理机制,能够在复杂问题上进行多步逻辑推演,输出清晰的思考过程。这一特性使其在数学、编程、科研等场景下表现尤为突出。以 AIME 2025 数学测试为例,旧版模型准确率仅为 70%,而新版模型准确率飙升至 87.5%。这一巨大进步得益于模型在推理过程中的思维深度增强——在 AIME 2025 测试集上,旧版模型平均每题使用 12K tokens,而新版模型平均每题使用 23K tokens,这表明新版模型在解题过程中进行了更为详尽和深入的思考。 资料来源:DeepSeek,中邮证券研究所 资料来源:DeepSeek,中邮证券研究所 在编程能力方面,DeepSeek-R1-0528 表现尤为亮眼。在国际权威代码生成榜单 LiveCodeBench 上,R1-0528 的代码生成能力仅次于 OpenAI 的 o3 mini 系列,超越了 Anthropic 的 Claude mini 和阿里的 Qwen 3 等知名模型。用户实测表明,该模型可一次性生成 1000+行无 bug 前端代码,支持动态交互(如天气卡片、数据可视化)、物理模拟(台球碰撞游戏)等复杂功能,媲美 Claude 4。生成的网页 UI 设计感也大幅提升,无需详细描述即可产出布局合理、视觉美观的界面。 在文本生成方面,DeepSeek-R1-0528 针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。新版 DeepSeek R1 还针对"幻觉"问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45-50%左右,能够