行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

金工周报：AI动态汇总-DeepSeek-R1完成小版本更新，阿里开源自主搜索AI智能体

2025-06-03 肖承志,冯昱文中邮证券洪

AI重点要闻

DeepSeek-R1完成小版本更新

发布时间：2025年5月28日
主要提升：推理能力、编程性能、长文本处理和写作质量
技术架构：混合专家模型（MoE），参数量达6850亿
关键特性：链式思维（Chain of Thought）推理机制，支持128K超长上下文窗口
性能表现：AIME2025数学测试准确率87.5%，LiveCodeBench代码生成能力突出
其他更新：幻觉改善，支持工具调用与JSON输出

阿里开源自主搜索AI智能体

发布时间：2025年5月30日
核心创新：将传统搜索引擎的被动响应模式转变为主动的智能代理服务
技术架构：WebDancer训练框架和WebWalker基准测试系统
应用场景：信息检索、分析整合，支持多模态处理
开源意义：建立全球研究者共同改进的基准平台

我国首个软件开发AI智能体标准发布

发布时间：2025年5月27日
标准名称：《面向软件工程智能体的技术和应用要求第1部分：开发智能体》
技术架构："四维能力+五类场景"框架体系
应用场景：编码智能体、单元测试智能体、检查修复智能体等
产业影响：推动软件开发范式革新，预计市场规模年复合增长率达44.8%

昆仑万维发布超级智能体

发布时间：2025年5月22日
产品名称：天工超级智能体（SkyworkSuperAgents）
技术架构："5专家+1通用"智能体架构
核心特性：深度研究（DeepResearch）能力与办公场景深度融合
商业化路径：面向企业市场提供AIaaS服务，消费端通过创作者分成模式

企业动态

华为推出昇腾超节点技术

发布时间：2025年5月
技术架构："12计算柜+4总线柜"的硬件设计，全对等互联架构
性能表现：训练LLaMA3等千亿级稠密模型性能较传统H100集群快2.5倍
产业影响：构建全自主供应链，推动算力成本下降30%

英伟达计划推出Blackwell架构特供芯片

发布时间：2025年5月
产品名称：RTXPro6000D（推测命名为B40）
技术架构：服务器级图形处理器架构，内存带宽降至1.7TB/s
市场影响：中国占英伟达上财年营收的13%，特供版定价直指商业敏感点

AI行业洞察

Meta拆分AI部门为两大团队

调整内容：将AI部门拆分为AI产品团队与AGIFoundations团队
AI产品团队：专注于将AI技术转化为实际应用场景
AGIFoundations团队：专注于人工智能基础研究与长期技术突破

技术前沿

PanguLight:全新方法让LLM瘦身但不降智

核心创新：高效率结构化剪枝与加速方案
关键技术：权重重初始化策略、硬件感知优化
性能表现：PanguLight-32B在推理任务中达到2585tokens/s的吞吐量，较同等规模的Qwen3-32B提升16.2%

发布时间：2025-06-03 金工周报研究所分析师:肖承志SAC 登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文 SAC 登记编号:S1340124100011Email:fengyuwen@cnpsec.com DeepSeek-R1 完成小版本更新，阿里开源自主搜索AI 智能体——AI 动态汇总 20250602 lDeepSeek-R1 完成小版本更新 2025 年 5 月 28 日，DeepSeek 团队在 Hugging Face 平台悄然发布了 R1 推理模型的最新升级版本——DeepSeek-R1-0528。尽管官方将其定位为"小版本试升级"，但实测表现远超预期，在推理能力、编程性能、长文本处理和写作质量等方面均有显著提升，被用户称为"重新定义小升级"的一次重大更新。近期研究报告《Claude 4 系列发布，谷歌上线编程智能体 Jules——AI 动态汇总20250526》 - 2025.05.27 l阿里开源自主搜索 AI 智能体《谷歌发布智能体白皮书，Manus 全面开放注册——AI 动态汇总 20250519》- 2025.05.20 阿里巴巴于 2025 年 5 月 30 日正式开源的 WebAgent 代表了自主搜索 AI 领域的一次重大突破。这款具备端到端信息检索与多步推理能力的 AI 智能体，通过模拟人类在网络环境中的感知、决策和行动机制，重新定义了信息获取的方式。其核心创新在于将传统搜索引擎的被动响应模式转变为主动的智能代理服务，能够像专业研究员一样完成从信息检索到分析整合的全流程工作。《证监会修改《重组办法》，深化并购重组改革——微盘股指数周报20250518》 - 2025.05.19 l我国首个软件开发 AI 智能体标准发布 DeepSeek 发布数理证明大模型——AI动态汇总 20250505》 - 2025.05.06 2025 年 5 月 27 日，中国信息通信研究院联合中国工商银行、百度、腾讯、阿里、华为等二十余家行业领军企业共同发布了《面向软件工程智能体的技术和应用要求第 1 部分：开发智能体》（标准编号AIIA/T 0219-2025），这是我国首个针对软件开发智能体的全栈技术规范，标志着中国在 AI 智能体标准化建设上迈出了关键一步。该标准的出台既是对生成式 AI 技术快速发展的行业响应，也是推动软件开发范式革新的重要举措，其影响力已从技术领域延伸至产业生态重构层面。《基金 Q1 加仓有色汽车传媒，减仓电新食饮通信——公募基金 2025Q1 季报点评》 - 2025.04.30 《泛消费打开连板与涨幅高度，ETF 资金平铺机器人、人工智能与芯片——行业轮动周报 20250427》 -2025.04.28 l昆仑万维发布超级智能体《国家队交易特征显著，短期指数仍交易补缺预期，TMT 类题材仍需等待——行业轮动周报 20250420》 -2025.04.21 2025 年 5 月 22 日，昆仑万维面向全球市场发布的天工超级智能体（Skywork Super Agents）标志着中国在 AI 智能体领域的一次重大突破。这款产品通过创新的"5 专家+1 通用"智能体架构，重新定义了多模态内容生成的技术范式，其核心价值在于将深度研究（DeepResearch）能力与办公场景深度融合，实现了从信息检索到内容生产的全链路智能化。《小市值持续，高低波风格交替——中邮因子周报 20250413》 -2025.04.14 l风险提示：《4 月是否还会有“最后一跌”？——微盘股指数周报 20250406》- 2025.04.07 以上内容基于历史数据完成，在政策、市场环境发生变化时存在失效的风险；历史信息不代表未来。《“924”以来融资资金防守后均见到行情低点，仍关注科技配置机会——行业轮动周报 20250330》 -2025.03.31 目录 1AI 重点要闻 ................................................................................ 41.1DeepSeek-R1 完成小版本更新 ............................................................. 41.2阿里开源自主搜索 AI 智能体..............................................................61.3我国首个软件开发 AI 智能体标准发布......................................................81.4昆仑万维发布超级智能体................................................................102企业动态..................................................................................122.1华为推出昇腾超节点技术................................................................122.2英伟达计划推出 Blackwell 架构特供芯片..................................................143AI 行业洞察 ............................................................................... 163.1Meta 拆分 AI 部门为两大团队，分别聚焦消费级产品与 AGI 基础研究 .......................... 164技术前沿..................................................................................174.1Pangu Light: 全新方法让 LLM 瘦身但不降智...............................................175风险提示..................................................................................20 图表目录图表 1： DeepSeek-R1-0528 跑分............................................................4图表 2： DeepSeek 等模型的 AIME 2024 跑分 ..................................................4图表 3： WebWalker 架构...................................................................7图表 4： WebDancer 架构：两种网络数据生成流程 ............................................. 7图表 5：标准编写成员 .................................................................... 9图表 6：标准架构 ........................................................................ 9图表 7：天工超级智能体 ................................................................. 11图表 8：天工超级智能体打通 App 与 PC 端 .................................................. 11图表 9：华为昇腾 384 超节点技术 ......................................................... 13图表 10：英伟达计划推出 Blackwell 架构的中国特供芯片 .................................... 15图表 11： Pangu Light 论文...............................................................18图表 12： Pangu Light 核心架构...........................................................19图表 13： Pangu Light 与其他代表性模型在推理基准上的比较 ................................. 20图表 14：剪枝率 vs.加速率...............................................................20 1AI 重点要闻 1.1DeepSeek-R1 完成小版本更新 2025 年 5 月 28 日，DeepSeek 团队在 Hugging Face 平台悄然发布了 R1 推理模型的最新升级版本——DeepSeek-R1-0528。尽管官方将其定位为"小版本试升级"，但实测表现远超预期，在推理能力、编程性能、长文本处理和写作质量等方面均有显著提升，被用户称为"重新定义小升级"的一次重大更新。在技术架构上，DeepSeek-R1-0528 延续了前代 R1 的混合专家模型（MoE）架构，参数量达 6850 亿（含 140 亿 MTP 层参数），采用稀疏激活机制，实际推理时仅激活约 370 亿参数，兼顾性能与效率。其最大亮点在于对"推理能力"的持续深耕，采用了"链式思维（Chain of Thought）"推理机制，能够在复杂问题上进行多步逻辑推演，输出清晰的思考过程。这一特性使其在数学、编程、科研等场景下表现尤为突出。以 AIME 2025 数学测试为例，旧版模型准确率仅为 70%，而新版模型准确率飙升至 87.5%。这一巨大进步得益于模型在推理过程中的思维深度增强——在 AIME 2025 测试集上，旧版模型平均每题使用 12K tokens，而新版模型平均每题使用 23K tokens，这表明新版模型在解题过程中进行了更为详尽和深入的思考。资料来源：DeepSeek，中邮证券研究所资料来源：DeepSeek，中邮证券研究所在编程能力方面，DeepSeek-R1-0528 表现尤为亮眼。在国际权威代码生成榜单 LiveCodeBench 上，R1-0528 的代码生成能力仅次于 OpenAI 的 o3 mini 系列，超越了 Anthropic 的 Claude mini 和阿里的 Qwen 3 等知名模型。用户实测表明，该模型可一次性生成 1000+行无 bug 前端代码，支持动态交互（如天气卡片、数据可视化）、物理模拟（台球碰撞游戏）等复杂功能，媲美 Claude 4。生成的网页 UI 设计感也大幅提升，无需详细描述即可产出布局合理、视觉美观的界面。在文本生成方面，DeepSeek-R1-0528 针对议论文、小说、散文等文体进行了进一步优化，能够输出篇幅更长、结构内容更完整的长篇作品，同时呈现出更加贴近人类偏好的写作风格。新版 DeepSeek R1 还针对"幻觉"问题进行了优化。与旧版相比，更新后的模型在改写润色、总结摘要、阅读理解等场景中，幻觉率降低了 45-50%左右，能够

点击免费查看完整报告

金工周报：AI动态汇总-DeepSeek-R1完成小版本更新，阿里开源自主搜索AI智能体

AI重点要闻

DeepSeek-R1完成小版本更新

阿里开源自主搜索AI智能体

我国首个软件开发AI智能体标准发布

昆仑万维发布超级智能体

企业动态

华为推出昇腾超节点技术

英伟达计划推出Blackwell架构特供芯片

AI行业洞察

Meta拆分AI部门为两大团队

技术前沿

PanguLight:全新方法让LLM瘦身但不降智

你可能感兴趣

AI动态汇总【中邮金工】：谷歌更新Gemini 2.5 Pro，阿里开源Qwen3新模型

金工周报：AI动态汇总：Gemini2.5Pro发布即屠榜，DeepSeekV3完成模型更新

Grok 4 发布，通义开源智能体 WebSailor——AI 动态汇总 20250714

AI动态汇总20250714：Grok4发布，通义开源智能体websAIlor

AI动态汇总：DeepSeek-R1带动思维链学，DeepMind推出questbenc基准

阿里团队发布全新终端AI智能体，机构预计2032年AI Agent市场规模将超1000亿美元，这家公司自主研发的通用AI AGENT机器人开发平台取得了重大突破

海外周观点：阿里千问APP版本大更新，25Q4出海APP中短剧和AI影像工具创收能力较强海外周观点

通信行业周报2025年第6周：Deepseek-R1开源推动AI应用发展，头部AI厂支持Deepseek

金工周报：AI动态汇总-通义千问发布Qwen-3模型，DeepSeek发布数理证明大模型

AI动态汇总：Claude 4系列发布，谷歌上线编程智能体Jules