DeepSeek公司发布全新系列模型DeepSeek-V4,性能比肩顶尖闭源模型,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。V4-Pro拥有1.6T参数量和49B激活参数,预训练数据量33T,上下文长度1M;V4-Flash版本拥有284B总参数量和13B激活参数,32T预训练数据,同样1M的上下文。
模型性能测试结果:
- Agent能力大幅提高:在Agentic Coding评测中,V4-Pro达到当前开源模型最佳水平,使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式。
- 丰富的世界知识:在世界知识测评中,V4-Pro大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。
- 世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,V4-Pro超越所有已公开评测的开源模型,比肩世界顶级闭源模型。
模型训练更新:
- 预训练阶段:实现三大更新,包括mHC实现流形约束的残差连接、混合注意力机制(CSA+HCA)进一步压缩KV矩阵、采用Muon优化器。
- 后训练阶段:采用OPD(On-Policy Distillation)实现专家模型的融合。
模型基建:
- 采用国产的TileLang实现算子开发,提升Host(CPU)开销、数值精度和适配国产芯片平台。
- 华为昇腾超节点系列产品全面支持DeepSeek V4系列模型,昇腾950和A3超节点均适配,实现高吞吐、低时延的模型推理部署。
建议关注:国产算力产业链芯片、算力租赁、云计算、IDC全产业链的投资机会。
风险提示:技术迭代不及预期;市场需求不及预期等。