行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

国君计算机|效率革命剑指“暴力计算法则”——Deepseek重塑AI时代大模型研发范式

信息技术 2025-02-17 国泰君安证券见风

核心观点

Deepseek 通过算法优化降低硬件算力需求，推动云服务厂商增长，短期本地部署更适合大型企业和特殊行业。
公司看好本地国产推理算力爆发及新型基础软件扩圈，以“单位算力效能提升10倍”为目标打破 AI 大模型“拼投入”模式。

关键数据

DeepSeek V3 训练成本：557.6万美元（约合4070万人民币），仅为 Llama 3 的 7%，远低于 ChatGPT-4o 的 7800 万美元或 1 亿美元。
DeepSeek-R1 推理能力：用不到 GPT 5% 的成本，获得与 OpenAI o1 相当的能力。
技术突破：
- MoE 和 MLA 架构实现高效推理和低成本训练。
- 动态稀疏化专家网络设计（Dynamic MoE）使推理仅调用不足 4% 的参数。
- FP8 低精度训练框架能耗降幅 80% 并保持模型稳定性。
- DeepSeek R1 引入强化学习驱动范式，标注数据量仅需行业基准的 1/5。

研究结论

DeepSeek 开创全新大模型研发范式，颠覆“算力军备竞赛”路径，开源模型将重构产业生态，加速应用发展与系统统一。
技术创新降低对高端进口芯片依赖，增强国产算力芯片研发信心，削弱 CUDA 生态优势，为国产 AI 产业发展创造机遇。
风险提示：技术研发、资本投入及市场竞争加剧风险。

投资建议：Deepseek降低对硬件算力的需求，云服务厂商将迎来一波新的增长势头，短期来看现阶段本地部署可能是最适合大型企业和特殊行业企业的AI调用方式。我们看好本地国产推理算力的爆发，以及如向量数据库等新型基础软件的扩圈。 Deepseek以“单位算力效能提升10倍”为目标，通过算法优化降低模型训练与推理成本。Deepseek打破了AI大模型领域“拼投入”的固有观念，以极低的成本实现了与行业巨头相媲美的模型性能。在训练成本方面，训练671B的DeepSeek V3的成本是557.6万美元（约合4070万人民币），仅为Llama 3的7%，而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元，还需要上万张英伟达H100芯片，相比之下DeepSeek-V3在训练时使用的GPU是英伟达的H800，一款在性能上被削弱的特供AI芯片。如今DeepSeek-R1用不到GPT 5%的成本，便获得了和OpenAI的顶尖推理模型o1相当的能力。同时公司采用MIT协议全栈开源，包括模型权重、训练代码及部署工具链，吸引全球开发者共建生态。 DeepSeek的技术革命性在于其开创了全新的大模型研发范式。首先DeepSeek采用了MoE和MLA两大创新架构来实现高效的推理和成本效益高的训练；算法层面，动态稀疏化专家网络设计（Dynamic MoE），使模型推理过程中仅需调用不足4%的神经网络参数；工程层面，Deepseek采用FP8低精度训练框架，相比传统32位计算方案，能耗降幅高达80%的同时保持模型收敛稳定性；尤为突破的是DeepSeek R1引入的强化学习驱动范式摆脱了对SFT的依赖，通过自演进式训练机制，其基于强化学习的冷启动策略仅需行业基准值1/5的标注数据量即可完成高效训练。这些创新突破共同构建了对"算力军备竞赛"发展路径的系统性颠覆。开源模型DeepSeek在当下的AI时代将扮演重要角色，就像Android之于移动互联网革命。它会重构产业生态，引发链式反应，加速上层应用发展与下层系统统一。这将调动起跨越软硬件和上下游的生态力量，促使各方加大“模型-芯片-系统”协同优化与垂直打通的投入，进一步削弱CUDA生态优势，为国产AI产业发展创造机遇。DeepSeek通过技术创新，在AI模型训练过程中实现了对高端进口芯片依赖的降低，这为国内企业展示了一条可行的技术路径，极大地增强了国内企业自主研发算力芯片的信心。风险提示：技术研发进展不及预期、资本投入不及预期、市场竞争加剧的风险。文章来源本文摘自：2025年2月14日发布的《效率革命剑指“暴力计算法则”》李博伦，资格证书编号：S0880520020004伍巍，资格证书编号：S0880123070157钟明翰，资格证书编号：S0880124070047 更多国君研究和服务亦可联系对口销售获取重要提醒本订阅号所载内容仅面向国泰君安证券研究服务签约客户。因本资料暂时无法设置访问限制，根据《证券期货投资者适当性管理办法》的要求，若您并非国泰君安证券研究服务签约客户，为保证服务质量、控制投资风险，还请取消关注，请勿订阅、接收或使用本订阅号中的任何信息。我们对由此给您造成的不便表示诚挚歉意，非常感谢您的理解与配合！如有任何疑问，敬请按照文末联系方式与我们联系。法律声明

点击免费查看完整报告

国君计算机|效率革命剑指“暴力计算法则”——Deepseek重塑AI时代大模型研发范式

核心观点

关键数据

研究结论

你可能感兴趣

计算机行业点评报告：阿里巴巴（BABA.N）：开源千问Qwen3.5-Plus模型，以“效率革命”重塑AI竞争格局

国君计算机 | AI大模型引发科技革命

国君计算机|DeepSeek NSA架构引领AI效率革新

AI产品测评体验系列报告：多模态模型迎来Deepseek时刻，供给革命将重新定义内容创作范式

计算机行业深度研究：大模型时代，AI技术向效率提升演进

词元革命与OVTP安全范式重塑：智能体时代的安全底层逻辑重建

2024年中国端侧大模型行业研究：算力优化与效率革命如何重塑行业生态

大模型技术重塑智能研发新范式

产业专题：大模型降本增效时代开启，DeepSeek效率提升与创新技术路径分析

AI时代品牌增长战略白皮书：生成式AI时代品牌战略指南：从SEO到GEO的范式革命

国君计算机|效率革命剑指“暴力计算法则”——Deepseek重塑AI时代大模型研发范式

你可能感兴趣

计算机行业点评报告：阿里巴巴（BABA.N）：开源千问Qwen3.5-Plus模型，以“效率革命”重塑AI竞争格局

国君计算机 | AI大模型引发科技革命

国君计算机|DeepSeek NSA架构引领AI效率革新

AI产品测评体验系列报告：多模态模型迎来Deepseek时刻，供给革命将重新定义内容创作范式

计算机行业深度研究：大模型时代，AI技术向效率提升演进

词元革命与OVTP安全范式重塑：智能体时代的安全底层逻辑重建

2024年中国端侧大模型行业研究：算力优化与效率革命 如何重塑行业生态

大模型技术重塑智能研发新范式

产业专题：大模型降本增效时代开启，DeepSeek效率提升与创新技术路径分析

AI时代品牌增长战略白皮书：生成式AI时代品牌战略指南：从SEO到GEO的范式革命

2024年中国端侧大模型行业研究：算力优化与效率革命如何重塑行业生态