您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰君安证券]:国君计算机|效率革命剑指“暴力计算法则”——Deepseek重塑AI时代大模型研发范式 - 发现报告

国君计算机|效率革命剑指“暴力计算法则”——Deepseek重塑AI时代大模型研发范式

国君计算机|效率革命剑指“暴力计算法则”——Deepseek重塑AI时代大模型研发范式

投资建议:Deepseek降低对硬件算力的需求,云服务厂商将迎来一波新的增长势头,短期来看现阶段本地部署可能是最适合大型企业和特殊行业企业的AI调用方式。我们看好本地国产推理算力的爆发,以及如向量数据库等新型基础软件的扩圈。 Deepseek以“单位算力效能提升10倍”为目标,通过算法优化降低模型训练与推理成本。Deepseek打破了AI大模型领域“拼投入”的固有观念,以极低的成本实现了与行业巨头相媲美的模型性能。在训练成本方面,训练671B的DeepSeek V3的成本是557.6万美元(约合4070万人民币),仅为Llama 3的7%,而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元,还需要上万张英伟达H100芯片,相比之下DeepSeek-V3在训练时使用的GPU是英伟达的H800,一款在性能上被削弱的特供AI芯片。如今DeepSeek-R1用不到GPT 5%的成本,便获得了和OpenAI的顶尖推理模型o1相当的能力。同时公司采用MIT协议全栈开源,包括模型权重、训练代码及部署工具链,吸引全球开发者共建生态。 DeepSeek的技术革命性在于其开创了全新的大模型研发范式。首先DeepSeek采用了MoE和MLA两大创新架构来实现高效的推理和成本效益高的训练;算法层面,动态稀疏化专家网络设计(Dynamic MoE),使模型推理过程中仅需调用不足4%的神经网络参数;工程层面,Deepseek采用FP8低精度训练框架,相比传统32位计算方案,能耗降幅高达80%的同时保持模型收敛稳定性;尤为突破的是DeepSeek R1引入的强化学习驱动范式摆脱了对SFT的依赖,通过自演进式训练机制,其基于强化学习的冷启动策略仅需行业基准值1/5的标注数据量即可完成高效训练。这些创新突破共同构建了对"算力军备竞赛"发展路径的系统性颠覆。 开源模型DeepSeek在当下的AI时代将扮演重要角色,就像Android之于移动互联网革命。它会重构产业生态,引发链式反应,加速上层应用发展与下层系统统一。这将调动起跨越软硬件和上下游的生态力量,促使各方加大“模型-芯片-系统”协同优化与垂直打通的投入,进一步削弱CUDA生态优势,为国产AI产业发展创造机遇。DeepSeek通过技术创新,在AI模型训练过程中实现了对高端进口芯片依赖的降低,这为国内企业展示了一条可行的技术路径,极大地增强了国内企业自主研发算力芯片的信心。 风险提示:技术研发进展不及预期、资本投入不及预期、市场竞争加剧的风险。 文章来源 本文摘自:2025年2月14日发布的《效率革命剑指“暴力计算法则”》李博伦,资格证书编号:S0880520020004伍巍,资格证书编号:S0880123070157钟明翰,资格证书编号:S0880124070047 更多国君研究和服务 亦可联系对口销售获取 重要提醒 本订阅号所载内容仅面向国泰君安证券研究服务签约客户。因本资料暂时无法设置访问限制,根据《证券期货投资者适当性管理办法》的要求,若您并非国泰君安证券研究服务签约客户,为保证服务质量、控制投资风险,还请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。我们对由此给您造成的不便表示诚挚歉意,非常感谢您的理解与配合!如有任何疑问,敬请按照文末联系方式与我们联系。 法律声明