您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国泰君安证券]:国君计算机|DeepSeek重构算力基建长期价值的认知 - 发现报告

国君计算机|DeepSeek重构算力基建长期价值的认知

信息技术 2025-03-16 国泰君安证券 王英杰
报告封面

报告导读:市场低估了DeepSeek生态对算力需求的放大效应,我们预计仅其推理端就将产生近百万PFLOPS的算力需求。精度支持及通信效率率先突破的国产AI芯片厂商将获得显著的发展机会。 投资建议:DeepSeek的技术突破虽然短期内引发市场对高端AI芯片需求的担忧,但通过降低准大模型训练准入门槛扩大了整体市场规模。首先受益的是国产算力芯片厂商,特别是华为昇腾等已经在推理性能上接近国际水平的企业,将借助性价比优势在企业级部署市场获得突破。随着企业级部署需求增长,算力租赁商将迎来增长,大量中小企业会选择更灵活的租赁方案来降低初始投入。当大模型部署成本降低到一定水平后,终端设备推理算力需求将显著提升,驱动端侧AI芯片市场扩容。 DeepSeek的低成本突破实际上通过降低准入门槛扩大了市场规模,进一步推动了AI民主化进程。DeepSeek-V3以557.6万美元的训练成本刷新了大语言模型的经济性基准,一度引发市场对高端AI芯片的必要性的质疑。然而,从DeepSeek技术创新的角度以及持续攀升的AI算力需求,我们重新认识到:降低单次训练成本的技术突破不仅没有减少市场对高性能AI芯片的需求,反而通过降低准入门槛以及催生海量推理需求而扩大了市场规模。根据我们测算,DeepSeek生态或将产生近百万PFLOPS级别的推理算力需求,对应每年超过千亿元的算力租赁市场。 DeepSeek生态的崛起为国产AI芯片提供了前所未有的替代机遇,华为昇腾等国产芯片厂商有望在这一浪潮中抢占市场份额。华为昇腾910B在训练时效率已达到A100的80%,910C在DeepSeek实测中AI推理性能已达到H100的60%左右。DeepSeek从第一天起就支持华为昇腾芯片,并自主维护PyTorch仓库,使开发者只需一行代码就能将CUDA转换为CUNN。DeepSeek全系列模型正式上线昇腾社区ModelZoo,同时,基于昇腾AI硬件与昇思MindSporeAI框架的DeepSeek-V3已完成开发支持并上线开源社区,这种深度的生态融合为华为在企业级AI市场的拓展提供了重要支撑。 国产AI芯片在精度支持和通信效率等关键技术维度仍需突破,但长期发展前景广阔。目前国内厂商在FP8/FP64精度支持和芯片间高效通信等方面与国际领先产品存在差距。但随着DeepSeek等国产大模型带来的市场机遇,以 及国内厂商在软硬件协同优化方面的持续投入,国产AI芯片有望在特定场景实现突破。特别是在企业级市场,凭借性价比优势和本地化部署能力,国产芯片厂商将迎来重要的市场机遇,有望在新一轮产业变革中占据重要地位。 风险提示:推理算力需求不及预测,精度支持等技术瓶颈突破缓慢,技术供应受限,CUDA生态替代进程不及预期。 文章来源 本文摘自:2025年3月14日发布的《DeepSeek重构算力基建长期价值的认知》李博伦,资格证书编号:S0880520020004 伍巍,资格证书编号:S0880123070157钟明翰,资格证书编号:S0880124070047 更多国君研究和服务 亦可联系对口销售获取 重要提醒 本订阅号所载内容仅面向国泰君安证券研究服务签约客户。因本资料暂时无法设置访问限制,根据《证券期货投资者适当性管理办法》的要求,若您并非国泰君安证券研究服务签约客户,为保证服务质量、控制投资风险,还请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。我们对由此给您造成的 不便表示诚挚歉意,非常感谢您的理解与配合!如有任何疑问,敬请按照文末联系方式与我们联系。 法律声明