DeepSeek V4架构通过Engram条件记忆模块重构了CPU的角色,将占模型80%参数容量的静态知识从GPU显存转移到CPU内存,实现CPU成为静态知识的专属存储与检索中枢。这一重构使CPU从边缘辅助角色转变为AI运行的关键支柱,释放GPU算力专注于动态推理,并利用CPU在大规模数据存储与高效检索上的优势。
关键数据与优势:
- 部署成本降低90%:传统千亿参数大模型需8张英伟达A100显卡,DeepSeek V4仅需1张消费级显卡+4根64G内存条(约1200美元)。
- CPU内存高性价比:DDR内存单价低于GPU HBM显存,扩容灵活,并可通过SSD形成“CPU内存+SSD”分层存储体系。
- 打破GPU依赖:CPU内存同样能支撑大模型运行,成本仅为GPU方案的1/10,使普通服务器、消费级PC也能成为AI部署节点。
- 行业发展转向精细化:推动从“堆GPU显存”的粗放式发展,转向“CPU+GPU协同优化”。
研究结论:
DeepSeek V4证明CPU内存可支撑大模型运行,打破AI行业对GPU的绝对依赖,重塑AI基础设施竞争格局。CPU主导的架构优化推动行业转向精细化发展,降低AI技术落地门槛。
相关标的:
- 存储与CPU相关:海光信息、禾盛新材、龙芯中科等。
- CPU上游:华大九天、华正新材等。
- 服务器:中科曙光、浪潮信息、紫光股份等。
风险提示:
政策进展不及预期;下游需求不及预期。