您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:CPU2服务器中枢大脑需求的拐点东北计算机2026 - 发现报告

CPU2服务器中枢大脑需求的拐点东北计算机2026

2026-01-22 未知机构 娱乐而已
报告封面

2026年1月13日凌晨,DeepSeek在GitHub悄悄上传了一篇署名梁文锋的新论文《Conditional Memory viaScalable Lookup》。 在DeepSeek V4架构中的核心角色重构:在传统大模型架构中,CPU仅承担数据传输、任务调度等边缘辅助工作,核心的知识存储与推理计 CPU(2):服务器中枢大脑,需求的拐点【东北计算机】 2026年1月13日凌晨,DeepSeek在GitHub悄悄上传了一篇署名梁文锋的新论文《Conditional Memory viaScalable Lookup》。 在DeepSeek V4架构中的核心角色重构:在传统大模型架构中,CPU仅承担数据传输、任务调度等边缘辅助工作,核心的知识存储与推理计算全由GPU包揽,导致CPU的算力与内存资源被严重闲置。 而DeepSeek V4通过Engram条件记忆模块,重构了CPU的角色定位,让CPU成为静态知识的专属存储与检索中枢。 其核心逻辑是将占模型80%参数容量的静态知识(如常识、公式、法律判例等)从GPU显存中抽离,转移到CPU内存中。 当模型需要调用这类固定知识时,CPU通过多头哈希算法实现秒级检索,同时与GPU的推理计算并行推进,彻底掩盖了数据调取的延迟。 我们认为这种重构让CPU从“旁观者”变成了AI运行的关键支柱,释放了GPU的算力使其专注于动态推理,同时激活了CPU在大规模数据存储与高效检索上的天然优势,成为架构优化的核心突破口。 主导的存储迁移,AI部署成本大幅降低的核心推手:DeepSeek V4能实现90%的部署成本降幅,核心在于CPU主导的“显存–内存”存储迁移。 传统千亿参数大模型依赖8张英伟达A100显卡,本质是需要GPU的高容量显存承载海量静态知识;而DeepSeekV4让CPU内存承接这一核心需求,仅需1张消费级显卡+ 4根64G内存条(约1200美元)即可运行。 这一转变的关键在于CPU内存的高性价比优势:相比GPU的HBM显存,CPU内存(DDR系列)不仅单价更低,且扩容灵活性更强。 此外,CPU还能联动SSD存储,进一步降低高频内存的占用压力,形成“CPU内存+ SSD”的分层存储体系,从硬件成本源头实现了AI部署的普惠化。 我们认为CPU在DeepSeek V4中的核心应用,正在打破AI行业对GPU的绝对依赖,重塑整个AI基础设施的竞争格局。 DeepSeek V4证明,CPU内存同样能支撑大模型运行,且成本仅为GPU方案的1/10。 同时,CPU的通用性优势让AI基础设施摆脱了“高端GPU绑定”:普通服务器、消费级PC只要具备大容量内存,就能成为AI部署节点,极大降低了AI技术的落地门槛。 更重要的是,CPU主导的架构优化推动行业从“堆GPU显存”的粗放式发展,转向“CPU+GPU协同优化”的精细化发展。 相关标的:海光信息、禾盛新材、龙芯中科等;CPU上游:华大九天、华正新材等;服务器:中科曙光、浪潮信息、紫光股份等 风险提示:政策进展不及预期;下游需求不及预期等。