
一、英伟达Vera架构与Context Memory Platform技术解析 –英伟达在CES 2026发布“Vera”新一代GPU架构,核心升级为引入大模型推理优化计算单元,配套推出“ContextMemory Platform(CMP,推理上下文内存平台)”,本质是芯片内部介于L2 Cache与HBM之间的高速缓存层级,工作频率接近SRAM且密度更高。 –第一代CMP单chiplet集成容量96MB,整颗GPU封装后约1.5GB,采用台积电SoIC-V3D堆叠SRAM技术,堆叠层数12层(较上一代多4层),提升对嵌入式存储(eSRAM)及近存 计算结构的设计要求。 – CMP不减少外部HBM依赖,因支持更长上下文长度(已达1M tokens)推高内存配置需求,Vera架构旗舰型号将搭载至少180GB HBM3E(较GH200的144GB提升约25%),HBM需求 持续强劲。 存储行业发展趋势核心内容 一、英伟达Vera架构与Context Memory Platform技术解析 –英伟达在CES 2026发布“Vera”新一代GPU架构,核心升级为引入大模型推理优化计算单元,配套推出“ContextMemory Platform(CMP,推理上下文内存平台)”,本质是芯片内部介于L2 Cache与HBM之间的高速缓存层级,工作频率接近SRAM且密度更高。 –第一代CMP单chiplet集成容量96MB,整颗GPU封装后约1.5GB,采用台积电SoIC-V3D堆叠SRAM技术,堆叠层数12层(较上一代多4层),提升对嵌入式存储(eSRAM)及近存 计算结构的设计要求。 – CMP不减少外部HBM依赖,因支持更长上下文长度(已达1M tokens)推高内存配置需求,Vera架构旗舰型号将搭载至少180GB HBM3E(较GH200的144GB提升约25%),HBM需求 持续强劲。 二、AI推理驱动下的存储分层演进与KV Cache存储新范式 –大模型Transformer架构的QKV机制导致KV Cache容量随输入文本长度线性增长,早期存放于HBM引发紧缺,行业探索将其卸载至其他介质的技术路径。 –软件层面已有YottaDB、RocksDB等数据库系统承接KV Cache负载;英伟达BF4平台明确每个GPU支持upto16TB外部存储用于KV Cache扩展,推动高端UFS、SSD对高耐久低延迟NAND的需求上升。 –服务器端出现基于CXL连接的持久内存模块部署趋势,用英特尔Crow Pass或美光X100等3D XPoint替代方案承载KV Cache,促进混合存储架构发展。 三、NAND市场新增量测算:AI数据中心拉动比例或达15%~20% –英伟达Vera架构作为参考设计被全球CSP厂商广泛采纳,AI数据中心基础设施正经历标 准化重构。 –每个GPU后端实际部署按8~12TB存储配置,2025年全球AI GPU出货量预计200万片,直接新增NAND需求16~24 exabytes,占全球NAND总供应量约2%~2.5%。 –计入训练临时数据、CSP备货、冗余扩容等,2025年AI数据中心带动的NAND需求增量预计不低于15%~20%,2026年Blackwell平台铺开后或进一步上升。 四、HBM成为DRAM核心战略产品,原厂资源向其高度倾斜 – HBM是三星、SK海力士、美光的战略级产品,因低延迟、高带宽优势与GPU位置紧密, 与其他存储层级互补,需求“越大越好”。 – HBM良率低、单位产能消耗更多晶圆,未来五年预计占三大原厂DRAM收入的50%,资本开支重点集中于 HBM3E及HBM4量产爬坡,常规DRAM扩产节奏放缓。 –原厂按GPPW(每晶圆毛利最大化)原则配置资源,HBM单位利润远高于DDR4/DDR5, 优先级最高,企业级应用次之,消费级最低。 五、存储市场供需格局:短期无新增产能,三年内难缓解失衡 – 2021~2022年存储价格崩盘后,原厂连续亏损,过去四年资本开支压至最低,无新建工厂计划;全球新建半导体厂需3~5年周期,目前无原厂宣布新产能扩张。 –现有产能信息均为2025年8月前决策,当前仅提高稼动率;需求回升叠加AI驱动订单超 订严重,预计未来三年内供需失衡无法缓解。 – 2025年上半年NAND与标准DRAM供给增速放缓,Q2起中高端UFS、企业级TLC/QLC SSD可能供不应求,合约价Q1末企稳回升,Q2进入温和上涨通道,以结构性机会为主。 六、国内外市场需求分化:北美领先布局,国内加速追赶 –北美CSP自2024年Q2加大AI基础设施投入,采购前置,采用1nmDRAM、176L+NAND及HBM3E;中国大陆CSP资本开支滞后,2024年下半年释放订单,技术路线以1z nmDRAM、128L NAND为主,HBM尚处验证阶段。 –国内受东数西算工程和智算中心建设推动,2025年服务器出货量同比增速预计超5%(全球平均约18%),但高端颗粒获取受限,HBM和GDDR6依赖进口或第三方模组商。-数据中心设计理念差异:美国推进高密度解架构,16T/32T SSD成主流;中国偏好松散RAP架构,8T以上SSD导入节奏落后。 七、存储价格趋势:结构性分化,“局部超级周期”特征明显 – 2025年“超级周期”实为“局部超级周期”,仅覆盖AI相关、服务器级、高带宽、高密度产品线;HBM、16T/32T企业级SSD在北美市场价格持续高位甚至上涨。 –消费类存储(手机、PC用DRAM/NAND)涨价传导不畅,终端厂商采购保守;中国市场客 户价格敏感,原厂提价空间有限,二线厂商现出货压力。 –非AI相关传统存储产品2025年下半年或面临回调压力,AI训练规模扩大间接拉动通用型 存储回暖的拐点尚未到来。 八、产业链重构:原厂直供主导,模组厂商生存空间被压缩 –晶圆紧缺,原厂按GPPW原则优先分配给HBM等高毛利产品,不再主动向模组厂出售wafer,过去下行周期卖wafer维持稼动率的模式逆转。 –未来3~5年仍将缺wafer,原厂无意扶持模组生态;美光等原厂“All in AI”,战略性退出低 端市场,仅保留头部客户生态所需基本产品线。 九、Norflash价格上涨:结构性产能再分配所致 –台厂(华邦、旺宏)将Norflash的12英寸晶圆及部分8英寸旧线产能转向毛利率更高的eMMC/MCP生产,导致中低密度Serial NOR(128Mb以下)供给收紧。 –车载、工控、通信等领域对高可靠性Norflash有刚性需求,叠加全球Norflash旧产线逐步退场、新投资稀少,价格迅速上涨,预计紧平衡持续至2026年上半年。 十、技术演进与未来趋势:3D DRAM为十年计划,短期依赖现有架构优化 –行业出现技术路线“倒退”,原厂推迟研发,部分低端产品(如DDR3)因供应紧张或成本 过高被重新启用,属短期应对。 –新型存储介质(FeRAM、PCM)缺乏标准化与second source支持,推广困难;短期内行业依赖软件手段对现有NAND精细分层管理,SLC NAND受重视。 – 3D DRAM技术处早期阶段(十年计划),短期内无颠覆性新产品落地;先进封装、存算一体等方向需结合数据中心实际部署节奏推进。