算法优化不改存储芯片长期需求增长 glmszqdatemark2026年03月30日 推荐 维持评级 市场回顾:最近一周(3月23日-3月27日)电子板块涨跌幅为-2.35%,相对沪深300涨跌幅-0.94pct。年初至今电子板块涨跌幅为0.19%,相对沪深300指数涨跌幅+2.94pct。本周电子行业子板块涨幅前五分别为杰美特42.1%、天华新能34.0%、腾景科技25.6%、*ST东晶15.6%、华亚智能14.9%。 谷歌TurboQuant技术实现无损高效内存压缩。谷歌推出的TurboQuant内存压缩技术,可在精度几乎无损的前提下实现大比例模型体积压缩,适配键值缓存压缩与向量搜索核心场景。在Llama-3.1-8B-Instruct模型的LongBench基准测试中,该技术3.5位量化表现与16位全缓存精度持平,综合表现优于同类压缩方案;在H100GPU上,4位TurboQuant的性能较32位未量化键提升8倍,且运行时开销几乎可忽略不计。 分析师方竞执业证书:S0590525120003邮箱:fangjing@glms.com.cn分析师王晔 内存压缩技术突破将长期驱动存储市场需求持续扩容。TurboQuant带来的内存效率跃升,长期来看或将通过多重传导逻辑拉动存储需求增长,而非压缩市场空间。依据经济学中的“杰文斯悖论”,该技术大幅降低AI推理的算力与内存门槛,有望推动AI能力向全场景渗透,或将带动全球AI服务器部署总量成倍增长,从而带动整体存储需求扩容。同时,内存压缩技术或将促使开发者将压缩的内存空间用于拓展更大规模的上下文窗口,支撑百万级Token的全代码库分析、超长视频理解等场景,新增需求或将对释放的内存空间形成消耗。 执业证书:S0590521070004邮箱:wye@glms.com.cn NAND闪存处于涨价上行通道,长期需求具备坚实支撑。本轮存储行业涨价周期中,NAND闪存的涨价节奏与涨幅均与DRAM形成显著差异,当前仍处于具备充足上行空间的涨价通道。从历史周期看,NAND价格变动通常滞后于DRAM,约半年左右。本轮DRAM涨价主要开启于2025年第二季度,NAND涨价主要开启于2025年第四季度。其中DRAM价格累计涨幅较为显著,部分主流型号较前期低点上涨逾数倍甚至数十倍;NAND价格亦呈上涨态势,目前仍处于价格上行通道。 相关研究 1.电子行业周报:英伟达GTC将至,Feynman及LPU或将登场-2026/03/102.电子行业周报:电子行业的全面“通胀”2.0-2026/03/033.AIDC系列四:北美缺电重塑格局,聚焦SOFC和MLCC新机遇-2026/02/264.电子行业点评:春节期间AI“百模大战”,继续推荐算力主线-2026/02/245.电子行业周报:云厂商capex高增,光模块+NPO/CPO共进-2026/02/09 投资建议:国内模组厂以NAND类产品为主,长期需求相对稳定,价格上行趋势有望延续。存储模组方面,建议关注:德明利、佰维存储、江波龙等。利基存储方面,建议关注:兆易创新、普冉股份、东芯股份等。 风险提示:需求兑现慢于预期的风险、供给扩张错配需求的风险、技术进步可能重塑受益结构的风险。 目录 1打破内存墙有助于倒逼硬件生态扩张........................................................................................................................3 1.1谷歌TurboQuant展现强大内存压缩能力...................................................................................................................................31.2内存压缩长期来看有望激发存储需求增长....................................................................................................................................41.3 NAND仍然处于涨价通道,长期需求坚挺...................................................................................................................................52本周市场行情回顾....................................................................................................................................................63风险提示.................................................................................................................................................................7插图目录.....................................................................................................................................................................8表格目录.....................................................................................................................................................................8 1打破内存墙有助于倒逼硬件生态扩张 1.1谷歌TurboQuant展现强大内存压缩能力 谷歌推出了TurboQuant内存压缩技术,它能够在精度几乎无损的前提下大幅减小模型大小,因此非常适合支持键值(KV)缓存压缩和向量搜索。它通过两个关键步骤实现这一点: 高质量压缩(PolarQuant方法):TurboQuant首先随机旋转数据向量。这一巧妙的步骤简化了数据的几何结构,使得可以轻松地将标准的高质量量化器(一种将大量连续值(例如精确的小数)映射到较小的离散符号或数字集(例如整数)的工具,例如音频量化和JPEG压缩)分别应用于向量的每个部分。第一阶段利用了大部分压缩能力(大部分比特)来保留原始向量的主要概念和特征。 消除隐藏误差:TurboQuant使用少量剩余的压缩能力(仅1比特)将QJL算法应用于第一阶段遗留的微小误差。QJL阶段充当数学误差检查器,消除偏差,从而获得更准确的注意力评分。 在Llama-3.1-8B-Instruct模型上,TurboQuant在LongBench基准测试中展现出强大的KV缓存压缩性能,优于各种压缩方法。 资料来源:Google Research官网,国联民生证券研究所 TurboQuant证明,它可以将键值缓存量化到仅3位,无需训练或微调,也不会影响模型精度,同时运行速度比原始LLM(Gemma和Mistral)更快。它的实现效率较高,运行时开销几乎可以忽略不计。下图展示了使用TurboQuant计算注意力逻辑值的速度提升:具体来说,在H100GPU加速器上,4位TurboQuant的性能比32位未量化键高出8倍。 资料来源:Google Research官网,国联民生证券研究所 1.2内存压缩长期来看有望激发存储需求增长 “杰文斯悖论”与需求增长:经济学中的“杰文斯悖论”指出,当技术进步降低了某种资源的使用成本时,反而会因为门槛降低,刺激出远超以往的庞大需求,导致资源总消耗量增加。TurboQuant让单台服务器能运行更多、更复杂的AI模型,大幅降低了AI推理的算力与内存成本。这或将促使企业将AI嵌入到所有能想到的应用场景中,最终导致全球部署的AI服务器总量成倍增加,带动整体存储需求量的增长。 解锁超长上下文的内存吞噬:目前,由于KVCache占用过多内存,很多AI产品的对话长度和处理超长文档的能力被强行限制。当TurboQuant将这部分体积缩小6倍后,我们认为开发者并不会选择降低内存规格,而是会选择给用户提供扩大6倍的上下文窗口。在实现百万Token级别的全代码库分析或超长视频理解等应用场景中,通过模型压缩所节省的内存空间,或将被更大规模的功能需求所消耗。 推动边缘AI端侧计算的硬件换代:之前手机和轻薄笔记本无法在离线状态下运行高参数的大模型,最大的瓶颈在于本地内存不足。TurboQuant具备约6倍的模型压缩能力,可在一定程度上支持参数量较大的开源模型部署于智能终端设备。我们认为,为了让设备具备强大的本地AI能力,未来的消费电子产品或将进行全面的内存规格升级(例如智能手机的标配RAM大幅提升),有望对消费级存储芯片需求形成较大规模拉动。 训练阶段的HBM需求依然坚硬:TurboQuant致力于优化AI推理阶段,即用户与AI对话时的缓存,对训练阶段影响较小。科技巨头为训练参数量持续增长的下一代基座模型,仍需采购高性能HBM,该部分需求受内存压缩技术的影响相 对有限。 资料来源:Apiyi,turboquant,国联民生证券研究所绘制 1.3NAND仍然处于涨价通道,长期需求坚挺 NAND涨价周期晚、幅度小,仍有涨价空间。从历史周期看,NAND价格变动通常滞后于DRAM,约半年左右。本轮DRAM涨价主要开启于2025年第二季度,NAND涨价主要开启于2025年第四季度。其中DRAM价格累计涨幅较为显著,部分主流型号较前期低点上涨逾数倍甚至数十倍;NAND价格亦呈上涨态势,目前仍处于价格上行通道。以现货价格为例,截至2026年3月16日,NANDFlash(64Gb8Gx8 MLC)相 比 于2025年 最 低 点 价 格 上 涨166%, 而DDR5(16Gb(2Gx8),4800/5600Mbps)和DDR4(16Gb(1Gx16),3200Mbps)相比于2025年最低点分别上涨747%和2298%。 资料来源:wind,国联民生证券研究所 2本周市场行情回顾 最近一周(3月23日-3月27日)电子板块涨跌幅为-2.35%,相对沪深300涨跌幅-0.94pct。年初至今电子板块涨跌幅为0.19%,相对沪深300指数涨跌幅+2.94pct。 资料来源:iFind,国联民生证券研究所 本周电子行业子板块涨幅前五分别为杰美特42.1%、天华新能34.0%、腾景科技25.6%、*ST东晶15.6%、华亚智能14.9%。 资料来源:iFind,国联民生证券研究所 3风险提示 1)需求兑现慢于预期的风险。市场对于“存储真实需求持续性”本身仍有疑虑,历史上存储行业多次出现扩产时需求接近临界点、随后快速走弱的情况。如果Agent落地速度、商业闭环或常驻推理渗透率低于预期,那么单位成本下降带动总量需求上升的杰文斯效应就可能迟到甚至弱化,最终使长期利多逻辑在中短期内无法兑现。 2)供给扩张错配需求的风险。即便需求增长,价格与盈利也未必同步改善。假如AI存储需求扩张不足以吸收行业新增供给,或将导致价格涨幅收敛甚至景气拐点提前出现,可能出现销量增长但价格、毛利率和估值承压的情形。 3)技术进步可能重塑受益结构的风险。即便长期总数据量继续增长,存储需求也可能从高性