## AI Agent驱动存储需求百倍爆发,行业逻辑由周期转向成长 ###摘要–AI Agent推理prefill阶段KVCache存储需求随上下文长度爆发式增长,1万token增至100万token导致HBM 理论需求提升约100倍。–Agent演进路径驱动存储需求阶梯式跳升:聊天应用->个人Agent(几十倍增长)->企业级Agent(百万/ 千万级token,再获百倍提升)。–海量KVCache迫使算力架构向分层存储演进,HBM容量受限导致需求下挂至DRAM及NAND,驱动DRAM 用量显著增长并首次纳入NAND考量。 #怎么看Agent对“存储”的影响20260527 ## AI Agent驱动存储需求百倍爆发,行业逻辑由周期转向成长 ###摘要–AI Agent推理prefill阶段KVCache存储需求随上下文长度爆发式增长,1万token增至100万token导致HBM 理论需求提升约100倍。–Agent演进路径驱动存储需求阶梯式跳升:聊天应用->个人Agent(几十倍增长)->企业级Agent(百万/ 千万级token,再获百倍提升)。–海量KVCache迫使算力架构向分层存储演进,HBM容量受限导致需求下挂至DRAM及NAND,驱动DRAM 用量显著增长并首次纳入NAND考量。–存储厂商策略分化:美光通过收购厂房激进扩产拟2027年放量;三星设备采购量比肩台积电先进制程;海力士 年长协锁定订单。–行业逻辑由周期向成长转型,5年期长协锁定未来量价齐升,市场预期2027年龙头PE仅6-7 通过高违约金5 倍,存在估值重构空间。– 核心受益标的:海外关注海力士、三星、美光、闪迪(铠侠);国内关注长鑫存储、长江存储。 ### Q&A#### AI技术的发展对存储和CPU的需求分别产生了怎样的影响,尤其是在AI Agent 的应用场景中,存储需求的具体体现是什么?AI对存储和CPU的需求影响主要体现在不同阶段。若将AI Agent 的工作流程分为决策与执行两个阶段,存储需求主要集中在第一阶段,即大模型的推理决策阶段。例如,当用户指令“请帮我做一个PPT”时,第一阶段是大模型进行推理,生成用于驱动电脑搜索内容、渲染PPT的命令行代码;第二阶段则是利用CPU执行这些代码。因此,Agent对存储的核心需求源于大模型的推理过程。具体而言,存储消耗最大的环节在于大模型推理的prefill阶段,该阶段需要根据用户输入的上下文计算并存储KV Cache。上下文长度的增加会急剧放大对存储的需求。以一个行业内的例子来说,在传统的问答模式下,用户输入约100字,模型处理约1万字的上下文,产生的KV Cache量级大约为7GB。然而,随着上下文长度的增加,例如达到60万token,所需的KV Cache理论值将增至约490GB;若上下文达到100万token,理论KV Cache需求则高达700GB。这表明,上下文 #完整识别排版后的内容:从1万token增长到100万token,理论上对用于存储KV Cache的HBM需求会增加约100 倍。 ###面对百万级token上下文产生的巨大KV Cache理论需求,而单颗HBM容量有限(如80GB)的现状,业界存在哪些优化方法?这些优化对存储需求倍数的影响如何?面对理论上高达700GB的KV Cache需求与HBM 物理容量之间的巨大差距,业界普遍采用优化手段来降低实际存储占用。这些优化方法的核心思想是,在推理过程中产生大量KV Cache时,选择性地保留核心部分的KV Cache,而非全部存储。通过这种方式,可以将原本需要7GB(对应1万token)的存储空间优化至约1.8GB,而700GB(对应100万token)的理论需求则可以被优化至约180GB。尽管优化能够显著降低绝对存储量,但从1万token到100万token的上下文长度增长,所带来的存储需求增长倍数关系并未改变。因此,在AI推理过程中,上下文长度的爆发式增长是导致存储需求量级飙升的根本原因,这也是存储在本轮AI发展中首当其冲的原因。 ### AI Agent对存储需求的增长路径是怎样的?个人Agent和企业级Agent的应用场景如何进一步放大这种需求?AI Agent对存储需求的增长呈现两个阶段性的演进路径。第一阶段是从传统的聊天应用演进到Agent应用,这一转变导致上下文长度显著增加,存储需求随之可能增长几十倍到一百倍。第二阶段是从个人Agent演进到企业级Agent。个人Agent处理的通常是个人文件和历史记录,上下文规模相对有限,可能在三四十万至五六十万token的级 别。相比之下,企业级Agent需要处理和分析公司层面的海量数据,导入的数据量可能达到百万甚至千万级token,这将导致KV Cache的量级再次出现爆发式增长。行业观点认为,从个人Agent到企业级Agent,存储需求可能又是一个百倍级别的提升。因此,Agent应用的复杂程度与其对存储的需求成正比,未来企业级Agent的渗透率将是决定存储需求规模的关键变量。 ###在AI Agent驱动下,存储需求激增,这对HBM、DRAM和NAND等不同类型的存储产品分别产生了什么影响?最新的算力架构(如Rubik)如何反映这一趋势?AI Agent产生的海量KV Cache需求,在HBM产能受限的背景下,形成了一种分层存储的解决方案。当KV Cache 量过大,HBM(如80GB)无法完全容纳时,系统会将其下挂到容量通常是HBM十到二十倍的DRAM中。若DRAM空间也被占满,则会进一步下挂至容量更大的NAND闪存。这一机制解释了为何在最新的算力架构(如Rubik和G3架构)中,DRAM的增长尤为显著,不仅体现在价格上,更体现在用量上,甚至首次将NAND也纳入了考量。HBM由于产能极为有限,其增长主要通过价格上涨来体现。本质上,这是因为Agent应用对上下文处理能力的需求增长过快,从问答到个人Agent再到企业级Agent,需求呈几十倍甚至上百倍的阶梯式增长,而存储供给无法同步跟上,导致了整个存储体系的连锁反应和架 #构演进。 ##面对AI带来的确定性存储需求爆发,美光、三星和海力士这三家主要存储厂商的扩产策略和市场行为有何不同?在AI 驱动的存储需求前景下,三大存储厂商展现了不同的扩产策略。美光最为激进,由于其市场份额相对最低,其策略是全力扩张以抢占份额。具体行动上,美光选择通过收购现有厂房,预计可在2027年实现放量,这比新建厂房(预计2028年放量)的速度更快。三星的扩产也十分积极,因其份额也非第一。据上游设备厂商(如应用材料)的信息,三星在存储设备上的采购量级已可与台积电在先进制程上的采购量相比肩,预计其HBM产能在2028年将有显著提升。海力士则表现得最为谨慎,其放量策略与长期协议(长协)紧密挂钩,要求客户签订为期五年的长协,并提供量的保障和一定的价格上涨空间,且违约金极高,基本不允许违约。 ##存储行业出现的五年期长协签订趋势,对行业未来发展和市场认知有何深远影响?行业内开始出现签订五年期长协的趋势,是供需严重错配下的必然结果,并可能推动存储行业从周期性向成长性 转变。首先,从需求端看,AI Agent处理的任务日益复杂,读取的历史记录不断增多,导致对存储的需求持续增长,这种需求并非周期性的,而是长期的。云厂商和AI芯片厂商愿意签订高额违约金的五年长协,也反向证明了他们对未来强劲需求的信心。其次,从供给端看,长协为存储厂商锁定了未来五年的量价齐升,保障了持续的利润增长。如果未来五年价格和利润持续上升,行业的周期性特征将明显减弱,成长性凸显。这种转变可能引发市场对存储公司估值体系的重构,从传统的周期股估值转向按PE估值的成长股逻辑。目前,这些存储龙头公司在2027年的预期市盈率仅为六七倍左右,若市场认知转变,其估值存在巨大的提升空间。 ##综合来看,在AIGC爆发的背景下,存储行业的投资逻辑和值得关注的标的有哪些?AIGC爆发中,需求增长最为确定和显著的环节是存储。当前,存储行业正经历从周期性向成长性转变的关键时 期,其核心驱动力源于AI Agent应用带来的持续、高速增长的上下文处理需求。五年期长协的出现进一步锁定了未来量价齐升的趋势,为相关公司提供了明确的成长路径。因此,整个存储板块的弹性较大。从投资角度看,海外原厂是核心受益者,值得关注的标的包括海力士、三星、美光,以及闪迪(铠侠)。在国内市场,长鑫存储和长江存储是主要关注对象。