本周观点 1月我们发布行业点评报告《CPU涨价能持续多久?》,率先揭示Agent对CPU的刚性需求以及CPU供需失衡全面爆发。过去4个月,CPU逻辑持续得到强化:1)AMD、Arm等头部厂商大幅上修服务器CPU TAM,Meta、AWS等大厂加码CPU部署,需求侧持续验证;2)Intel、AMD库存趋紧、交期拉长并持续涨价,景气度不断提升;3)同时,NVIDIA新一代Vera RuBinAI系统中CPU/GPU配比持续抬升,CPU正从辅助角色重新回到AI系统核心。 Agent对CPU刚性需求,CPU重回核心地位。随着大模型从Chatbot向Agent演进,计算负载重心正发生偏移。Agent不仅需要GPU进行模型推理,更依赖高性能CPU处理复杂逻辑编排、工具调用与内存管理。我们认为,Agent对CPU的刚性需求主要来自三方面:1)Multi-Agent架构带来的OS调度压力,以及沙盒环境创建、调度与销毁对CPU算力的持续消耗;2)长上下文场景下KV Cache卸载对CPU内存与带宽提出更高要求;3)高并发工具调用带来的大量CPU算力消耗。Intel论文显示,多数Agent工作负载中,CPU耗时占端到端延迟比例可达40%-90%。伴随Agent数量、任务复杂度与Token消耗指数级增长,CPU产业已进入新一轮景气周期,Intel、AMD服务器CPU库存趋紧、交期延长,并于2026年以来持续推进涨价。 CPU TAM扩容,CPU/GPU部署比例抬升。1)TAM来看,AMD与Arm均大幅上修服务器CPU市场空间,预计2030年全球服务器CPUTAM将超过1000亿美元。根据AMD,CPU需求可分为通用计算CPU、AI头节点CPU以及AgenticAICPU三部分,其中智能体AI相关需求是最大的增量来源。2)配比来看,AI数据中心CPU/GPU部署比例正从传统HGX时代的1:4、1:8,逐步向1:2、1:1甚至更高演进。以NVIDIA为例,GB300 NVL72已实现72颗GPU搭配36颗Grace CPU的1:2配比,Vera Rubin进一步通过外挂独立Vera CPU机柜,使整体CPU配比继续抬升。 所有CPU架构均受益,ARM中期变化更显著。1)ARM架构低功耗、高核心密度的特性更契合Agent工作负载。相比x86,ARM在高并发、低功耗场景下具备更优能效比与扩展能力,尤其适合海量API调用、KV Cache调度等轻计算、高并发任务。2)ARM开放授权生态亦高度契合云厂商自主构建AI基础设施的需求,当前AWS Graviton、NVIDIAGrace、微软Cobalt等方案均已加速落地。ARM在FY26Q4业绩会上预计,到2030年按CPU类型划分的最大市场份额将属于Arm架构。 Agentic AI驱动CPU重构,全球厂商开启新一轮架构升级。1)海外方面,Intel、AMD、Arm、NVIDIA等均围绕高核心密度、异构协同与能效优化展开新一轮产品迭代,CPU竞争正从单纯性能竞争迈向系统级算效竞争;2)国内方面,海光、飞腾、龙芯、华为海思、熠知电子等厂商在x86、ARM与自主指令集方向持续突破,核心数、线程数、内存带宽与生态能力快速提升。伴随Agentic AI带来的CPU需求爆发,以及自主可控趋势深化,国产CPU有望迎来规模化替代与产业地位重估。 相关标的 CPU:Intel、海光信息、禾盛新材、高通、AMD、澜起科技、中科曙光、中国长城、龙芯中科、广合科技、兴森科技、深南电路、宏和科技等。 海外算力:中际旭创、东山精密、胜宏科技、欧科亿、天孚通信、天岳先进、新易盛、工业富联、兆易创新、大普微、源杰科技、景旺电子、英维克、唯科科技、领益智造等;Lumentum、闪迪、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。 风险提示 行业竞争加剧的风险;技术研发进度不及预期的风险;特定行业下游资本开支周期性波动的风险。 内容目录 一、CPU何以重回核心地位?.....................................................................41.1三大逻辑揭示Agent对CPU的刚性需求.....................................................41.2 Agent生态扩张引爆CPU性能瓶颈,CPU现涨价潮..........................................4二、CPU TAM扩容,CPU/GPU部署比例抬升..........................................................62.1CPU TAM翻倍上修,预计到2030年TAM超1000亿美元.......................................62.2 CPU与GPU配比有望提升至1:1甚至更多...................................................7三、所有CPU架构均受益,ARM中期变化更显著....................................................113.1ARM架构低功耗、高核心密度的特性更契合Agent工作负载..................................113.2 ARM开放生态更契合大厂需求,NV Grace率先跑通..........................................12四、Agentic AI驱动CPU重构,全球厂商开启新一轮架构升级.......................................144.1海外:x86与ARM路线竞逐,性能、能效与异构协同全面升级................................144.2国内:自主架构加速突破,国产CPU迈向规模化替代.......................................17五、相关标的..................................................................................20风险提示......................................................................................21 图表目录 图表1:KV Cache卸载使得KV Cache能够从有限的GPU内存中传输到更大且性价比更高的存储........4图表2:未来5年全球活跃Agent数据将呈现爆发式增长............................................5图表3:大多数Agentic工作负载场景下,CPU端到端延迟占比显著高于GPU.........................5图表4:五大代表性Agent工作负载中的任务延迟分布..............................................5图表5:五大代表性Agent工作负载中的任务延迟分布..............................................6图表6:Meta宣布将部署Graviton CPU以满足Agentic AI需求......................................6图表7:CPU收入增长率将在2028年前超过GPU和XPU的增长....................................7图表8:大量的代理工作负载导致CPU过载........................................................7图表9:对CPU承担编排、代理、调度的需求持续提升..............................................7图表10:数据中心CPU核心数将持续攀升.........................................................8图表11:NVIDIA DGX H100(640 GB)/H200(1,128 GB)系统组件描述...................................9图表12:DGX H100/200系统拓扑结构.............................................................9图表13:GB200 NVL72规格....................................................................10图表14:英伟达的Grace CPU连接..............................................................10图表15:通过NVLink连接的Grace Hopper超级芯片进行内存访问..................................10图表16:英伟达Vera Rubin NVL72机架系统CPU与GPU搭载比例为1:2.............................11 图表17:Vera Rubin NVLink C2C架构图.........................................................11图表18:x86及ARM架构特性对比...............................................................11图表19:2029年基于ARM架构的CPU有望占据定制AI ASIC服务器主机CPU市场90%的份额.............12图表20:数据中心的电力消耗持续大幅增加......................................................12图表21:Grace CPU在图形分析中能效提高3倍...................................................13图表22:Grace CPU在数据分析中能效提高2.1倍.................................................13图表23:AWS Graviton CPU....................................................................13图表24:微软Cobalt 200布局图...............................................................14图表25:Xeon6+ E能效核架构.................................................................14图表26:Xeon6+为首款18A数据中心CPU......................................................14图表27:同频率下Intel 18A较Intel 3功耗降低36%-38%..........................................15图表28:EPYC 9005持续引领x86架构服务器CPU性能标准......................................15图表29:第六代EPYC Venice性能再度飞跃...............................................