
推理利器LPX问世,Agent AI、太空算力架构迎革新 核心观点 ⚫推理利器Groq 3 LPX问世,聚焦低时延任务,商业效益显著。3月17日,2026GTC大会正式召开,英伟达发布LPX机架,Groq 3 LPX专注推理加速,LPX机架核心由Groq 3LP30 LPU构成,LPU是一种以扁平的、SRAM为主的平面内存架构,架构设计旨在实现快速、可预测的token生成。单个Groq 3LPX机架包含32个液冷1Ucompute tray,合计可提供315 PFLOPSAI推理算力,128GB总SRAM容量,640TB/s总scale up带宽。Rubin机架在配合LPX的情况下,相较于Blackwell,为万亿参数模型提供超35倍的每兆瓦tokens处理能力和超10倍的营收机会。我们认为,LPU的引入解决了当下高端模型推理场景下单GPU系统成本过高的问题,采用Rubin+LPX的部署形式有望间接改善云厂商的盈利能力,加速低时延AI推理应用落地,逐步激活庞大的推理需求市场,进一步推动PCB、液冷、供电、光通信及铜缆的需求。 薛宏伟执业证书编号:S0860524110001xuehongwei@orientsec.com.cn021-63326320 蒯剑执业证书编号:S0860514050005香港证监会牌照:BPT856kuaijian@orientsec.com.cn021-63326320 ⚫Vera CPU机架:大规模AI agent和强化学习的基石。英伟达发布Vera CPU机架,包含32个液冷Vera CPU tray,单个机架由8颗CPU+2颗BlueField DPU组成,Vera CPU搭载Olympus核心,相比传统x86 CPU,Vera单线程性能提升50%,机架合计包含256颗CPU,提供400TB内存、300TB/s内存带宽,采用液冷散热并通过以太网连接。单个CPU机架可支持超过22500个并发强化学习或Agentic沙箱环境,性能比传统机架规模CPU高效两倍且速度快50%,能够测试、执行和验证Vera Rubin NVL72和LPX机架的结果,助力Agent AI发展。我们认为,CPU对于AI Agent的部署推理至关重要,Vera CPU具备良好的单线程性能,能够充分支持AI Agent场景下频繁的工具调用等任务,Vera CPU机架的发布有望开启大规模AI agent的部署,帮助AI从“提供”建议进入任务“执行”阶段。 雷星宇执业证书编号:S0860126030013leixingyu@orientsec.com.cn021-63326320 李晋杰执业证书编号:S0860125070012lijinjie@orientsec.com.cn021-63326320 ⚫太空计算模组Space-1亮相,Rubin Ultra采用正交背板。英伟达正与合作伙伴研发Space-1 Vera Rubin Module太空计算机模组,面向太空优化的AI计算模块,有望加速未来太空数据中心的发展。此外,英伟达还公布了Rubin Ultra Kyber架构,计算与交换板之间采用正交背板互联,Kyber NVL144通过光互连支持scale up至NVL1152。 CXL方案优化AI存储架构,头部厂商有望加速应用2026-03-17产业链重视CXL技术,英伟达有望推进2026-03-14OpenClaw打开国产算力天花板2026-03-13 投资建议与投资标的 投资建议:通信方面,短期来看一层scale up域内铜缆仍为较优解,若scale up域采用双层架构则为铜+光相互配合,而对于高算力密度的Kyber架构,正交背板则逐步走向舞台,对于scale out场景下,CPO方案逐步成熟;散热方面,Vera Rubin POD中五种不同机架均采用100%全液冷;供电方面,800V HVDC从“可选”走向“AIDC标配”;太空算力方面,随着英伟达的加入,有望推动生态不断成熟。 相关标的:PCB相关厂商沪电股份(002463,未评级)、胜宏科技(300476,未评级)、景旺电子(603228,未评级)、深南电路(002916,未评级)、方正科技(600601,未评级)、中富电路(300814,未评级)、鹏鼎控股(002938,买入)、东山精密(002384,买入);CPO相 关 厂 商源 杰 科 技(688498, 未 评 级)、 长 光 华 芯(688048,未 评 级)、 仕 佳光 子(688313,未评级)、光迅科技(002281,未评级)、天孚通信(300394,未评级)、太辰光(300570,未评级)、致尚科技(301486,未评级)、长芯博创(300548,未评级)等;液冷相关厂商英维克(002837,未评级)、领益智造(002600,买入)、申菱环境(301018,未评级)、高澜股份(300499,未评级)、思泉新材(301489,未评级)等;太空算力相关厂商复旦微电(688385,买入)、成都华微(688709,未评级)等。 风险提示 AI发展不及预期,行业竞争加剧风险,地缘政治风险 目录 1.英伟达新发LPX、CPU机架,推理、Agent AI、太空算力架构迎革新........4 1.1推理利器Groq 3 LPX问世,聚焦低时延任务,商业效益显著......................................41.2 Vera CPU机架:大规模Agent和强化学习的基石.......................................................61.3太空计算模组Space-1亮相,Rubin Ultra采用正交背板..............................................6 风险提示........................................................................................................8 图表目录 图1:英伟达发布Vera Rubin POD..............................................................................................4图2:MGX NVL与ETL机架.......................................................................................................4图3:Rubin+LPX在高端模型上保持较强性能.............................................................................5图4:Rubin+LPX商业效益显著...................................................................................................5图5:Dynamo架构下Rubin与LPU相互协同.............................................................................5图6:LPX带动光、铜缆、PCB、液冷等领域需求.......................................................................5图7:每个tray包含8个CPU.....................................................................................................6图8:Vera CPU液冷机架包含256个CPU.................................................................................6图9:Space-1 Vera Rubin Module助力太空数据中心建设..........................................................7图10:Kyber架构采用正交背板连接...........................................................................................7 1.英伟达新发LPX、CPU机架,推理、Agent AI、太空算力架构迎革新 2026GTC召开,英伟达发布Vera Rubin POD,包含5种机架级系统,公司预计到2027年,公司总订单额将达到1万亿美元。3月17日,2026 GTC大会正式召开,英伟达发布Vera RubinPOD,拥有40个机架、120万亿晶体管、近2万颗NVIDIA芯片、1152颗NVIDIA Rubin GPU、60 Exaflops,以及10PB/s的总scale up带宽。其中,VeraRubin NVL72机架采用NVIDIANVLink连接,Groq 3 LPX机架采用direct chip-to-chiplink连接,Vera CPU机架和BlueField-4STX储存机架则采用Spectrum-X以太网连接。此外,公司还发布了未来产品路线图,包括RubinUltra、LP35 LPU、Feynman GPU、LP40LPU、Rosa CPU、NVLink 8 CPO等产品。由于大量AI推理持续推动算力建设,英伟达CEO黄仁勋预计到2027年公司总订单额将会达到1万亿美元,其曾在2025GTC上预计2025年公司总订单额约为5000亿美元。 数据来源:Nvidia、东方证券研究所 1.1推理利器Groq3 LPX问世,聚焦低时延任务,商业效益显著 Rubin在高端模型场景下性能持续降低。Groq对于模型推理,Tokens作为算力基础设施的“大宗商品”,如何在更低延时内获得更高的吞吐量的tokens是衡量算力设施性能的关键之一,对于参数及上下文较小的模型而言,Rubin NVL72机柜仍能保持单MW下较高的tokens吞吐量,但对于高端超大参数及超长上下文模型而言性能持续下降。吞吐量对应大量算力,时延则对应大量的带宽,对于有限的芯片面积,Rubin GPU的带宽大小逐步成为短板。 Rubin+LPX高端模型推理性能提升显著,凸显商业效益。通过引入Groq机架后,则能有效解决高端模型GPU机柜推理成本高的问题,例如Rubin机架在配合LPX的情况下,相较于Blackwell,为万亿参数模型提供超35倍的每兆瓦tokens处理能力和超10倍的营收机会。 数据来源:Nvidia、东方证券研究所 数据来源:Nvidia、东方证券研究所 Groq专注推理加速,聚焦低时延任务,与Rubin实现优势互补,而非替代关系。Groq 3 LPX专注推理加速,LPX机架核心由Groq 3LP30 LPU构成,LPU是一种以扁平的、SRAM为主的平面内存架构,架构设计旨在实现快速、可预测的token生成。由于单LPU芯片的内存较低仅为500MB,无法容纳大型模型的参数及KV Cache,但带宽高达150TB/s,是Rubin带宽的约7倍,通过与Rubin GPU相结合实现优势互补,在英伟达Dynamo架构下,GPU负责最受益于吞吐量和大型内存容量的解码工作,例如在累积的KVCache上执行全上下文注意力,LPU则负责加速解码过程中的时延敏感型进程,例如稀疏MoE专家前馈网络(FFNs)和其他逐点操作。LPU通过前端光口连接至Specturm-X以太