行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

推理利器LPX问世，AgentAI、太空算力架构迎革新

信息技术 2026-03-19 东方证券静心悟动

英伟达发布Vera Rubin POD，包含5种机架级系统，预计到2027年总订单额将达到1万亿美元。

1. 推理利器Groq 3 LPX问世，聚焦低时延任务，商业效益显著

Rubin在高端模型场景下性能持续下降，带宽成为短板。
Rubin+LPX高端模型推理性能提升显著，相较于Blackwell，为万亿参数模型提供超35倍的每兆瓦tokens处理能力和超10倍的营收机会。
Groq 3 LPX专注推理加速，LPU采用扁平的、SRAM为主的平面内存架构，带宽高达150TB/s，通过与Rubin GPU结合实现优势互补。
单个Groq 3 LPX机架包含32个液冷1U compute tray，提供315 PFLOPS AI推理算力，128GB总SRAM容量，640TB/s总scale up带宽。
LPU的引入解决了高端模型推理场景下单GPU系统成本过高的问题，采用Rubin+LPX的部署形式有望间接改善云厂商的盈利能力，加速低时延AI推理应用落地，逐步激活庞大的推理需求市场，进一步推动PCB、液冷、供电、光通信及铜缆的需求。

2. Vera CPU机架：大规模 AI agent和强化学习的基石

英伟达发布Vera CPU机架，包含32个液冷Vera CPU tray，单个机架由8颗CPU+2颗BlueField DPU组成，Vera CPU搭载Olympus核心，相比传统x86 CPU，单线程性能提升50%。
机架合计包含256颗CPU，提供400TB内存、300TB/s内存带宽，采用液冷散热并通过以太网连接。
单个CPU机架可支持超过22500个并发强化学习或Agentic沙箱环境，性能比传统机架规模CPU高效两倍且速度快50%。
CPU对于AI Agent的部署推理至关重要，Vera CPU具备良好的单线程性能，能够充分支持AI Agent场景下频繁的工具调用、SQL查询和代码编译等任务。
Vera CPU机架的发布有望开启大规模AI agent的部署，帮助AI从“提供”建议进入任务“执行”阶段。

3. 太空计算模组Space-1亮相，Rubin Ultra采用正交背板

英伟达正与合作伙伴研发Space-1 Vera Rubin Module太空计算机模组，面向太空优化的AI计算模块，支持实时感知、决策和自主运作，将数据中心级AI计算性能带到轨道数据中心、地理空间智能和自主空间与运营，加速未来太空数据中心的发展。
Kyber架构公布，计算与交换板之间采用正交背板互联，Kyber架构总共包含144个GPU，算力密度持续提升，Kyber NVL144通过光互连支持scale up至NVL1152。
800V HVDC供电方案已全面落地，多家厂商展示Rubin平台的Sidecar电源系统，为单机柜提供200-600kW稳定电力。
随着英伟达的加入，在底层对太空环境抗辐射、散热等方面进行优化设计，有望推动生态成熟，加速太空IDC的发展。

投资建议

通信方面：短期来看一层scale up域内铜缆仍为较优解，若scale up域采用双层架构则为铜+光相互配合，而对于高算力密度的Kyber架构，正交背板则逐步走向舞台，对于scale out场景下，CPO方案逐步成熟。
散热方面：在高密度AI场景下风冷已彻底退出舞台，Vera Rubin POD五种不同机架均采用100%全液冷，有望进一步带动冷板、快接头、minimanifold、大型CDU的需求。
供电方面：800V HVDC从“可选”走向“AIDC标配”。
太空算力方面：随着英伟达的加入，有望推动生态不断成熟。

风险提示

AI发展不及预期
行业竞争加剧风险
地缘政治风险

推理利器LPX问世，Agent AI、太空算力架构迎革新核心观点 ⚫推理利器Groq 3 LPX问世，聚焦低时延任务，商业效益显著。3月17日，2026GTC大会正式召开，英伟达发布LPX机架，Groq 3 LPX专注推理加速，LPX机架核心由Groq 3LP30 LPU构成，LPU是一种以扁平的、SRAM为主的平面内存架构，架构设计旨在实现快速、可预测的token生成。单个Groq 3LPX机架包含32个液冷1Ucompute tray，合计可提供315 PFLOPSAI推理算力，128GB总SRAM容量，640TB/s总scale up带宽。Rubin机架在配合LPX的情况下，相较于Blackwell，为万亿参数模型提供超35倍的每兆瓦tokens处理能力和超10倍的营收机会。我们认为，LPU的引入解决了当下高端模型推理场景下单GPU系统成本过高的问题，采用Rubin+LPX的部署形式有望间接改善云厂商的盈利能力，加速低时延AI推理应用落地，逐步激活庞大的推理需求市场，进一步推动PCB、液冷、供电、光通信及铜缆的需求。薛宏伟执业证书编号：S0860524110001xuehongwei@orientsec.com.cn021-63326320 蒯剑执业证书编号：S0860514050005香港证监会牌照：BPT856kuaijian@orientsec.com.cn021-63326320 ⚫Vera CPU机架：大规模AI agent和强化学习的基石。英伟达发布Vera CPU机架，包含32个液冷Vera CPU tray，单个机架由8颗CPU+2颗BlueField DPU组成，Vera CPU搭载Olympus核心，相比传统x86 CPU，Vera单线程性能提升50%，机架合计包含256颗CPU，提供400TB内存、300TB/s内存带宽，采用液冷散热并通过以太网连接。单个CPU机架可支持超过22500个并发强化学习或Agentic沙箱环境，性能比传统机架规模CPU高效两倍且速度快50%，能够测试、执行和验证Vera Rubin NVL72和LPX机架的结果，助力Agent AI发展。我们认为，CPU对于AI Agent的部署推理至关重要，Vera CPU具备良好的单线程性能，能够充分支持AI Agent场景下频繁的工具调用等任务，Vera CPU机架的发布有望开启大规模AI agent的部署，帮助AI从“提供”建议进入任务“执行”阶段。雷星宇执业证书编号：S0860126030013leixingyu@orientsec.com.cn021-63326320 李晋杰执业证书编号：S0860125070012lijinjie@orientsec.com.cn021-63326320 ⚫太空计算模组Space-1亮相，Rubin Ultra采用正交背板。英伟达正与合作伙伴研发Space-1 Vera Rubin Module太空计算机模组，面向太空优化的AI计算模块，有望加速未来太空数据中心的发展。此外，英伟达还公布了Rubin Ultra Kyber架构，计算与交换板之间采用正交背板互联，Kyber NVL144通过光互连支持scale up至NVL1152。 CXL方案优化AI存储架构，头部厂商有望加速应用2026-03-17产业链重视CXL技术，英伟达有望推进2026-03-14OpenClaw打开国产算力天花板2026-03-13 投资建议与投资标的投资建议：通信方面，短期来看一层scale up域内铜缆仍为较优解，若scale up域采用双层架构则为铜+光相互配合，而对于高算力密度的Kyber架构，正交背板则逐步走向舞台，对于scale out场景下，CPO方案逐步成熟；散热方面，Vera Rubin POD中五种不同机架均采用100%全液冷；供电方面，800V HVDC从“可选”走向“AIDC标配”；太空算力方面，随着英伟达的加入，有望推动生态不断成熟。相关标的：PCB相关厂商沪电股份(002463，未评级)、胜宏科技(300476，未评级)、景旺电子(603228，未评级)、深南电路(002916，未评级)、方正科技(600601，未评级)、中富电路(300814，未评级)、鹏鼎控股(002938，买入)、东山精密(002384，买入)；CPO相关厂商源杰科技(688498，未评级)、长光华芯(688048，未评级)、仕佳光子(688313，未评级)、光迅科技(002281，未评级)、天孚通信(300394，未评级)、太辰光(300570，未评级)、致尚科技(301486，未评级)、长芯博创(300548，未评级)等；液冷相关厂商英维克(002837，未评级)、领益智造(002600，买入)、申菱环境(301018，未评级)、高澜股份(300499，未评级)、思泉新材(301489，未评级)等；太空算力相关厂商复旦微电(688385，买入)、成都华微(688709，未评级)等。风险提示 AI发展不及预期，行业竞争加剧风险，地缘政治风险目录 1.英伟达新发LPX、CPU机架，推理、Agent AI、太空算力架构迎革新........4 1.1推理利器Groq 3 LPX问世，聚焦低时延任务，商业效益显著......................................41.2 Vera CPU机架：大规模Agent和强化学习的基石.......................................................61.3太空计算模组Space-1亮相，Rubin Ultra采用正交背板..............................................6 风险提示........................................................................................................8 图表目录图1：英伟达发布Vera Rubin POD..............................................................................................4图2：MGX NVL与ETL机架.......................................................................................................4图3：Rubin+LPX在高端模型上保持较强性能.............................................................................5图4：Rubin+LPX商业效益显著...................................................................................................5图5：Dynamo架构下Rubin与LPU相互协同.............................................................................5图6：LPX带动光、铜缆、PCB、液冷等领域需求.......................................................................5图7：每个tray包含8个CPU.....................................................................................................6图8：Vera CPU液冷机架包含256个CPU.................................................................................6图9：Space-1 Vera Rubin Module助力太空数据中心建设..........................................................7图10：Kyber架构采用正交背板连接...........................................................................................7 1.英伟达新发LPX、CPU机架，推理、Agent AI、太空算力架构迎革新 2026GTC召开，英伟达发布Vera Rubin POD，包含5种机架级系统，公司预计到2027年，公司总订单额将达到1万亿美元。3月17日，2026 GTC大会正式召开，英伟达发布Vera RubinPOD，拥有40个机架、120万亿晶体管、近2万颗NVIDIA芯片、1152颗NVIDIA Rubin GPU、60 Exaflops，以及10PB/s的总scale up带宽。其中，VeraRubin NVL72机架采用NVIDIANVLink连接，Groq 3 LPX机架采用direct chip-to-chiplink连接，Vera CPU机架和BlueField-4STX储存机架则采用Spectrum-X以太网连接。此外，公司还发布了未来产品路线图，包括RubinUltra、LP35 LPU、Feynman GPU、LP40LPU、Rosa CPU、NVLink 8 CPO等产品。由于大量AI推理持续推动算力建设，英伟达CEO黄仁勋预计到2027年公司总订单额将会达到1万亿美元，其曾在2025GTC上预计2025年公司总订单额约为5000亿美元。数据来源：Nvidia、东方证券研究所 1.1推理利器Groq3 LPX问世，聚焦低时延任务，商业效益显著 Rubin在高端模型场景下性能持续降低。Groq对于模型推理，Tokens作为算力基础设施的“大宗商品”，如何在更低延时内获得更高的吞吐量的tokens是衡量算力设施性能的关键之一，对于参数及上下文较小的模型而言，Rubin NVL72机柜仍能保持单MW下较高的tokens吞吐量，但对于高端超大参数及超长上下文模型而言性能持续下降。吞吐量对应大量算力，时延则对应大量的带宽，对于有限的芯片面积，Rubin GPU的带宽大小逐步成为短板。 Rubin+LPX高端模型推理性能提升显著，凸显商业效益。通过引入Groq机架后，则能有效解决高端模型GPU机柜推理成本高的问题，例如Rubin机架在配合LPX的情况下，相较于Blackwell，为万亿参数模型提供超35倍的每兆瓦tokens处理能力和超10倍的营收机会。数据来源：Nvidia、东方证券研究所数据来源：Nvidia、东方证券研究所 Groq专注推理加速，聚焦低时延任务，与Rubin实现优势互补，而非替代关系。Groq 3 LPX专注推理加速，LPX机架核心由Groq 3LP30 LPU构成，LPU是一种以扁平的、SRAM为主的平面内存架构，架构设计旨在实现快速、可预测的token生成。由于单LPU芯片的内存较低仅为500MB，无法容纳大型模型的参数及KV Cache，但带宽高达150TB/s，是Rubin带宽的约7倍，通过与Rubin GPU相结合实现优势互补，在英伟达Dynamo架构下，GPU负责最受益于吞吐量和大型内存容量的解码工作，例如在累积的KVCache上执行全上下文注意力，LPU则负责加速解码过程中的时延敏感型进程，例如稀疏MoE专家前馈网络（FFNs）和其他逐点操作。LPU通过前端光口连接至Specturm-X以太

点击免费查看完整报告

推理利器LPX问世，AgentAI、太空算力架构迎革新

英伟达发布Vera Rubin POD，包含5种机架级系统，预计到2027年总订单额将达到1万亿美元。

1. 推理利器Groq 3 LPX问世，聚焦低时延任务，商业效益显著

2. Vera CPU机架：大规模 AI agent和强化学习的基石

3. 太空计算模组Space-1亮相，Rubin Ultra采用正交背板

投资建议

相关标的

风险提示

你可能感兴趣

从训练走向极致推理LPU架构重塑算力底座东北计算机范式转移

计算机行业周报：OpenAI发布o1模型，推理能力迎重大突破，继续重点推荐算力及应用侧标的

推理驱动算力需求高歌猛进高阶PCB迎量价齐升20250924兴业证券

计算机行业重大事项点评：Token 推理大爆发，国产算力再迎海量需求

东吴电新太空光伏卫星唯一能源火箭运力或迎非线性增长太空算力空间远大持

电力设备行业点评报告：太空光伏：卫星目前关键能源、火箭运力或迎非线性增长，太空算力空间远大

公司事件点评报告：AI算力驱动太空光伏浪潮，超薄硅片切割设备迎放量机遇

产业观察22期：【数字经济周报】大模型最强架构TTT问世或将推翻Transformer

传媒行业周报：大模型升级混合推理架构，智能体能力与开源生态持续发展

2025 年报点评：利润逐季环增，增资元川微协同布局 LPU 推理架构