行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

计算机行业周报20260411：Token“通胀”呼唤超节点

信息技术 2026-04-12 国联民生证券风与林

本周观点
- AI发展推动算力架构革新，超节点助力计算效率提升
  - AI算力与传统数据中心计算方式不同，核心性能取决于推理、上下文处理与数据移动效率。
  - AI工作负载需在超长上下文中执行多步骤推理，对平台全层级能力形成压力。
  - AI计算的进步可以由三大扩展定律体现：预训练扩展、后训练扩展和测试时扩展。
  - 大模型自回归推理存在Prefill和Decode两种资源需求冲突的阶段，超节点可以成为实现P/D分离的重要支撑。
  - 超节点服务器架构实现高效物理分离，凭借强大的内部互连网络，在内部进行P/D任务的划分。
  - 以英伟达NVIDIA Rubin平台为例，极限协同设计是Rubin平台的基础，将整个数据中心视为计算单元。
  - Rubin平台的旗舰产品是Vera Rubin NVL72机架级系统，其设计使整个机架在更大的AI工厂中作为一个协调一致的机器运行。
  - Rubin平台由六个新芯片构建而成，每个芯片均针对AI工厂中的特定角色而设计，并协同运行。
- 国产超节点加速发展，有望成为国产算力“弯道超车”的重要机遇
  - 浪潮信息：元脑SD200超节点是国内大模型推理性能最强的本土AI超节点产品之一。
    - 元脑SD200超节点搭载64张本土AI芯片运行DeepSeek R1671B大模型时，单用户token生成速度达112 tokens/s，单token生成时延低至8.9ms。
    - 实现硬件架构原生创新，自研多主机低延迟内存语义通信架构，采用3D Mesh高性能互连超扩展系统。
    - 通信能力优化，强化GPU交互能力，包括精简互连协议、全局统一编址和全局地址映射与数据路由。
  - 中科曙光：全场景覆盖产品矩阵，开放生态助力国产算力前行。
    - 中科曙光推出世界首个无线缆箱式超节点scaleX40，单节点集成40张GPU，总算力超过28PFLOPS。
    - 采用标准19英寸箱式设计，实现算力单元与机柜解耦，部署周期从数月级大幅缩短至数小时。
  - 华为昇腾：从384超节点到万卡集群，国产算力龙头打造坚实计算底座。
    - Atlas 900 AI超节点：搭载384颗Ascend 910CAI芯片，FP8精度总算力达300PFLOPS。
    - Atlas 950 AI超节点：搭载8192颗Ascend 950DT AI芯片，FP8精度总算力达8EFLOPS、FP4精度达16EFLOPS。
    - Atlas 960AI超节点：搭载15488颗Ascend 960 AI芯片，FP8精度总算力达30EFLOPS、FP4精度达60EFLOPS。
    - TaiShan 950通用计算超节点：面向金融、政务等通用计算场景推出，最大支持32颗Kunpeng 950通用处理器。 1.3 投资建议
- AI Agent时代Token需求的非线性增长，或直接带来超预期的AI算力需求，而超节点有望成为AI算力发展的重要趋势。
- 国产超节点目前快速发展，有望成为国产算力实现“弯道超车”的重要机遇。
- 建议重点关注：
  - 国产超节点龙头：浪潮信息、中科曙光等。
  - 华为超节点产业链：软通动力、神州数码、中国长城、慧博云通、拓维信息等。
  - 国产AI芯片/CPU：寒武纪、海光信息、中国长城、云天励飞、龙芯中科等。
  - 云计算：金山云、网宿科技、优刻得、青云科技等。
行业新闻
- 中国证监会发布《关于深化创业板改革更好服务新质生产力发展的意见》。
- 阿里巴巴：HappyHorse我们研发，将于近期开放API。
- 腾讯QClaw V2大版本发布：迭代超30个功能，持续降低“养虾”门槛。
公司新闻
- 浪潮信息：2025年实现营业收入1647.82亿元，同比增长43.25%；归母净利润24.13亿元，同比增长5.2%。
- 海光信息：2025年实现营业收入143.77亿元，同比增长56.92%；实现归属于上市公司股东的净利润25.45亿元，同比增长31.79%。
- 国能日新：2025年实现营业收入7.17亿元，同比增长30.49%。
- 彩讯股份：2025年营业收入18.3亿元，同比增长10.76%。
本周市场回顾
- 本周沪深300指数上涨3.52%，中小板指数上涨5.92%，创业板指数上涨8.70%，计算机（中信）板块上涨5.68%。
风险提示
- 人工智能政策不及预期。
- 行业竞争加剧。

Token“通胀”呼唤超节点 glmszqdatemark2026年04月12日推荐维持评级市场回顾本周（04.06-04.10）沪深300指数上涨3.52%，中小板指数上涨5.92%，创业板指数上涨8.70%，计算机（中信）板块上涨5.68%。板块个股涨幅前五名分别为：江波龙、同有科技、卡莱特、宏景科技、浪潮信息；跌幅前五名分别为：同花顺、立方退、*ST国华、金溢科技、电科数字。行业要闻中国证监会发布《关于深化创业板改革更好服务新质生产力发展的意见》。阿里巴巴：HappyHorse我们研发，将于近期开放API。腾讯QClaw V2大版本发布：迭代超30个功能，持续降低“养虾”门槛。分析师吕伟执业证书：S0590525110033邮箱：lvwei_yj@glms.com.cn 公司动态分析师郭新宇执业证书：S0590525110034邮箱：guoxinyu@glms.com.cn 浪潮信息：2025年实现营业收入1647.82亿元，同比增长43.25%；归母净利润24.13亿元，同比增长5.2%；基本每股收益1.639元。公司拟每10股派发现金红利0.4元(含税)。公司经营活动产生的现金流量净额54.53亿元，较上年增长7183.71%，主要系本期业务规模持续扩大，销售回款增加所致。海光信息：2025年公司实现营业收入143.77亿元，同比增长56.92%。实现归属于上市公司股东的净利润25.45亿元，同比增长31.79%；2026年第一季度营收为40.34亿元，同比增长68.06%；归母净利润为6.87亿元，同比增长35.82%。投资建议 AI Agent时代Token需求的非线性增长，或直接带来超预期的AI算力需求，而超节点有望成为AI算力发展的重要趋势；国产超节点目前快速发展，有望成为国产算力实现“弯道超车”的重要机遇。建议重点关注：1）国产超节点龙头：浪潮信息、中科曙光等；2）华为超节点产业链：软通动力、神州数码、中国长城、慧博云通、拓维信息等；3）国产AI芯片/CPU：寒武纪、海光信息、中国长城、云天励飞、龙芯中科等；4）云计算：金山云、网宿科技、优刻得等。相关研究 1．计算机行业动态报告：“龙虾”深度：Token“通胀”谁受益？一“芯”二“模”三“云”-2026/04/092．计算机行业周报20260405：Claude事件是否是国产大模型又一个“DeepSeek”时刻？-2026/04/063．计算机行业周报20260329：AI存算加速成为大模型竞争升级的关键-2026/03/294．计算机行业周报20260322：计算机行业2026年一季度业绩前瞻-2026/03/225．计算机行业周报20260315：人手一“虾”时代：Tokens需求通胀主线确立-2026/03/15 风险提示：人工智能政策不及预期，行业竞争加剧。目录 1本周观点.................................................................................................................................................................31.1 AI发展推动算力架构革新，超节点助力计算效率提升...............................................................................................................31.2国产超节点加速发展，有望成为国产算力“弯道超车”的重要机遇......................................................................................51.3投资建议..............................................................................................................................................................................................92行业新闻..............................................................................................................................................................103公司新闻..............................................................................................................................................................114本周市场回顾........................................................................................................................................................125风险提示..............................................................................................................................................................14插图目录..................................................................................................................................................................15表格目录..................................................................................................................................................................15 1本周观点 1.1AI发展推动算力架构革新，超节点助力计算效率提升 AI发展推动算力架构革新：AI算力与传统数据中心的计算方式有所区别，它是持续在线的智能生产系统，核心性能取决于推理、上下文处理与数据移动效率，而非仅服务器峰值算力。AI工作负载需在超长上下文中执行多步骤推理，对平台全层级能力形成压力，微小效率损耗在数万亿token规模下会严重影响成本、吞吐量与竞争力。AI计算的进步可以由三大扩展定律来体现：预训练扩展让模型学习固有知识，后训练扩展通过微调与增强学习赋予模型思考能力，测试时扩展则在推理中通过生成更多token实现深度推理。资料来源：英伟达开发者官网，国联民生证券研究所大模型自回归推理存在Prefill（计算密集）与Decode（内存带宽密集）两种资源需求冲突的阶段，超节点可以成为实现P/D分离的重要支撑，因此有望成为下一代AI算力架构的核心形态。在Decode阶段，决定性能的关键因素不再是GPU的峰值算力，而是其在单位时间内能够从显存中读取或写入数据的总量。这一性能直接影响着用户的另一个核心体验指标，即单字生成延迟，它决定了后续文本生成的流畅度，进而P/D分离架构应运而生，新型的超节点服务器架构实现高效物理分离，凭借强大的内部互连网络，在内部进行P/D任务的划分。同时，在互联协议端，技术的进步可以更有效实现物理带宽能力的释放。以中国移动推动的OISA协议为例，新一代互连技术已经超越了单纯“数据管道”的角色，正在向系统管理中的主动参与者演进。资料来源：中移智库官方公众号，国联民生证券研究所以英伟达NVIDIA Rubin平台为例，极限协同设计是Rubin平台的基础。GPU、CPU、网络、安全、软件、供电和冷却均作为一个整体系统协同构建，而非各自独立优化。通过这种方式，Rubin平台将整个数据中心视为计算单元。这一方法为高效、安全且可预测的大规模智能生成奠定了全新基础，确保性能与效率在实际生产部署中得以持续保持，而不仅仅体现在孤立组件的基准测试中。 Rubin平台的旗舰产品是Vera Rubin NVL72机架级系统，其设计使整个机架在更大的AI工厂中作为一个协调一致的机器运行。NVL72系统不仅针对峰值性能进行优化，更注重持续的智能生产：具备可预测的延迟、异构执行阶段的高利用率，以及将功率高效转化为可用智能的能力。资料来源：英伟达开发者官网，国联民生证券研究所 Rubin平台由六个新芯片构建而成，每个芯片均针对AI工厂中的特定角色而设计，并从一开始就旨在作为统一机架级系统的一部分协同运行。 1）NVIDIA Vera CPU: 88个NVIDIA定制设计的OLYMPUS核心，专为全面兼容Arm的新一代AI工厂优化。 2）NVIDIA Rubin GPU:搭载HBM4与全新的NVIDIA Transformer引擎，实现高性能AI计算。 3）NVIDIA NVLink 6交换机:第六代纵向扩展网络，提供高达3.6 TB/s的GPU到GPU带宽。 4）NVIDIA ConnectX-9:面向端点的高吞吐量、低延迟网络接口，支持大规模横向扩展AI应用。 5）NVIDIA BlueField-4数据处理器(DPU):采用双裸片封装，集成以下组件：基于64核NVIDIA Grace CPU，用于基础设施卸载与安全处理。内置NVIDIAConnectX-9高速网络芯片，实现高效紧密的数据传输。 6）NVIDIA Spectrum-6以太网交换机:采用光电一体封装技术，提升横向扩展连接的效率与可靠性。 1.2国产超节点加速发展，有望成为国产算力“弯道超车” 的重要机遇浪潮信息：元脑SD200超节点是当前国内大模型推理性能最强的本土AI超节点产品之一。元脑SD200超节点搭载64张本土AI芯片运行DeepSeek R1671B大模型时，在输入长度4096、输出长度1024的场景下，单用户token生成速度达112 tokens/s，单token生成时延低至8.9ms，是国内首个突破10ms大关的本土超节点产品，大模型推理端到端体验领先行业。实现硬件架构原生创新：自研多主机低延迟内存语义通信架构，采用3D Mesh高性能互连超扩展系统，支持64张本土AI芯片高密度扩展，整机最大显存4TB、系统内存64TB。创新三层精简互连协议，报文有效数据利用率超96%，物理层误码率低至10⁻¹²；首创交换域全局统一显存编址并研发影子设备技术，实现跨主机GPU P2P直接访问。资料来源：浪潮信息官方公众号，国联民生证券研究所通信能力优化，强化GPU交互能力。1）精简互连协议：采用事务层-数据链路层-物理层三层精简互连协议，事务层天然支持Load/Store内存语义；数据链路层支持基于信用的流控机制和链路级错误重传保障；物理层建立10⁻¹²低误码率的高可靠物理通道，报文有效数据利用率达成96%以上。2）全局统一编址：为解决跨主机域通信难题，设计独立于主机域的交换域全局地址空间，将多个独立主机域下的GPU在交换域进行统一的显存编址，为GPU互访提供基础保障。3）全局地址映射与数据路由：创新研发影子设备技术

点击免费查看完整报告

计算机行业周报20260411：Token“通胀”呼唤超节点

你可能感兴趣

计算机行业周报20260419：Token“通胀”呼唤国产算力：“一芯二模三云”之“一芯”

计算机行业周报20260301：“龙虾”启示录：Token需求“通胀”云主线确立

计算机行业周报20260124：Token需求“通胀”：从CPU到云服务

国联民生计算机阿里云官宣涨价超30持续看好Token需求通胀主链

计算机行业周报-华为HDC2025精彩纷呈：鸿蒙、盘古、超节点、具身智能平台

计算机行业周报：华为超节点新品正式发布，阿里云栖大会召开在即

【财联社早知道】Token调用总量已超过上一代模型10倍，腾讯AI战略全面提速，机构称Token消耗规模将长期保持高增态势，这家公司已构建超330个节点机房的分布式算力网络，可运营算力规模达5.3万路-20260514

计算机行业周报：超节点持续演进，看好国产算力

计算机行业周报：国产AI芯片密集取得突破、超节点成智算发展趋势

计算机行业周报：中科曙光发布640卡超节点