AI智能总结
计算机 证券研究报告 行业点评报告/2025.11.09 投资评级:看好(维持) 核心观点 中科曙光ScaleX640发布,国产超节点再添新星:超节点凭借其高带宽、低时延与易部署等优势,逐渐成为AI基础设施的新范式。中科曙光于2025世界互联网大会乌镇峰会正式发布全球首个单机柜级640卡超节点ScaleX640。产品采用“一拖二”高密架构支撑千卡级计算单元与十万卡级集群扩展,官方数据显示单机柜算力密度提升20倍。 ScaleX640基于浸没相变液冷/HVDC/结构设计,拥有算力密度高、整体PUE低、开放程度高等优势:中科曙光持续推动系统工程创新,实现算、存、网、电、冷的一体化紧耦合系统设计,实现了软硬件协同的全局优化,打造出强性能、高效率、高可靠、全面开放的超节点方案。产品依托浸没相变液冷技术优化散热,单机柜功率密度860kW,PUE值<1.04,官方数据显示其产品冷却、供电技术和硬件架构均已达到对标英伟达NVL576产品水准。 分析师杨烨SAC证书编号:S0160522050001yangye01@ctsec.com 分析师郑元昊SAC证书编号:S0160525100003zhengyh03@ctsec.com ❖超节点竞赛愈演愈烈,差异化路径展开:超节点已成为算力厂商必争之地,英伟达借助芯片、机柜、通信、软件和供应链全方位优势,持续布局推出超节点产品,国内算力厂商受制于制程劣势,选择系统化路线,不断加码超节点,意图实现“弯道追赶”,华为基于"灵衢"协议和昇腾生态实现半开放布局,中科曙光与海光信息基于全开放的AI计算开放架构和CPU/GPU/存储/液冷/机柜等系统性解决方案引领行业发展。 相关报告 1.《Robotaxi产 业 进 程 正 在 加 速 》2025-10-262.《OpenAI:万亿美元算力战略的资本博弈》2025-10-193.《9月车市平稳,滴滴自动驾驶完成D轮融资》2025-10-15 ❖投资建议:建议关注中科曙光、海光信息、寒武纪、协创数据、东阳光,曙光数创、摩尔线程、沐曦股份、阿里巴巴、百度、神州数码、软通动力等。 ❖风险提示:技术迭代不及预期、商业化落地不及预期、市场竞争加剧等。 内容目录 1ScaleX640:中科曙光推出行业领先超节点方案..........................................................31.1中科曙光超节点ScaleX640重磅亮相,国产超节点再添新星......................................31.2“一拖二”双超节点实现千卡级计算单元,算力密度行业领先.....................................41.3浸没相变液冷领先行业,软硬件协同全局优化..........................................................62超节点发展引领AI算力市场格局演变........................................................................62.1英伟达:异构架构+私有生态,主打高性能与高端市场...............................................62.2华为:高卡数集群+自研互联,强调整体算力与国产化适配.........................................82.3中科曙光:开放架构+高密扩展,聚焦国产智算生态兼容............................................93投资建议.............................................................................................................104风险提示.............................................................................................................10 图表目录 图1:ScaleX640超节点规模与性能全面领先...............................................................4图2:ScaleX640超节点具备性能强、效率高、开放程度高等优势...................................5图3:ScaleX640冷却、供电技术和硬件架构对标NVL576............................................6图4:Vera Rubin NVL144平台预计2026年下半年发布..............................................7图5:Rubin Ultra NVL576平台预计2027年下半年发布...............................................8图6:华为Atlas 950超节点将超越英伟达NVL144......................................................9图7:华为Atlas 960超节点性能再翻倍......................................................................9 表1:英伟达、华为、中科曙光现存超节点产品核心维度对比..........................................10 1ScaleX640:中科曙光推出行业领先超节点方案 1.1中科曙光超节点ScaleX640重磅亮相,国产超节点再添新星 算力基建遇瓶颈,超节点成为未来趋势。超节点(SuperPod)这一概念最初由英伟达提出,其本质是通过高速互联技术将多台服务器和数十乃至上百块GPU紧密集成的高性能计算单元,旨在解决大模型训练对大规模GPU集群的需求。随着大模型参数从千亿级跃升至万亿级,传统服务器集群架构在跨机通信方面暴露出明显瓶颈,而超节点凭借其高带宽、低时延与易部署等优势,逐渐成为AI基础设施的新范式。从技术演进角度看,超节点代表着计算架构从"服务器集群"时代向"集成计算单元"时代的跨越,其核心价值在于为大规模AI训练提供了深度优化的专用算力基石。 中科曙光正式发布全球首个单机柜级640卡超节点ScaleX640。11月6日,2025世界互联网大会乌镇峰会期间,中科曙光正式发布全球首个单机柜级640卡超节点ScaleX640,它基于全球领先的开放系统硬件架构打造,并首次在乌镇互联网之光博览会首发亮相。 数据来源:中科曙光公众号,财通证券研究所 1.2“一拖二”双超节点实现千卡级计算单元,算力密度行业领先 高密架构支撑千卡级单元与十万卡级扩展。规模层面,ScaleX640超节点采用“一拖二”高密架构设计,单机柜可实现640卡超高速总线互联,构建大规模、高带宽、低时延的超节点通信域,双ScaleX640超节点可组成1280卡计算单元,满足更大规模算力需求;通过30天+长稳运行可靠性测试验证,可保障十万卡级超大规模集群扩展部署。性能层面,对比业界同类产品,其综合算力性能倍增, 单机柜算力密度提升20倍,在MoE万亿参数大模型训练推理场景中,性能较传统方案提升30-40%。 1.3浸没相变液冷领先行业,软硬件协同全局优化 创新技术实现性能优化,降低运行功耗。中科曙光持续推动系统工程创新,实现算、存、网、电、冷的一体化紧耦合系统设计,采用超高速正交架构、超高密度刀片、浸没相变液冷、高压直流供电等创新技术,实现了软硬件协同的全局优化,打造出超强性能、极致效率、超高可靠、全面开放的超节点方案。能效方面,依托浸没相变液冷技术优化散热,单机柜功率密度860kW,PUE值<1.04,公司称产品冷却、供电技术和硬件架构均已达到英伟达预计27年推出的NVL576产品。 引领生态耦合协同,补齐能力短板。面对国产化进程中高端芯片算力不足、标准缺失、软硬件割裂、协作成本高等痛点,中科曙光于今年9月联合20余家产业链企业,共同发布“AI计算开放架构”,并开放多项关键技术能力,旨在降低AI集群研发门槛,避免重复投入,推动产业从“单点突围”走向“生态共进”。ScaleX640超节点正是采用AI计算开放架构,在硬件层面支持多品牌加速卡,软件层面兼容主流计算生态,构建了一个“软硬协同、生态兼容”的国产智算新范式。 2超节点发展引领AI算力市场格局演变 超节点技术的快速发展正深刻改变着AI算力市场的格局。巨大的市场前景吸引了包括中科曙光、华为等系统厂商,阿里云、腾讯云等云服务商,以及沐曦、燧原科技等AI芯片厂商的积极参与。在这场技术竞赛中,中国企业正以更系统、更底层的方式参与全球AI基础设施发展的叙事与重构。 2.1英伟达:异构架构+私有生态,主打高性能与高端市场 超节点概念的首创者,凭借NVLink和NVSwitch等私有互联技术构建完整垂直生态。2024年3月,英伟达发布的NVL72系统将36个GraceCPU和72个BlackwellGPU集成到一个液冷机柜中,实现720PFLOPS的AI训练性能。其最新推出的DGXGB200NVL72超节点采用NVLink5.0技术,单GPU支持18个NVLink链接,总带宽达1800GB/s,是PCIe5带宽的14倍以上。这种封闭但高性能的设计使英伟达在高端市场占据主导地位,微软、Meta等科技巨头纷纷采购其超节点产品,尽管单价高达300万美元。 Vera Rubin超级芯片发布,超节点规划更显清晰。在10月29日举行的GTCOctober 2025大会上,英伟达CEO黄仁勋首次公开展示了其下一代VeraRubin超级芯片。Vera Rubin有两个主要组件:一个称为Vera的CPU和一个称为Rubin的新GPU设计,NVLink数量增加到144。这一发布标志着英伟达离未来的两个超节点产品更进一步: ⚫Vera Rubin NVL144平台,计划在2026年下半年发布。可实现3.6EFLOPS(FP4推理)与1.2 EFLOPS(FP8训练)的算力,相较GB300NVL72提升约3.3倍;系统总显存带宽达13 TB/s,快速存储容量为75TB,分别比上一代提升60%,并具备双倍NVLINK与CX9通信能力,最高速率分别为260 TB/s与28.8 TB/s。 ⚫Rubin Ultra NVL576平台,计划在2027年下半年发布。将NVL规模从144扩展至576,可实现15 EFLOPS(FP4推理)与5 EFLOPS(FP8训练)算力,相较GB300 NVL72提升14倍;其HBM4显存带宽达到4.6 PB/s,快速存储容量达365 TB,分别为上一代的8倍,NVLINK与CX9通 信 能 力 则 提 升 至12倍 与8倍 , 最 高 速 率 分 别 达 到1.5PB/s与115.2 TB/s。 数据来源:IT之家,财通证券研究所 数据来源:IT之家,财通证券研究所 2.2华为:高卡数集群+自研互联,强调整体算力与国产化适配 华为选择不同于英伟达的技术路径。2025年,华为发布了Atlas900超节点和昇腾384超节点,采用自研的“灵衢”(UB)互联协议。昇腾384超节点以384张昇腾算力卡组成一个超节点,提供高达300PFLOPs的密集BF16算力,接近英伟达GB200NVL72系统的两倍。华为特别强调"超节点+集群"的战略,通过Atlas900SuperCluster实现了业界最大规模的高速总线互联。华为的独特之处在于将超节点技术与中国可获得的芯片制造工艺相结合,提出"用数