您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:GB200更新与光模块需求关系解读 - 发现报告

GB200更新与光模块需求关系解读

2024-04-01 未知机构 哪开不壶提哪开
报告封面

【主题】:GB200 更新与光模块需求关系解读及光通信市场新动态1. **市场误解澄清**: – “铜进光退”现象引发市场对光模块需求下滑的担忧,经过国盛通信的黄菡女士分析,实际情 况 并非如此。GB200 发布后,光模块的实际使用量并未减少,相反,其配比呈现出上升趋势,尤其在从 hpop 系列至 black2 系列,再到 GH200 和 GB200 的迭代中,光模块的边际增量显著增大。2. **GB200 与 GH200 对比分析**: – 对 GB200 的解读聚焦于其支持 NVLink72 链路的机柜设计,其中使用的光模 块数量与 GPU 数 量并不呈现简单的线性关系,而是随着 GPU 或交换节点的增多而呈指数增长。– 在比较 GB200 与 GH200 时应考虑集群间的统一配置,而非单个机柜与整个 GH 200 集群的比 较。在 GB200 中,单个机柜实现了内部无阻塞全互联,通过 NVSwitch 芯片和高速 NVLink 链路,确保每个 GPU 能够达到理论最高带宽。3. **光模块需求增长点**: – GB200 在构建更大规模集群(如 8 个机柜配置下的 576 个 GPU 集群)时, 确实需要高性能光 模块实现跨机柜的无阻塞全互联。相较于 GH200,GB200 不仅提高了光模块与 GPU 的配比至 1:9,而且光模块的速率也从 800G 提升至 1.6T,数量和单价的双重增加有望带来更高的利润空间。– GB200 的市场需求强劲,预售后情表现良好,加上客户往往购买多个机柜以满足大规模计 算 需求,这将进一步推动光模块需求的增长。4. **光通信市场新趋势**: – 光模块市场因其更高的带宽优势,如从 800G 提升至 1.6T,增长潜力相对铜缆更大。 考虑到 算力需求将持续快速增长,光模块在数据中心内的价值份额和网络应用中的比重都将增加,带来超 额收益。– 光模块行业的领军企业“易中天”等公司将受益于这一趋势。尽管过去光模块在数据中心资本 支出中占比不高,但在 AI 领域投资增加的情况下,该份额预计将显著提升。5. **行业变局与机会**: – 随着 AI 和集群计算需求的多样化,下游客户群体变得更分散,不再集中于某一特定解决方案 提供商,这有助于提高光模块供应商的议价能力和市场份额。– 各家厂商在光模块市场份额可能发生改变,如中国厂商 Lumentum、新英讯等可能迎来 市场 份额的提升机会。6. **技术发展与策略建议**: – 技术进步要求加强功耗管理,尤其是当机柜内部采用高带宽光模块时,应当重视功耗控制。– 建议重点关注“去创新”、“盛天福”等发展迅速的光模块公司,以及 LPO、LRO 和硅 光等新型光 模块技术的发展。总结: – GB200 升级过程中,光模块需求并未减少反而增加,且配比上升,这一趋势建立在算力需求 持续 增长和模型规模扩大的基础上,预计 GB200 的销量或将超出预期。– 随着技术发展,供应链安全、可靠性以及网络协议变化同样重要,光模块行业正面临新的格局转 变和机遇。会议实录 1. GB200 更新与光模块需求关系解读 各位朋友,大家晚上好,我是国盛通信的黄菡。今天晚上的会议主要是为了澄清一些之前存在的分 歧 和误解,特别是关于“铜进光退”现象和交换机光模块配比下降的问题,这些因素曾导致光模块市 场的回调。我们已经对这些担忧进行了详细的测算和评估。事实上,无论是从铜缆的使用还是光模 块的配比来看,自 GB200 发布以来,市场都出现了一些变化。今晚我们会讨论如何看待这些变化,并预测它们最终的影响。 首先,我要分享的结论是,我们认为既没有铜缆使用量的大幅提升,也没有光模块配比的下降;实 际上,配比应该是在上升。从 hpop 系列到 black2 系列,从 GH200 到 GB200,光模块的边际增量 非常明显,排放最多。以前大家可能认为潼南或其他领域的增量更大,但现 在看来,它们都不及光 模块的增量。这就是我们得出的最终结论。 由于今晚不能使用 PPT,我们将在面对面的会议中提供更为详细的数据和结果。那时,我们还可以就这些结构和推导的结果与大家进行深入的交流。现在让我们更新几个要点。首先是 GB200 的更新,因为目前的核心关注点就是这个支持 NV Link72 链路的机柜。大家可以在英伟达的官网上找到一些这个机柜的文档和白皮书。在这个文档中,所有 的配置都是针对单个机柜的。这个机柜内有 9 台交换机,每台交换机有 18 个NVswitch 芯片,每个 交换机内有两个。而上面没有第二层交换机了,所以柜内全部使用铜缆连接 IB。之前的理解是因为 看到全铜的柜子,而光模块只占很小一部分,导致大家认为配比可能只有 1 比 2,甚至不到 1 比 2,这就是以前的分析逻辑。但是,如果基于 GB200的销量,真如大家预期的那么乐观,那么光模块 的需求一定会强于以前的产品。所以,这其中的误解可能是因为大家没有用正确的方式做比较。 实际上,大家在比较 GB200 和 GH200 时,没有使用相同的维度。GB200 的配置参数是针对单个机 柜的,而 GH200 的对比是基于一个集群的配置。虽然单个柜子拥有 1. 算力相仿,但是节点数量有很大差异。这样的比 较就像是对比一个精装修的窗台上墙砖的数量,与一个整套房子的墙砖数量,显然是不合理的。如 果节点数减少,那么交换机和光模块的使用量自然会减少。因此,如果要合理比较,应该是拿一个 新房子的使用材料,与一个老房子的使用材料进行对比。2. 光模块利好误区 首先,我们应该如何比较 GB200 和 GH200?我们应该将所有机柜配置的集群相互比较,这是考虑 光模块使用情况的合理方式。原因在于光模块与 GPU 的数量并不是线性关系。人们常常误以为这 种比例是 1 比 3,但却忽略了它可能高达 1 比 9。这种关系实际上是累加的:GPU 或交换节点越多,对非阻塞全互联网络的要求就越高,光模块的增长呈指数性,但节点很少 时,光模块的需求甚至为 零。因此,我们应该比较相同的集群,而不是将单一机柜与 GH200的整个集群对比。这是关于误 解的一个核心因素。接下来,我们来探讨为什么英伟达要推出 GB200 和 GH200。他们实际上是将 GPU 从机柜中剥离出 来,构建了一种无阻塞全互联的集群。这使得所有 GPU 仿佛合并成了一个庞大的 GPU,无论是之 前的 256 个 GPU 大集群,还是现在整个机柜的 576 个 B200 大集群。这就好比一张巨大的 DPU,这样的计算性能表现非常高。所谓的无阻塞全互联,定义上是指集群中每个 GPU 都能达到每个链 接的理论最高带宽和传输速度,即每个 GPU的传输速度都不受限。 那么,单个机柜上是如何实现无阻塞全互联的呢?GB200 包含 2 个 B200,每个 B200 带有 18 个第五代 NVLink 的链接。这些链接的双向带宽从每秒 50GB 升级到了 100GB。72 个 B200,总共 1296 个链接。机柜内包含 9 台 NVLink 第四代的交换机, 然而,如果除了单柜外还要购入更多机柜来构建集群,问题就出现了。例如,老黄在他的演示中使 用的是 576 个 GPU,即 8 个机柜的配置。在这种情况下,需要高性能光模块来实现八个机柜的无 阻塞全互联。因此,我们应该对比 GB200 的 576 个 GPU 集群与 GH2 例子,我们可以将数据包比作汽车,网络 比作马路。如果只有少数通道连接机柜,即使内部流量顺畅,互联之间的狭窄点也会成为集群通信 的瓶颈。因此,为了提高效率,需要拓宽连接到浙江、江苏等地的通道,这也是 GH200 机柜之间 为何采用 NVLink 交换互联的原因。只有这样,256 个 GPU 或者 16 个机柜才能像一个整体运作。3. 量增价值提升 好的,现在我们关注 GB200。如果采用 8 个机架配置,即 576 个 GPU 的情况, 必定会有第二层的 光互连。这一点可以在宣传视频中看出,视频里展示了柜子的图,除了放置服务器的 8 个机架之外,旁边还有许多柜子,里面应该就是第二层的交换机。网络上目前还没有这种网络拓扑图的公开资料,只有 GB200 单机柜的资料,因此容易造成误解。那么,我们来估算一下,GB200 究竟需要多少个第二层的交换机,以及光模块的配置应该是怎样 的。我们可以参考 GAH200 的情况。GAH200 的第二层使用36 台交换机,因为它的 集群由 256 个 GPU 组成,每个 GPU 连接 18 个 NVLink,单个 NVLink 的双向带宽为 50GB/s。256 个 GPU 就会有 4608 个 NVLink 。为了保证这些链接都能得到有效的配对,在第二层交换机上,每台交换机需要有 128 个链接。 这样,4608 个链接除以每台交换机的 128 个端口,正好是 36 台。而每个交换机端口的带 宽是 800G,也就是 4 个 NVLink 的总带宽,所以交换机需要配置 32 个800G 的光模块。 将情况转移到 GB200,576 个 GPU,每个 GPU 依然是 18 个 NVLink,但单个 NVLink 的双向带宽翻 倍。所以 576 个 GPU 构成的大型集群会有 10368 个 NVLink。第二层的交换机每台可容纳 144 个端 口,所以需要 72 台交换机才能做到全互联。现在每个端口对应的是四个 NVLink,而 NVLink 的带 宽已经提升到 1.6T。因此,整个系统中每台交换机必须配备 36 个 1.6T 的光模块,最终得出的光模 块与 GPU 的配比是 1 比 9,与 GH200 相同。所以,如果说 GH200 的市场表现不佳,现在 GB200 的市场表现出色,光模块的销售增 长在哪里 呢?首先,1 比 9 的配比方案在 GH200 时代并未广泛采用,但现在随着 GB200 的出售,这种配比 的需求将明显提升。其次,光模块的速率也提高到了 1.6T,不仅数量增加,而且单价也提高,这可 能还会带来利润率的提升。因此,目前来看,GB200 之后的弹性可能是最大的方向。但是由于网上 的一些误解,许多人低估了这一部分的预期,认为可能会受损,这是一个重大的误解。至于具体的测算,我目前只是手工计算,我们会将它整理成 PPT 和文稿,以便与各位领导进一步 沟 通。到目前为止,根据不同渠道反馈的情况,GB200 的预售情况实际上是不错的。而且,大多数购 买者不只是购买一个机柜,很少会有只买单柜的客户。即使算力需求不大,购买单柜也需要配套的 数据中心和网络环境,这种客户实际上是很少的。通常,需要大量计算力的大型工厂会购买带有互 联功能的版本,这就意味着光模块的需求会大幅增加。每增加一个节点,光模块的需求就会相应提高,前提是网络接近无损全互联的配置。因此,光模块的使用比会有显著不同。与 GH200 相比,GB200 的销售提升将更为明显,光模块的边际增长将会显著。4. 光通信市场新动态 目前来看,在 GB200 光模块畅销的背景下,我们认为相对于铜缆,光模块的增长潜力可能会更 大。这部分归功于光模块本身所具备的更高带宽,例如从 800G 提升到了 1.6T。由于带宽提高后,对信号传输的衰减和对电磁干扰的要求随之增加。在 GB200 中,第二层交换机附近的距离可能超过 1 米甚至 2.3 米,这使得从铜缆切换到光缆成为一种必要。在 GB200 第二层交换机中,提供了三种可 选方案,包括 passivecopper(无源铜缆)、activecop per(主动铜缆),以及光缆。随着带宽的不断 提高,既然目标是构建无损光网络并提升性能,因 此光模块的比重必然会不断增加。所以,光模块 目前来看是弹性最大的方向。然而,这一切讨论的基础,在于整体算力和数据量仍将显著增长。显然,我们的选择毫无疑问会倾向于标的“易中天”,作为光模块领域的龙头公司。去年专家们指出 光模块在数