您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:SemiAnalysisCPO报告解读20260105 - 发现报告

SemiAnalysisCPO报告解读20260105

2026-01-05未知机构阿***
SemiAnalysisCPO报告解读20260105

这篇对SemiAnalysis CPO报告的解读,核心围绕CPO(共封装光学)技术在AI数据中心网络中的发展前景、挑战以及不同场景下的应用节奏进行了深入分析。 主要结论可以概括为以下几点: 长期趋势明确,但短期全面替代逻辑尚不成熟:报告肯定了CPO是未来光互联的确定方向,尤其在降低功耗(通过缩短电信号传输距离)和成本方面有显著潜 力。然而,短期内其全面替代传统可插拔光模块的进程将慢于预期,尤其是在Scale Out(数据中心机架间互联)场景下。 SemiAnalysis CPO报告解读20260105 这篇对SemiAnalysis CPO报告的解读,核心围绕CPO(共封装光学)技术在AI数据中心网络中的发展前景、挑战以及不同场景下的应用节奏进行了深入分析。 主要结论可以概括为以下几点: 长期趋势明确,但短期全面替代逻辑尚不成熟:报告肯定了CPO是未来光互联的确定方向,尤其在降低功耗(通过缩短电信号传输距离)和成本方面有显著潜 力。然而,短期内其全面替代传统可插拔光模块的进程将慢于预期,尤其是在Scale Out(数据中心机架间互联)场景下。 Scale Out场景:可插拔光模块仍占主导,CPO渗透缓慢: 优势有限:在Scale Out集群中,网络部分的总功耗和总成本占整个集群的比例有限(文中举例约9%和一定百分比)。因此,即使CPO能将光模块环节的功耗降低80%以上,对整体集群的功耗和成本优化幅度(如分别优化约4%和7%)并不足以构成压倒性优势。 传统方案优势稳固:可插拔光模块在互操作性(标准化接口,采购灵活,客户议 价能力强)、可维护性(支持热插拔,运维简单)以及产业链成熟度(生态完善,供应稳定)三个方面拥有CPO目前难以撼动的显著优势。 经济性需系统考量:虽然CPO光引擎本身成本低于光模块,但考虑到交换机厂商的毛利率,最终用户的整体购置成本优化并不明显,甚至可能更高。 结论:未来一段时间,Scale Out互联的主力仍将是可插拔光模块。CPO在该场景的规模化放量需等待产业链进一步成熟、标准完善及生态构建。 Scale Up场景:CPO的潜力市场,渗透迫切性更强: 需求驱动:Scale Up(GPU柜内/机架内互联)对带宽密度和速率的要求远高于Scale Out(文中称可达9倍),持续推动SerDes速率提升。 铜缆的局限与光的必要性:当前阶段,厂商(如英伟达)会优先使用低延迟、高 带宽的铜缆。但铜缆存在传输距离的物理极限,当速率进一步提升时,必将遇到 瓶颈,从而转向光互联。 CPO的独特价值:传统可插拔光模块在应对Scale Up极致带宽需求时,面临成本、功耗和面板空间挑战。CPO方案能更好地满足高带宽密度、低延迟需求,并能突破距离限制,理论上支持构建更大规模的集群。因此,在ScaleUp场景下,采用CPO的迫切性更强,可能是其更快实现渗透的领域。 过渡方案与产业链机会: CPC连接器:作为一种折中方案,CPC(共封装连接器)通过飞线连接ASIC和光模块,能部分解决PCB走线的功耗和信号完整性问题,实现难度低于CPO。在CPO大规模应用前,CPC方案可能在Scale Out场景更快放量,延长可插拔光模块的生命周期,并带动铜飞线需求。 投资主线:短期内,可插拔光模块及其配套的CPC连接器是明确的关注主线;长期需重点关注CPO在Scale Up场景下的规模化应用前景。 总结而言,报告描绘了一幅分阶段、分场景的光互联技术演进图景:短期内,成熟、灵活的可插拔方案仍是ScaleOut的基石,CPC作为优化方案有望先行;中长期,随着需求升级,CPO将在对带宽和密度要求更极致的Scale Up场景中找到突破口,并最终随着产业链成熟向更广领域渗透。AI驱动下,光通信整个市场在持续增长,不同技术方案将在不同阶段和场景中扮演重要角色。 我今天主要想分享一下元旦期间大家讨论度比较高的一篇SemiAnalysis关于CPO(共封装光学)产业链分析的文章。总体来看,整篇文章的核心观点是:CPO确实是未来长期非常确定的一个技术方向。但是相对来讲,短期之内它全面替代传统方案的逻辑和整体进展可能并不会特别快,尤其是在Scale Out(横向扩展)场景下,它的优势可能并没有之前大家想象中的那样具有压倒性。整个推进的节奏 和渗透率可能会比原来预期的偏慢一些。 报告里其实有非常明确的判断。我们可以看到,CPO交换机在TCO(总拥有成本)、功耗以及部署速度方面有一定的优势。但是这些优势可能不足以促使客户立即全面转向CPO的规模化部署。所以整体来看,CPO替代的节奏可能会比较有限。 但是,从未来长期趋势来看,它的发展方向还是非常明显的。特别是在Scale Up(纵向扩展)的光柜内互联场景下,它的想象空间非常大。所以我们整体分析的第一个方向,其实就是看Scale Out场景下,CPO推进进展的一些核心影响因素。 首先,我们可以看到CPO能够实现非常明确的省电效果。在整个AI集群里面,基本上有三套网络:包括后端网络、前端网络以及带外管理网络。这其中,后端网络的整体利用率、带宽技术要求是最高的,主要用于GPU之间和Scale Out之间的扩展通信,以实现训练和推理任务的并行。 由于后端网络对性能要求极高,所以它在整个集群的总网络成本和功耗中占据了 主导地位。在这种情况下,我们就会想要去尝试降低它的功耗。 比方说从示意图里能够看到,左边是最传统的可插拔光模块。它的电信号从ASIC芯片传导到光模块插口,中间可能会有十几厘米到三十厘米的PCB走线。这段距离的电功耗其实就会比较高。CPO方案的思路,就是尽可能缩短ASIC到光引擎(OE)之间的传输距离。缩短电信号传输距离之后,就有希望大幅降低这部分功耗的占比。所以这一点是它非常重要的一个优势。 以三层架构的英伟达GB300 NVL72集群为例,它整体后端网络的成本占比可能高达85%,功耗占比可能高达86%。所以这一块是降低功耗非常重要的一个环节。 听起来网络确实非常重要。但关键点还是在于网络功耗以及成本,在整个大集群里面的权重到底有多大?是否足以让我们立刻转向CPO?基于这个点,我们会去核心关注CPO到底是在Scale Up的网络,还是在Scale Out的网络里更有优势。 首先,在Scale Out网络方面,报告给了一个非常直观的数据。从产品节奏进展上看,像博通那边可能一直都有比较成熟的产品供应,但实际上我们看到它的商业化进展并没有特别顺利。像英伟达这边,预期最快的InfiniBand的CPO交换机可能在2025年会有一些小批量发货。但这个给到客户,也只是去做一些验证和测试。 像以太网标准的CPO交换机,预计会在今年下半年给到客户手里。它整体的规格目前我们看到主要是两款,一款是102.4T的,另一款是集成了多个102.4T、整体可能高达400T以上吞吐量的方案。所以这可能会是它的部署方案。但从整体产品节奏进展上来讲,实际规模放量可能并不会特别快。 这里核心还是要看在整个集群里,CPO的功耗优势占比并不一定会特别突出的原因。核心点在于,虽然我们直观地能看到光模块环节的功耗从可插拔切换到CPO之后下降非常明显——比方说在一个典型的NVL72 GB300集群里,传统带DSP的可插拔光模块切换到CPO,功耗可能下降84%左右。对应单个光模块的功耗,可能从原先的15-16瓦下降到4-5瓦。这一块的节能确实非常明显。 这些节能的核心来源,就是我刚刚提到的,把电信号的走线从几十厘米缩短到几 十毫米的距离。这样就能显著降低功耗、提高带宽密度,并且通过减少电互联距 离来缓解信号完整性带来的时序挑战。 同时,在传统的可插拔方案里,电信号需要沿着铜线或飞线传输一段距离才能到达光模块内的光引擎。这意味着传输也需要更长的SerDes来驱动,所以功耗相对较高。而且,Scale Out场景的痛点并不一定只是省电。 单纯从省电角度看,因为在整个集群里,网络环节的总功耗只占整个集群总功耗的9%左右。剩下的91%或者说绝 大部分功耗还是来自于服务器侧。这样的话,即使光模块功耗从可插拔切换到CPO时降低了80%多,但折算到整个网络的占比之后,最终它对于整个集群的总功耗优化可能也就是个位数,比方说4个百分点。这个优化虽然存在,但并不是压倒性的。 另外一个点,在成本这一块,相对来讲,虽然CPO在单个光引擎上的成本优势非常明显,会显著低于光模块。但是核心点在于,虽然在光模块这个环节大幅降 低了成本,但在另一方面很明显地,它还是需要增加交换机侧的成本。所以最终算下来,网络总成本虽然可能能降低40%多,但算到网络占整个集群总成本的占比之后,对于总集群成本的优化可能也就是在7个百分点左右。这样算下来,大家可能会感觉它的优势好像并不是特别明显。 而且另外一点,我们还要考虑到整个Scale Out集群。当客户真正去采用CPO方案时,我们还需要进一步考虑它的部署方案、互操作性,以及整个供应链大批量供货的稳定性、可靠性等各个维度。从这些维度考虑,CPO短期内其实并不占优。 所以这也就解释了为什么最近这几年我们看到CPO整个渗透进展一直都不是特别快。基于这一点,我们核心就是要考虑整个集群的可靠性、可维护性,以及CPO供应链的稳定性和最终配套生态系统的成熟性。从这三个维度上看,目前毫无疑问,传统的可插拔光模块占据绝对显著的优势。 首先,可插拔光模块的核心优势在于非常高的互操作性。光模块有OSFP、QSFP等非常标准的封装形式,内部也遵循行业标准。所以客户可以非常独立地去采购 交换机或者服务器,对于光模块这个环节的供应商,他可以根据自己的需要直接 去采购不同公司的产品。因为他们有一个非常标准的行业统一接口,相对之间不 同的模块去做切换使用,对于客户来说难度非常小,采购非常灵活。这样,对于 终端的云厂商而言,在这个环节采购时,他们的议价能力也会更强。 所以核心点在于,可插拔方案是把光模块从系统里拆出来,让它变成一个更加标 准化、更可议价的产品。这样,客户一方面肯定想保证供应链的多元化,另一方 面也肯定不愿意放弃这种议价权。所以从这个角度讲,它的优势还是非常明显的。 然后另外一个非常大的优势就是可维护性。因为光模块的安装其实非常简单,运维人员直接热插拔就可以了。但在CPO里面,光引擎的故障可能会导致整个交换机无法使用。即便可以维护,修复过程可能也会比较复杂,可能需要把整个交换机拆出来。在实际使用过程中,CPO可能也会采取外置可插拔光源模块(如ELS)来适当提高可维护性。但是对于内部的光引擎等环节,一旦有故障,维护起来就没那么容易了。包括在实际过程中,比方说CPO的线缆接口如果进入灰尘导致光路不通畅,这一块的维护也会造成一定影响。所以可维护性也是一个非 常重要的点。 除此以外,最后一个点在于整个生态系统的产业化。目前,整个CPO产业链的特点还是成本相对较高,封装和制造工艺比较复杂。所以在良率、散热、稳定性上可能缺乏一定的成熟度,行业标准也需要进一步完善。从这个方面讲,CPO我们确实能看到它实际的优势非常明显,但在实际应用过程中,相对来讲,它在大 规模替代光模块之前还是有比较长的一段路需要走。这是比较明确的一个点。 所以包括我们前面提到的,在经济性上,虽然直观来看从光模块切换到CPO优势非常明显,单个光引擎的价值很低——比方说对应算出来一台144个800G端口的交换机,对应传统的插72个1.6T光模块,总成本可能7万多美金;而CPO的光引擎加上它的外置光源模块,成本可能对应在3到4万美金左右。看起来在这个环节能节省很多,但是因为它毕竟还是一个交换机环节。 交换机环节的话,交换机厂商一定会保留一部分相当高的毛利率。比方说按照差不多50-60%的毛利率来算,那对应到最终客户购买交换机的成本可能就会高达8到9万美金。这样算下来,其实它的综合成本优化并不会特别明显,甚至可能在这个环节还会稍微高一些。这也是为什么我们看到CPO在实际产业化推进上并不会特别快的一个原因。