核心观点:一场不可避免的技术迁徙 AI算力瓶颈 AI工作负载对网络带宽、功耗和密度的需求已接近传统可插拔光模块的物理极限。数据传输效率已成为制约AI系统整体性能的关键瓶颈。 CPO是破局关键 共封装光学(CPO)通过将光学引擎与计算/交换芯片封装在一起,将数据传输能耗降低超过50%,并大幅提升带宽密度,是解决"I/O墙"问题的终极方案。 应用场景分化 横向扩展(Scale-out)网络是CPO的"练兵场",提供温和的总拥有成本(TCO)优势;而纵向扩展(Scale-up)网络是其真正的“杀手级应用”,是解决未来GPU间互连挑战的核心。 生态系统正在成熟 以Nvidia和台积电为首的行业领导者正积极推动CPO供应链成熟,从技术演示迈向规模化量产。 投资机遇涌现 这场技术变革正在重塑网络设备、半生滴芯制造和光器件等多个领域的价值链,为敏锐的投资者带来结构性机遇。 AI集群的成本与功耗困境 成本与功耗占比 网络成本高昂:在典型的GB300NVL72集群中,网络成本占总成本的15%-18%,是仅次于服务器的第二大支出。 ,光模块是关键:在3层网络配置中,光收发器占网络成本的60%,占网络功耗的45%。 一个规模为20万GB300的集群,仅光模块功耗就高达17兆瓦。降低这部分能耗是数据中心运营商的核心诉求。 “I/O墙”:正在拉开的算力与互连剪刀差 结论:数据传输效率已成为制约AI系统整体性能的关键瓶颈 CPO核心优势 消除DSP:无需数字信号处理器(DSP)来恢复长距离电信号,显著降低功耗和成本。 降低SerDes功耗:可使用功耗更低的短距离(SR)SerDeS。 能效提升:数据传输能耗可降低50%-80%。 光互连技术的演进阶梯:从DSP到CPO 关键信息:行业正在努力“绕过”功耗和成本高昂的DSP芯片,CPO是这一趋势的终极解决方案。 商业案例(1)|横向扩展(Scale-out)网络的TcO分析 优势存在,但尚不具备颠覆性 结论:对于横向扩展网络,CPO带来的总成本节省有限。考虑到现场维护困难、可靠性担忧以及供应商议价能力丧失等 问题,短期内大规模采用的动力不足。 商业案例(2)|纵向扩展(Scale-up)网络的“杀手级应用” 当前瓶颈-铜缆的极限 巨大的带宽需求差距 距离限制:当前基于铜缆的NVLink方案,带宽虽高达7.2Tbit/s/GPU,但传输距离仅限2米内,严重制约了“世界规模”(World Size)。 带宽扩展困难:依赖开发更快的SerDes在铜缆上实现带宽翻倍,技术挑战巨大且进展缓慢。 CPO的核心价值 打破距离限制:CPO用光纤取代铜缆,可将Scale-up域扩展至多个机架,极大提升“世界规模”。 更大的市场(TAM):随着Scale-up域的规模和速度增长,其互连市场的TAM已远超Scale-out网络。CPO的主战场在此。 生态核心:台积电COUPE平台正成为行业首选 COUPE平台详解 3D Optical Engine (OE) for Next-Gen Communication 一体化解决方案:COUPE提供从EIC (N7工艺)、PIC (N65工艺)制造到SolC3D混合键合的全套方案。性能优势:SolC无凸点键合技术相比传统的微凸点(μbump)方案,可在同等功耗下提供超过23倍的带宽密度。生态锁定:Nvidia、Broadcom、Ayar Labs等主要玩家纷纷转向COUPE平台,显示台积电在该领域的领导地位和技术优势。 :Optics is crucial for rapidand reliabledata transmissionand loweringnetwork power consumption for AlEIC-on-PIC stacked usingtheSolC-Xprocess(COUPETM)offers unparralleled interconnect densitywhilemaintaining optimal system powerWewill enableCOUPEinpluggablein'25,followedbyCOUPEonsubstrateinaCoWISCPOwitha2xreductionin power and a 10"x reduction in latency in'26COUPE on CoWoS interposer for another5x reduction in power and 2x reduction in latency is being explored Pluggable (OSFP) CPO with XPU12.8TbpsOEonInterposer CPO with Switch 6.4TbpsOEonSubstrate in2026 1.6TbpsOEonSubstratein2025 关键信息:台积电通过COUPE,正从半导体代工巨头,转变为CPO生态系统的核心赋能者和价值整合者。 Nvidia的选择:Nvidia押注技术难度最高但尺寸和功耗优势最明显的MRM,并已成功实现200G/lane量产,打破了行业对MRM速率限制的传统认知。 技术与战略匹配:厂商对调制器的选择反映了其产品定位和技术护城河的构建策略。MRM的小尺寸和高集成度使其成为追求极致带宽密度的理想选择。 未来之路:CPO带宽扩展的三大核心路径 2.提升单通道速率(Speedperlane) 1.增加光纤数量(Morefiberpairs) 3.采用波分复用(WDM) 方向:更高的波特率(Baud Rate)+更高阶的调制方式(从PAM4到PAM6/8)。 方向:更小的光纤间距(从127μm到80μum),多芯光纤(Multicorefibers)。 方向:单根光纤承载更多波长(入),从8入到16入,未来可能达到64入。 挑战:对调制器性能和EIC电路设计要求更高。 挑桃战:光纤阵列单元(FAU)的制造精度和对准难度。 挑战:需要稳定、高效、可覆盖多个波长的激光源。 结论:CPO提供了丰富的技术工具箱,确保未来十年内互连带宽能够持续、多维度地增长,为AI发展提供动力。 市场定义者:Nvidia的CPO产品与战略 战略解读 产品布局:率先推出用于Scale-out的Quantum(InfiniBand)和Spectrum(以太网)CPO交换机。 ·技术核心: 一采用自研的1.6T/3.2T光学引擎。坚定押注MRM调制器技术和台积电COUPE平台。通过“盒内高基数”(highradixinabox)设计,简化客户网络部署。 战略意图:以Scale-out产品为先导,旨在培育供应链、积累部署经验、教育市场,为未来在更具战略价值的Scale-up领域全面应用CPO铺平道路。 战略解读 ,市场经验:拥有最早量产的CPO交换机(Humboldt,Bailly),积累了宝贵的实践经验。 技术演进:从早期的SiGe EIC+TSV封装演进到7nm CMOS EIC + FOWLP封装。 战略转向:未来产品(Davisson之后)将转向台积电COUPE平台,这意味着其技术路线面临重大调整,需要放弃部分原有技术积累。 核心业务:除了交换机,为大客户(如OpenAI)提供集成CPO的AlASIC设计服务是其关键增长点。 创新生态:聚焦CPO的“专精特新”力量 CPO走向主流仍需克服的挑战 可靠性与可服务性(Reliability&Serviceability) CPO的集成特性使得现场维修比可插拔模块复杂得多。虽然早期数据显示CPO可能更可靠,但仍需更大规模的部署数据来消陈客户巍虐。 Annual400GLink Failure Rate 数据支撑: 引用Meta与Broadcom合作研究的数据:“cPO的MTBF(平均无故障时间)达到260万小时,而传统400G2xFR4可插拨光模块仅为55万小时。 标准化与互操作性(Standardization&Interoperability) CPO目前处于“蛮荒西部阶段,各家方案自成体系,缺乏统一标准(如OIF CPX正在努力解决),阻碍了开放生态的形成和成本的降低。 供应链成熟度(Supply Chain Maturity) 激光源、FAU封装、测试等环节仍需进一步提升产能,良率和降低成本,以支持未来千万级别的出货量。 结论:把握光互连时代的结构性机遇 1必然趋势:AI的发展使得CPO从“可选项”变为“必需品”,以解决算力与互连之间的“剪刀差”。2.主战场在Scale-up:这是cPO最具颠覆性、市场空间最大的应用领域,是解决铜缆物理极限的唯一途径。3.生态成型:以Nvidia和台积电为首的行业巨头正引领技术和供应链走向成熟,商业化拐点临近。关注价值链:投资机会不仅在于Nvidia等终端系统厂商,更在于上游的关技术和组件供应商,包括,·半导体制造:掌握先进封装技术(如台积电COUPE)的代工厂。光学引擎设计:拥有核心调制器IP和系统架构能力的初创公司(AvarLabs,CelestialA/等)。关键元器件:高性能多波长激光源、特种光纤、精密封装和测试设备等。