AI智能总结
本次电话会议由开源证券通信⾸席分析师蒋颖主讲,重点分析了⾕歌TPU芯⽚及机柜架构的演进趋 势,特别是TPU V7与V8在光模块、液冷和⽹络架构⽅⾯的关键变化。会议指出,⾕歌可能在下⼀代TPU中提升1.6T光模块和液冷配置⽐例,并引⼊switch tree架构以⽀持更⼤规模算⼒集群。这些变化将显著提升对⾼速光模块(如1.6T)、有源光缆(AOC)以及⾼效液冷解决⽅案的需求。同时,供应链准⼊⻔槛⾼,具备全栈数据中⼼解决⽅案能⼒的⼚商更具竞争优势。 ⾕歌TPU架构演进趋势 TPU V7与V8的技术升级• 推测未来TPU出货将以V7和V8为主,普遍配备1.6T光模块和液冷散热⽅案。○V7单Pod可⽀持9,216颗TPU芯⽚,采⽤144个机柜,每个机柜通过96个光端⼝连接OCS交换机。○V8有望进⼀步扩展⾄单Pod⽀持1万⾄2万颗TPU芯⽚,推动整体算⼒和功耗⼤幅提升。○ 3D Torus互联架构解析• 该架构为⽴⽅体环⾯互联结构,基本单元为4×4×4共64颗TPU组成的Cube,对应⼀个物理机柜。○机柜内部通过PCB或铜缆实现TPU连接,机柜之间则依赖OCS交换机进⾏互联形成Pod。○每个机柜需96个光端⼝连接外部OCS,例如V4使⽤64机柜时共需6,144个光端⼝,配⽐约为每颗TPU对应1.5个光模块。○ 新⼀代机柜架构潜在变化 Cross架构与Switch Tree引⼊• 推测V8可能取消传统拓扑结构,转⽽采⽤“switch tree + OCS”的胖树多层⽹络架构。○Switch tree⽤于机柜内或局部流量收敛,降低OCS端⼝压⼒,从⽽降低成本并提升集群可扩展性。○OCS仍承担全局互联核⼼功能,不会被取代,但端⼝需求可能减少,有利于构建更⼤规模集群。○ 对光模块与组⽹的影响• 若引⼊switch tree,TPU与光模块的配⽐可能⾼于当前1:1.5⽔平,具体取决于基础Cube规模。○机柜内部连接可能由DAC(直连铜缆)转向AOC(有源光缆),新增⼤量短距光通信需求。○ 光路⼊柜将带动AOC和1.6T光模块⽤量上升,利好相关供应商。○ 液冷技术发展趋势与产业影响 整机柜功耗上升驱动液冷需求 随着TPU数量增加和算⼒密度提升,单机柜乃⾄整个CDU功耗持续攀升,已达两兆⽡以上。○功耗增⻓促使液冷成为必需配置,泵的数量和冷却系统复杂度同步提⾼。○ 液冷作为数据中⼼整体解决⽅案 ⾕歌液冷⽅案涵盖服务器、机柜、机房内外协同设计,强调系统级集成能⼒。○CDU位置从机柜移回机房是重要趋势,或将引领⾏业⽅向。○供应商需具备深度的数据中⼼热管理综合能⼒,进⼊⻔槛⾼,⼀旦认证成功份额趋于稳定。○ 投资机会与核⼼标的 光模块与光器件产业链• 直接受益于1.6T升级和AOC渗透率提升,重点标的包括中际旭创、源杰科技、⻓⻜光纤、⻓兴博创、世嘉科技等。○ 液冷及配套设备供应商• 英维克等具备全栈液冷解决⽅案能⼒的企业将优先受益。○其他相关标的还包括腾景科技(OCS)、欧陆通(电源)等,覆盖AI数据中⼼关键环节。○