您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:液冷调研- Rubin-Rubin Ultra散热方案及供应链分析, 单机柜价值量测算, HVDC进展, 国内散热和电源厂商竞争格局 – 聚焦英维克-思泉-麦格20250919 - 发现报告

液冷调研- Rubin-Rubin Ultra散热方案及供应链分析, 单机柜价值量测算, HVDC进展, 国内散热和电源厂商竞争格局 – 聚焦英维克-思泉-麦格20250919

2025-09-19未知机构x***
AI智能总结
查看更多
液冷调研- Rubin-Rubin Ultra散热方案及供应链分析, 单机柜价值量测算, HVDC进展, 国内散热和电源厂商竞争格局 – 聚焦英维克-思泉-麦格20250919

EN VIP液冷调研: Rubin/Rubin Ultra散热⽅案及供应链分析,单机柜价值量测算, HVDC进展,国内散热和电源⼚商竞争格局-聚焦英维克/思泉/⻨格⽶特/中恒/欧陆通 制造业 原创 已关注 共享调研纪要2025/09/15 16:21:38 联合发布⼈:Patrick 要点 1. Rubin和Rubin Ultra散热⽅案预测和相关组件价值量测算;2. GB300单机柜液冷价值量测算;3. 浸没式散热所需氟化液体积和供应链分析;4. 国内散热和电源⼚商在NV和ASIC链进展和竞争格局展望。 本⽂共11510字,预计阅读时间24分钟 已享VIP免费 以下是专家观点: 浸没式技术预计会在哪⼀代英伟达机柜中应⽤?其渗透率如何? 浸没式技术最快可能在Rubin之后的⼀代产品中应⽤,即2027年下半年。从⽬前的验证情况来看,Rubin系列(包括Rubin144和Rubin72)主要采⽤纯冷板或相变冷板的散热⽅案。⽽在下⼀代Rubin Ultra中,正在验证多种技术路径,包括浸没式、冷板加浸没以及冷板相变三种⽅案。根据现阶段测试结果,采⽤浸没式散热的可能性较⾼,其中可能是纯浸没形式,也可能是冷板加浸没形式。对于具体渗透率,如果最终确定为浸没式⽅案,则渗透率将达到100%,因为不会提供多种路径供选择。 浸没式散热技术的必要性体现在哪些⽅⾯? 浸没式散热技术的必要性主要由芯⽚发热密度决定。当芯⽚单平⽅毫⽶发热密度超过30瓦时,需要采⽤冷板液冷;当超过120瓦时,则需要考虑浸没式散热。这是由于本体换热需求所决定的。与冷板液冷相⽐,浸没液冷通过直接接触实现更⾼效的换热,⽽⾮通过⾦属表⾯间接传导。以机柜为例,传统⻛冷可⽀持单机柜功率密度约250~300千瓦,⽽当功率密度超过这⼀范围(如500千瓦以上),则必须依赖更⾼效的直接换热形式,如浸没液冷。此外,RubinUltra系列(如288和576⽅案)的单柜容量⾄少达到500千瓦,因此采⽤浸没式散热⽅案的⼏率⾮常⼤。 冷板相变与浸没式(即全浸没或部分浸没)两种⽅案在未来应⽤中的可能性如何? Rubin系列当前倾向于采⽤冷板相变⽅案,⽽在Rubin Ultra系列中,更有可能选择浸没式相关⽅案,即全浸没或部分浸没形式。从专业⻆度判断,全浸没式(即纯浸没)和部分浸没式(即冷板加浸没)的应⽤⽐例将取决于具体需求,但总体趋势显示后者更具优势。 冷板加浸没与纯浸没式相⽐,其成本及性能差异体现在哪些⽅⾯? 冷板加浸没是⼀种成本较⾼但可靠性更强的解决⽅案。其成本增加主要源于GPU上增加了液冷板,从⽽构成第⼆个回路,同时需要额外管路⽀持。这使得该⽅案⽐纯浸没式贵。然⽽,其优势在于能够通过液冷板先换掉约50%~60%的GPU核⼼发热量,再通过壳体内泡⼊氟化液完成剩余40%~50%的PCB整体换热。在流速较低情况下,该设计降低了管道内壁压⼒及连接接⼝泄漏⻛险,从⽽显著提⾼系统可靠性。因此,在实际应⽤中,更倾向于选择这种混合型设计以平衡性能与可靠性需求。 在液冷⽅案中,CDU和Manifold的需求情况如何?尤其是在采⽤浸没式冷却⽅案时,这些组件的功能和价值量是否会发⽣变化? CDU在液冷⽅案中是必需的,⽽Manifold的需求则取决于具体采⽤的冷却形式。在当前已知的浸没式冷却⽅案中,例如CoolIT与英伟达合作验证的⼀种竖直摆放机柜形式,其设计并⾮传统的⼤型⽔平柜样式,⽽是分隔成多个隔层进⾏浸没操作。在这种情况下,理论上仍需要Manifold,但其结构和功能会有显著变化。例如,传统⽤于服务器托盘内部横向布置的⼩型Inner Manifold可能不再需要,但竖直摆放机柜中的主Manifold仍然必不可少。此外,在浸没式冷却中,⽔槽(Tank)将成为液冷设备的⼀部分,其制造要求也将提升。⽔槽不再是简单由⼴达或鸿海通过折弯⼯艺⽣产的铁板部件,⽽是需要完全密闭并与液冷设备匹配使⽤。这类⽔槽预计将由液冷设备供应商(如Vertiv或CoolIT)提供,⽽⾮传统服务器制造商负责。 在从GB300到Rubin,再到RubinUltra的发展过程中,液冷相关组件及供应链有哪些变化?哪些供应商可能被替代或新增? 从GB300到Rubin及RubinUltra的发展过程中,主要变化体现在以下⼏个⽅⾯:1.新增供应商:随着浸没式⽅案引⼊,氟化液(Immersion Cooling Liquid)供应商成为新的关键⻆⾊。2.减少组件需求:部分现有组件,如快速插头和Inner Manifold等,在纯浸没形式下⽤量显著减少。例如,在GB300中,每个托盘内横向布置的⼩型InnerManifold在未来可能被完全淘汰。3.剔除部分供应链:如果采⽤纯浸没形式,则传统⽤于单向冷板液冷的组件(如冷板)及其相关供应商可能被剔除。4.价值量转移:未来⽅案中的价值量确认更多集中在密闭⽔槽和氟化液上。密闭⽔槽将由液冷设备⼚商提供,并作为整体设备的⼀部分出现在系统设计中。 GB300机柜内外各主要部件的构成、价值量及其与GB200相⽐的差异是什么?GB300机柜在功率⽅⾯从GB200的132千瓦提升⾄142千瓦,但整体构成基本 延续了B200设计,仅在局部进⾏了优化。以下为具体分析: 1.布局与功率:• GB300延续了B200的布局,包括18个计算托盘(Computer Tray)和9个交换机托盘(Switch Tray)。•每块CPU和GPU均配备独⽴的⼩型冷板,与B200相⽐更为精细化。2.主要部件价值量:•冷板:CPU单体价值约210美元,共36块;GPU单体价值约270美元,共72块,总计108块。按平均250美元计算,总价值为27,000美元。此外,每个交换机托盘使⽤⼀块较⼤的冷板,共9块,每块450美元,总计4,050美元。•快速插头:每块液冷板对应两对快速插头,共216对;18个计算托盘额外增加36对;9个交换机托盘增加18对,总计270对,采⽤NVQD03⽅案,每对55美元,总计14,850美元。• Manifold:主Manifold两根,每根5,500~6,000美元,总计11,000~12,000美元;Inner Manifold(每个compute tray两根)共36根,每根380美元,总计13,680美元。•⿊⾊橡胶软管:总成本约1,800美元。3.总体成本估算:•仅考虑上述核⼼部件,GB300单柜内相关成本约12万美元,其中包括CDU成本分摊后的5万美元(CDU出货价格⼤概是40万美⾦,对应8个柜⼦)。4.与B200差异点:•冷板数量增加且更⼩型化,以适应更⾼散热需求。•快速插头数量从B200的⼤幅增加⾄270对,同时耐压值提⾼,并符合英伟达NVQD03企业标准。•机柜体积缩⼩⾄原来的2/3,但整体压⼒要求更⾼。 展望Rubin的价值量⼤概如何? Rubin NVL72和NVL144更⼤概率采⽤相变液冷的形式。以NVL72为例,所需的manifold和快插头应该是完全⼀样的。对应的液冷板,会出现很⼤的变化。 如果是相变的话,液冷板其实除了最下⾯密密麻麻排布的微通道,除了这个设计之外,还要分层,上⾯要有⼀个蒸发层,对应的变成⽓态之后,要回落到最上层去。从最上层换热再流⾛。液冷板对应的单体价值量就不再是平均的250美⾦了,预计⾄少应该提升到300~320美⾦。因为液冷板设计起来⽐较难。从CDU的维度,CDU在完成换热后,需要将⽓态介质重新转化为液态,这要求增加⼀个类似于冷却储罐(tank)的组件。尽管这⼀改动技术难度不⾼,但会导致CDU分摊单柜价值量从当前约5万美元提升⾄5.2~5.5万美元。此外,由于⽓态介质体积远⼤于液态,其压⼒显著提⾼,这可能促使manifold和快速插头等组件在设计上发⽣变化,但数量上不会有明显增减。 采⽤相变冷却技术后,Rubin 72卡机柜整体价值量预计会有多⼤幅度提升? 单纯从液冷板来看,每块价格提升约70美元,总计108块,对应总增幅约7,000美元;CDU部分则预计增加7,000~8,000美元。因此,预计整体机柜价值量将从当前约12万美元增⻓⾄⾄少13.5万美元。 相变冷板中使⽤何种⼯作介质,其选择依据是什么? 相变冷板中不可能使⽤⽔或以⽔为基础的介质,因为其沸点通常为100℃,⽽CPU运⾏温度通常仅为70~90℃,⽆法实现有效⽓液转换。因此,需要选择沸点较低的氟化液作为⼯作介质。⽬前市场上主要应⽤的是134A或电⼦氟化液两种⽅案。 ⼀个72卡Rubin机柜需要多少氟化液?其成本如何计算? ⼀个72卡Rubin机柜⼤约需要80升氟化液。如果采⽤环保要求较⾼、价格为80美元/升的聚醚类氟化液,则每个机柜对应成本约为6,400美元。然⽽,如果选择环保指标稍低但价格更低廉(20~30美元/升)的产品,例如巨化⽣产的⼀些型号,则总成本将显著降低。 数据中⼼的环保标准是否会因地理位置⽽异?例如,在北美、欧洲和东南亚建 造数据中⼼时,环保要求对材料选择是否有不同的限制? 数据中⼼的环保标准确实因地理位置⽽异。例如,北美和欧洲通常对材料的环保要求较为严格,⽽东南亚地区相对宽松。在北美,某些电⼦氟化液可能受到限制,但这取决于其具体化学成分。电⼦氟化液主要分为聚醚类、HFE系列和烃类三种,其中聚醚类⽬前不受严格的环保限制,⽽烃类产品则存在⼀定的环保⻛险。尽管这些材料都被统称为电⼦氟化液,但在化学性质上完全不同,因此在不同地区使⽤时需根据当地法规进⾏选择。 134A这种材料是什么?它是否适合⽤于液冷⽅案? 134A是⼀种纯氟利昂,⼴泛应⽤于家⽤空调和⻛冷空调系统中。然⽽,由于其⾼沸点和较⾼的环境影响,⽬前在北美和欧洲已逐步被410A等更低氟含量的新型制冷剂所取代。在液冷⽅案中,虽然134A因其低沸点具有⼀定优势,但由于⽆法满⾜北美等地严格的环保要求,其实际应⽤受到很⼤限制。 为何不再采⽤⼄⼆醇丙⼆醇作为介质? 这是因为⼄⼆醇丙⼆醇属于⽔基介质,其沸点较⾼,在吸收GPU热量后难以迅速转变为⽓态,从⽽影响换热效率。⽽电⼦氟化液具有更低的沸点,可以更有效地完成热量传递。此外,随着浸没式散热技术的发展,对换热效率提出了更⾼要求,这也进⼀步推动了电⼦氟化液在该领域中的应⽤。 Rubin Ultra这⼀整套液冷⽅案是如何设计并实现散热需求的? Vertiv⽬前在做的是“冷板+浸没”的双回路设计⽅案。⾸先,将裸露PCB板及相关组件封装成密闭壳体(tank),并竖直排列安装。第⼀回路通过贴合GPU发热点上的液冷板换⾛约60%的热量;第⼆回路则利⽤充满壳体内的电⼦氟化液吸收剩余40%的热量,从⽽实现整体散热需求。这⼀设计满⾜了单柜600千瓦功率散热需求,并且通过双回路结构优化了散热效率。具体配置⽅⾯,每个柜体包含27层托盘,每个托盘密闭处理后灌注30升电⼦氟化液,总计810升。此 外 ,每 块GPU配 备700美 元的⼤ 型冷 板 ,共 计72块, ⽤ 以 ⽀ 持288张 RubinGPU卡。每个托盘成本约7,000美元,总体来看,该⽅案成本较⾼,但能够满⾜⾼性能计算设备对散热能⼒⽇益增⻓的需求。 在当前浸没式散热⽅案中,电⼦氟化液⽤量为何如此巨⼤?这对相关产业链有哪些影响? 浸没式散热需要将整个PCB板及所有发热点完全浸泡在电⼦氟化液中,因此⽤量极⼤。例如,在Rubin Ultra⽅案中,每个托盘灌注30升,总计810升。这种巨⼤的⽤量直接推动了市场对电⼦氟化液需求的⼤幅增⻓。据观察,⽬前国内许多专注于⽣产此类材料的⼚商正在积极布局,以期抓住这⼀市场机遇。从产业链⻆度看,这种趋势将显著提升相关原料供应商及加⼯企业的发展潜⼒,同时也可能带动新型制冷剂技术创新与成本优化。 单卡所需电⼦氟化液量增加了多少倍?浸没式与冷板式在氟化液使⽤上的差异是什么? 单卡所需电⼦氟化液量增加了2.5倍。浸没式冷却需要将所有PCB完全浸泡,因此其氟化液使⽤量较⾼,且基本为废弃性使⽤。⽽冷板式则在800-810升基础上额外需要⼀定量(