2025年08月20日19:38 关键词 英伟达超低延迟交换芯片博通GPU CPU PCIE以太网华为UB NV sweet亚马逊repared现金流PCIEFH鲲鹏GPASL OA服务SUE 全文摘要 当前数据中心与人工智能领域正迅速发展,关键互联芯片技术如以太网与USB交换芯片扮演着重要角色,同时,定制化芯片以满足特定需求,如对标英伟达NVLink的方案。博通公司推出的高性能交换芯片TFE与TH5,优化了延迟,适应AI与高性能计算的需求。华为等企业通过定制化芯片及对以太网标准的贡献,响应AI市场对低延迟与高性能互联的迫切需求。 重视AI Scale up大趋势下交换芯片新机遇-20250818_导读 2025年08月20日19:38 关键词 英伟达超低延迟交换芯片博通GPU CPU PCIE以太网华为UB NV sweet亚马逊repared现金流PCIEFH鲲鹏GPASL OA服务SUE 全文摘要 当前数据中心与人工智能领域正迅速发展,关键互联芯片技术如以太网与USB交换芯片扮演着重要角色,同时,定制化芯片以满足特定需求,如对标英伟达NVLink的方案。博通公司推出的高性能交换芯片TFE与TH5,优化了延迟,适应AI与高性能计算的需求。华为等企业通过定制化芯片及对以太网标准的贡献,响应AI市场对低延迟与高性能互联的迫切需求。超节点概念强调通过高性能互联技术连接计算节点,以提升数据中心效率。华为的Metrise与海光信息技术公司在中国AI芯片及互联技术上的进展,展示了推动本土数据中心技术发展的实力。展望未来,高性能互联技术需求将持续增长,国产芯片及技术标准的采纳与推广展现出中国企业在追赶国际技术标准方面的信心与潜力。 章节速览 00:00超低延迟网络技术与芯片市场分析 对话深入探讨了超低延迟网络技术,特别是针对NV sweet标准的实现,提到了博通的TFE(现称欧权)芯片及其在超节点设计中的应用。分析了不同技术路线,包括英伟达的NA思维曲、华为的UB sweet互联芯片,以及基于以太网的互联方式,强调了开放性市场与私有方法的对比。指出以太网互联的开放性市场可能具有更强的生命力,而英伟达产品出货量最大,市场引领地位显著。 04:48 PCIE交换技术在AI服务器中的应用与挑战 讨论了PCIE交换技术在AI服务器中连接CPU与GPU的重要性,以及其在最新标准PCIE6.0下的局限性,如无法实现GPU间直接通信,仅能支持CPU至GPU或外设卡的通信。此外,提到了华为在该领域的新进展,如通过特定芯片实现CPU与GPU间的非PCIE通信,拓宽了技术应用范围。 09:43博通SUE标准与GPU互联技术解析 对话讨论了博通的SUE标准,旨在实现GPU间的高效通信,通过定义一种新协议,解决GPU与GPU之间的数据传输问题。SUE标准需识别GPU的AXI接口,处理CPU体系结构的数据格式,并采用内存语义和消息语义两种技术路线进行数据传输。此外,还介绍了SUE在实现以太网连接GPU时,如何在报文中封装AXI报文,完成不同体系架构间的通信工作。 15:41 SUE以太网技术及其在AI芯片互联中的应用 对话讨论了SUE(Super Ultra Ethernet)以太网技术在AI芯片互联中的应用,强调其通过采用UEC(Ultra EthernetConsortium)定义的新功能,实现超低延迟传输。SUE技术通过压缩数据包、优化物理层编码、链路层重传机制及借鉴英伟达的信用流控技术,显著降低传输延迟。与私有化协议不同,SUE基于开放标准,便于生态链的统一和标准化,促进AI芯片间的高效互联。 对话围绕以太网作为开放技术的重要性展开,强调了以太网芯片在互联中的通用性,以及不同厂商芯片的兼容替换可能性。同时,讨论了GPU与CPU间互联的私有与开放标准,指出PCIE等开放标准对构建广泛生态链的关键作用。 27:09博通SUE网络与华为集群互联技术对比 讨论了博通SUE网络和华为在GPU、CPU及集群间互联的技术差异。博通SUE采用统一以太网标准,实现高效率低延迟的通信,而华为使用UB协议与以太网结合,存在协议转换复杂度高及效率影响的问题。 31:13以太网与UP技术在低延迟通信中的对比 讨论了华为及其他品牌在适配以太网生态方面的策略,对比了以太网与UP技术在低延迟通信上的性能。以太网技术,尤其是博通的51.2T芯片,虽在延迟上有所提升,但与UP技术相比仍有差距。UP技术在低延迟方面表现更优,对标英伟达的NS sash芯片,实际延迟控制在200-250纳秒,展现出更高的通信效率。 34:50 AI网络中GPU与SASH市场空间测算 对话讨论了AI网络中GPU与SASH的市场空间测算方法,重点分析了北美与中国市场的差异。北美市场主要由英伟达主导,而中国市场则百花齐放,多家公司如韩语机、昆明星等推出400G芯片,设计标准为八个端口,支持一级八卡连接。此外,还提到了第二梯队如税员穗源,采用200G端口设计。 41:33超节点方案与51.2T芯片应用分析 讨论了国内超节点方案,强调在机柜中优先使用大容量交换芯片如51.2T,以提高效率并减少能耗。对比了51.2T与25.6T芯片的性能和能耗,指出使用51.2T芯片可显著减少所需芯片数量,从而优化配置。 44:45国内公司能力与STL Up环节进展分析 对话讨论了国内公司如华为、中心、新华三等在交换芯片领域的技术进展,指出华为已大批量出货12.8T、25.6T芯片,51.2T芯片少量出货。强调国产芯片虽延迟略差,但可用作样机验证。预测国产芯片达到M Talk Auto级别尚需时日。 50:10超低延迟芯片与定制带宽交换技术讨论 讨论了超低延迟芯片开发需基于现有大规模出货产品,强调继承与优化的重要性。提及华为定制带宽交换芯片特性,如48个2两4G端口,总带宽约10.75T,与常规以太网不同。同时询问了海光sarch项目的进展,展现了对技术细节和项目状态的关注。 52:28海光芯片技术发展与价格探讨 讨论了海光在芯片技术上的发展策略,包括尝试自主开发类似UB的方案以应对AMD UA link推出缓慢的问题,以及对互联芯片的关注。同时,提到了海光在技术选择上的灵活性和对价格的考量,但尚未见其自主方案的成果公布。 54:11芯片价格与技术进展讨论 对话围绕芯片价格及其技术版本展开,提及博通芯片价格从8000降至6000左右,强调其高成本与技术领先性。讨论了PPIE环节的swet’s芯片价格,指出6.0版本约400张,而5.0版本价格较低。最后,对话确认了6.0版本的新兴趋势,并表达了对会议参与者的感谢,宣布会议结束。 发言总结 发言人2 深入探讨了芯片技术在数据中心和高性能计算环境中的应用与特点,特别强调了GPU与CPU之间的高效通讯机制、PCIe与PCIEH的区别,以及通过优化硬件架构减少系统延迟的重要性。提及了博通的TH6 102T芯片,旨在提升系统性能与效率。他还分析了华为、华三、锐捷等厂商在交换芯片市场的竞争格局,并展望了未来可能的技术创新趋势。此外,他也指出芯片成本在整体解决方案中占据关键地位,暗示了成本效益在技术选型中的重要考量。 发言人1 讨论了网络交换芯片在AI领域的应用,着重介绍了博通、华为、英伟达等厂商的产品和技术,特别是博通的51.2G800G交换芯片和华为在超低延迟方面的自研芯片尝试。此外,他强调了开放性网络标准,如以太网,在AI芯片互联技术路途中的重要性,指出私有化解决方案的局限性。发言人还提到了海光公司的技术动向,并对比了国内外 芯片在价格、性能上的差异。最后,他讨论了国产芯片追赶国际先进水平的进展与面临的挑战。 问答回顾 发言人1问:博通推出的欧权芯片是做什么用的? 未知发言人答:博通推出的欧权芯片(原名为TFE)是一款51.2G的800G交换芯片,其设计专注于实现超低延迟,达到200多纳秒级别,特别适用于对延迟要求极高的场景,如对标NV的解决方案,并非通用的GL out交换机用途。 问:目前有哪些主要的技术路线用于构建数据中心网络互联? 未知发言人答:目前主流的技术路线包括四种:一是基于英伟达NA思维曲的产品;二是采用类似OVwh的互联芯片技术,如华为的UB;三是以太网互联技术,其中又细分为低延迟和普通非低延迟两种;四是使用SD互联技术和自研的UB sweet方法,这些方法通常为各厂商私有,不具备通用性。 未知发言人问:PCIE reaped在英伟达GPU和CPU之间起到什么作用? 未知发言人答:PCIE reaped是一种针对GPU与CPU间通讯的PCI Express switch芯片,它主要用于协同工作模式下,使得CPU能够指挥GPU,并且支持与PCIE外设进行通讯。此外,今年推出的PCIE sash产品则是专门为GPU和CPU之间的通讯需求而设计的,采用了PCIE 6.0标准,目前主要用于连接CPU到GPU或GPU到外设卡,但暂时还不能满足GPU与GPU之间的高速传输需求。 发言人1问:SUE标准及其产品的作用是什么? 未知发言人答:SUE是博通制定的一个标准,旨在解决GPU与GPU之间的互联问题。其落地产品是TH6 102T和TSE芯片,主要负责图形卡之间的互联工作,确保数据在不同GPU间高效传输。具体而言,这涉及到与GPU对接时的接口协议(如AXI接口规范)以及数据在GPU间传输时的通信协议设计。 发言人1问:SUE在与GPU通信时要执行的首要任务是什么? 发言人2答:SUE首先要对接GPU,识别并处理GPU通过AXI接口发送的数据格式,这些数据实际上是CPU体系结构。 发言人2问:SUE在内部如何处理不同技术路线的数据传送方式?SUE如何将GPU或CPU的数据(AXI接口)封装并传递给以太网? 发言人1答:SUE需要处理两种不同的数据传送方式,一种是内存语义,即CPU直接读取内存;另一种是消息语义,类似于以太网的数据传输机制,其中涉及七层协议的打包与解包过程。SUE将读取自GPU或CPU的AXI接口的数据,并将其打包放入以太网报文中进行传输,其中以太网报文内部包含了内存语义的通讯方案。 发言人1问:博士在SUE中完成了哪些关键工作? 发言人1答:博士完成了整套XI接口的定义,并将此接口与内存语义相结合,将其打包后放入以太网中进行传输。同时,为了对标NV switch的技术指标,采用了多种创新技术来降低延迟,例如使用了C超以太网中定义的降低延迟功能,并大量运用了UEC标准中关于降低延迟的技术。 发言人1问:SUE在降低延迟方面采用了哪些具体技术措施? 发言人1、发言人2答:SUE采用了多种技术以降低延迟,包括物理层光模块的超低延迟前向纠错编码、链路层的自动重传机制(LLR)以及借鉴英伟达的基于信用的数据流控制技术(CDSC),这些技术共同协作以实现高效、低延迟的数据传输。 发言人1问:以太网是否是最开放的技术,并且如何实现不同设备间的互联? 未知发言人答:以太网是最开放的技术,因为只要遵循以太网标准,任何厂商都可以制造兼容的芯片和设备进行互联。例如,在以太网层面上,可以使用博通等公司的芯片实现不同设备间的连接,甚至可以替换或使用其他厂商的交换芯片,如腾讯超节点采用的TH芯片,具有良好的兼容性和替换性。 未知发言人问:华为Metr384中涉及的互联技术有哪些,它们是否都属于开放生态? 发言人1答:华为Metr384中包含了多种互联技术,包括GPU与GPU、GPU与网卡之间的互联。其中GPU到GPU的部分采用了私有的互联协议(如Sue),而GPU到CPU以及GPU到网卡则是采用标准的PCIe协议,这属于开放生态。此外,Sue尝试打通CPU、GPU、网卡以及集群间的互联,部分采用以太网标准,但也有部分采用自家定制协议。 未知发言人问:Sue网络与以太网结合的方案是否更为复杂,以及其性能优势在哪里? 未知发言人答:Sue网络方案在一定程度上更为复杂