您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [财通证券]:PCB行业专题报告:AI催化交换机配套升级,PCB行业有望受益 - 发现报告

PCB行业专题报告:AI催化交换机配套升级,PCB行业有望受益

电子设备 2024-08-16 张益敏,吴姣晨 财通证券 Elise
报告封面

AI驱动数据中心网络架构迭代升级:传统数据中心架构存在带宽浪费/故障域大/时延较长等问题,难以满足AI和云计算的更高算力需求,低延迟/可扩展/高安全的新型叶脊网络架构逐渐成为首选。由于HPC/AI对网络高吞吐、低时延的要求,以太网RoCE与InfiniBand协议应运而生。以太网与InfiniBand交换机各有千秋,根据LightCounting预测,AI硬件需求推动InfiniBand交换机率先起量,2023-2028综合CAGR将达到24%,而以太网交换机以其开放的生态优势未来有望增长将更多。 AI网络集群时代来临,网络部署配套升级:随着AI单模型算力需求不断提升,推动AI服务器需求快速增长。IDC预测显示,全球人工智能服务器市场预计将从2022年的195亿美元增长到2026年的347亿美元,五年CAGR达17.3%。AI服务器集群扩张和算力持续迭代,带动交换机需求提升和设备升级,据Dell'Oro预计部署在人工智能后端网络中的交换机支出在未来五年内将接近800亿美元,是数据中心交换机总市场的两倍。800Gbps将在2025年超过400Gbps成为主流速率,推动交换机市场新一轮增长和结构调整。 交换机PCB产业链有望持续受益:根据观研网,交换机中PCB占总成本的7%。交换机结构性升级带动配套PCB对材料、工艺提出更高要求。国内PCB、覆铜板头部厂商有望受益于交换机需求和国产替代趋势。我们测算2024年交换机PCB市场规模有望达到6.90亿美元,2024-28年CAGR为10.10%。 投资建议:AI驱动网络底座新成长,建议关注PCB厂商沪电股份、深南电路、方正科技、生益电子等;覆铜板厂商生益科技、南亚新材、华正新材等。 风险提示:AI应用落地不及预期、AI相关政策风险、行业竞争加剧、原物料供应及价格波动、技术研发不及预期、贸易争端等风险。 1交换机:AI驱动网络底座新成长 交换机(Switch),全名交换式集线器(Switching Hub),其主要功能是进行数据传输与共享。作为一种多端口网络设备,它可以接收来自计算机、摄像头等多种设备的数据,并与其他交换机、路由器等相连。交换机通过学习和记忆设备的身份标识(MAC地址),将其与连接的端口关联起来,形成一个地址表。当交换机接收到的数据需要发送到指定地址时,它便会根据地址表中的信息,将数据发送到目标设备所连接的端口,从而实现高效的数据交换。 图1.交换机工作原理 交换机可以按照网络所处位置分工、端口类型、传输速度、应用规模、下游应用场景等不同维度进行分类。其中,企业级交换机的应用场景多元,种类丰富,技术要求从高到低主要可分为中小网络精简型交换机(SMB)、园区交换机和数据中心交换机。 中小网络精简型交换机(SMB)是面向商业地产、酒店及其他中小型企业推出的,性价比较高的交换机,可广泛应用于企业办公、生产、监控等规模较小的场景; 园区交换机则主要面向企业、政府、教育、金融、制造等各行业,旨在构建易于管理、稳定可靠且具备业务智能的园区网络;而数据中心交换机则主要针对云数据中心和高端园区等场景,适用于各种场景和网络规则,为助力实现规模化、自动化、可编程和可视化等目标而打造。 表1.交换机分类 随着AI驱动,数据中心交换机占比有望逐步提升。根据IDC的研究报告,2023年全球以太网交换机市场收入同比增长20.1%,达到442亿美元。分应用场景来看,数据中心交换机市场收入在2023Q4及全年分别同比增长4.4%、13.6%,非数据中心交换机市场收入在2023年全年同比增长25.2%,但2023Q4同比下降1.9%。 截至2023Q4,数据中心交换机收入占比达41.5%,非数据中心交换机收入占比为58.5%。随着AI驱动,数据中心交换机占比有望逐步提升。 图2.全球以太网交换机按应用场景划分收入(亿美元)图3.2023Q4全球以太网交换机收入占比(按应用场景) 2数据中心网络架构迭代升级 2.1从传统三层架构到叶脊架构 随着互联网云业务的发展,东西向流量需求急剧增加。为提高计算和存储资源的利用率,数据中心开始采用虚拟化技术。虚拟化技术能够将一台服务器虚化成多台逻辑服务器,每个逻辑服务器均可独立运行,拥有自己的OS、APP、独立的MAC地址和IP地址,它们通过服务器内部的虚拟交换机(vSwitch)与外部实体进行网络连接。虚拟化技术的引入使得应用的部署方式越来越分布式,导致东西向流量大幅增加。根据思科的数据,2021年数据中心东西向流量占比达到71.5%,数据中心到数据中心的流量占13.6%,而南北向流量占比为14.9%,此时东西向流量已成为主导流量。 图4.数据中心的数据流量类型 图5.全球数据中心东西向流量已成主导流量 随着云计算的快速发展,传统三层网络架构难以满足运行大量东西向流量的需要,带宽浪费、故障域大、时延较长、东西向流量不足、难以适应超大规模网络等缺点愈发突出。 新型叶脊(Spine-Leaf)网络架构逐渐成为数据中心的首选。叶脊网络架构将架构转变为扁平化拓扑结构。其中,脊交换机(Spine Switch)类似于传统三层架构中的核心层交换机,用于与所有的叶交换机相连;叶交换机(Leaf Switch)类似于接入层交换机,直接连接到服务器和脊交换机,且任意两台叶交换机的数据流量能够通过一台脊交换机进行传输。 叶、脊交换机之间通过ECMP动态选择多条路径。当Leaf层的接入端口和上行链路都没有瓶颈时,网络可实现无阻塞状态。Fabric中的每个Leaf都会连接到每个Spine,即使一个Spine出现问题,流量仍可通过其他Spine传输,数据中心的吞吐性能只会轻微下降。叶脊网络架构可以达到低延迟性、可扩展性、高安全性和可用性等优势。 图6.传统数据中心网络架构 图7.叶脊网络架构 2.2后端网络:InfiniBand率先起量,以太网紧随其后有望赶超 由于HPC/AI对于网络高吞吐、低时延的要求,TCP/IP协议逐步过渡到RDMA。 根据Arista AI Networking White Paper,在高速数据中心网络中,传统的TCP/IP协议(Transmission Control Protocol/Internet Protocol,传输控制协议/网际协议)数据需要通过用户空间发送到远程机器的用户空间,存在网络时延较长以及CPU负载过大等缺点,处理AI应用相关的大量数据存在瓶颈。 在AI网络场景下,RDMA在传输速率和低延迟性上优于TCP/IP。RDMA(Remote Direct Memory Access,远程内存直接访问)技术的出现,为网络性能提升提供了新的技术思路。它能直接通过网络接口访问内存数据,无需操作系统内核的介入,适用于高吞吐、低延迟的网络通信。 图8.RDMA通过网络接口直接访问内存数据 目前有三种RDMA网络,分别是InfiniBand(IB,“无限带宽”技术)、RoCE(RDMA over Converged Ethernet)和iWARP。RoCE和iWARP都是基于以太网的RDMA技术;InfiniBand也是引入了RDMA协议,最初是为了取代PCI总线设计。其中,RoCE协议有RoCEv1和RoCEv2两个版本。目前业界常用的网络解决方案是InfiniBand和RoCEv2。 图9.RDMA网络种类 RoCE具有高通用性和较低成本的优势,但其性能难以满足高性能计算和存储需求。RoCE技术应用广泛,可用于传统以太网和高性能RDMA网络。在第60届全球超级计算机TOP500榜单中,以太互联技术占比达46.6%。然而,在交换机上配置Headroom、PFC(基于优先级的流量控制)和ECN(显式拥塞通知)等参数可能会变得复杂。并且,受限于传统以太网络的性能瓶颈,RoCE在高性能业务中存在拥塞丢包、延迟抖动等性能损失,在大规模部署中,RoCE的总体吞吐量性能略低于InfiniBand,因此难以满足高性能计算和存储需求。 相比RoCE协议,InfiniBand具有更低延迟、高可拓展性的优势。由于IB是端到端的专用设备,每台IB交换机的延迟约为150-200ns,远低于传统以太网交换机(500ns以上),在大网多跳后的延迟优势更大。根据2017年ODCC组织的测试结果,在超算集群应用下,传统以太和专网的性能最高相差30%。并且,InfiniBand的单个子网可以支持数万个节点。它可以提供相对简单和可扩展的架构,通过InfiniBand路由器创建几乎无限的集群规模,支持比如Fat-Tree、DragonFly、DragonFly+和Torus3D等多种物理拓扑。 图10.IB端到端通信延迟更低 图11.IB交换机延迟更低 表2.InfiniBand和RoCEv2对比 随着英特尔、微软等相继退出IB转向PCIe的研发,Mellanox坚守IB并不断收购该领域中的公司,到2019年英伟达以近70亿美元的价格收购Mellanox,前瞻性布局节点间互联技术,从此IB成为英伟达独有技术。InfiniBand是生成式AI应用中以太网的可行替代方案,然而,InfiniBand网络的价格较高,并且没有开放的生态系统。 为了应对英伟达一家独大的局面,英特尔、AMD等大厂成立超以太网联盟,定义新的传输协议,有望与InfiniBand同台竞争。2023年7月,AMD、Arista、Broadcom、思科、Eviden、HPE、Intel、Meta和Microsoft等行业领导者正式成立超以太网联盟(Ultra Ethernet Consortium,UEC),旨在优化高性能网络的以太网标准,更好地支持人工智能、机器学习和高性能计算的持续增长需求。UEC传输是一种靠近传输层的新形式,能够更好地实现语义调整、拥塞通知,并增强其安全功能。UEC将提供更灵活的传输,不需要无损网络,支持many-to-many人工智能工作负载所需的多路径和无序数据包传输等功能。UEC新协议可以提供更好的以太网传输(仍支持RDMA),在提供AI和HPC应用程序所需性能的同时保留以太网/IP的优势,有望与InfiniBand同台竞争。 图12.多家头部科技企业共同成立超以太网联盟UEC 英伟达同时布局以太网(Spectrum)和IB(Quantum)交换机。英伟达认为AI应用场景可分为AI云和AI工厂,在AI云中可以使用传统以太网交换机和Spectrum-X以太网支持多租户和多任务、每个用户单一任务算力需求并不太大的场景;而在AI工厂中则需要使用NVLink+InfiniBand的方案提供对大模型训练有极致性能需求的场景。 图13.英伟达Spectrum平台 图14.英伟达Quantum平台 利用GPU优势推出InfiniBand交换机后,开始注重以太网交换机的发展。英伟达推出高算力GPU时,优先推广利润和表现较高的InfiniBand交换机占据训练大模型的主要位置,在AIGC进入商业化落地阶段后,模型推理需求有望占据较高地位,由于InfiniBand在线缆带宽和端口速度方面落后于以太网,构建同等规模集群的网络时以太网成本更优,并且推理所消耗算力较训练少、对网络架构的延时的容忍度更高,因此以太网具备更高的性价比。同时,考虑到随着计算集群的规模不断扩大,以太网相比InfiniBand可以有更高的互联上限,因此公司开始注重推广以太网产品,公司预计Spectrum-X将在一年内跃升至数十亿美元的产品线。 图15.TOPN互联方式IB和以太网使用数量相继提升 在云数据中心领域,以太网与InfiniBand交换机有望齐头并进。根据LightCounting对于云数据中心以太网交换机、InfiniBand交换机以及光交换机的ASIC/OCS硬件销售预测,AI硬件需求推动InfiniBand交换机销量率先起量,2023-2028综合CAGR将达到24%,而以太网交换机以其开放的生态优势未来有望增长将更多,2023-2028综