您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:通信行业深度:AI时代的网络:需求从何而来,创新将走向何方? - 发现报告
当前位置:首页/行业研究/报告详情/

通信行业深度:AI时代的网络:需求从何而来,创新将走向何方?

信息技术2024-05-16宋嘉吉、黄瀚、邵帅国盛证券M***
通信行业深度:AI时代的网络:需求从何而来,创新将走向何方?

请仔细阅读本报告末页声明 证券研究报告 | 行业深度 2024年05月16日 通信 AI时代的网络:需求从何而来,创新将走向何方? 网络是AI大模型时代的关键一环。大模型时代,我们已经开始看到光模块、交换机等网络设备迭代加速,需求爆发。但市场对于为何显卡需要搭配大量光模块,以及通信为何成为大模型痛点体会较浅。本文中,我们将从原理出发,探讨网络为何成为AI时代的全新“C位”,并将从最新的产业变化中,讨论未来网络侧的创新与背后的投资机会。 网络需求从何而来?进入大模型时代,模型体积和单卡上限之间的差距迅速拉大,业界转而寻求多服务器集群来解决模型训练问题,这也构成了AI时代网络“上位”的基础。同时,相较于过去单纯用于传输数据,如今网络更多的用于同步显卡间的模型参数,对于网络的密度,容量都提出了更高要求。 日益庞大的模型体积:(1)训练耗时=训练数据规模x模型参数量/计算速率(2)计算速率=单设备计算速率x设备数x多设备并行效率。当下,业界对于训练数据规模和参数的双重追求下,唯有加速提升计算效率,才能缩短训练耗时,而单设备计算速率的更新有其周期和限制,因此如何利用网络尽可能的扩大“设备数”和“并行效率”直接决定了算力。 多卡同步的复杂沟通:在大模型训练过程中,将模型切分至单卡后,每经过一次计算,单卡之间都需要进行对齐(Reduce、Gather等),同时,在英伟达的通信原语体系NCCL中,All-to-All(即所有节点都可以互相获取值并对齐)的操作较为常见,因此对网络之间的传输和交换提出了更高的要求。 愈发昂贵的故障成本:大模型的训练往往持续数月以上,而中间一旦发生中断,需要回到几小时或者几天前的断点进行重新训练。而整个网络中某一个软硬件环节的故障,或者过高的延迟,都有可能导致中断。更多的中断,代表着落后的进度和愈发高昂的成本。现代的AI网络,已经渐渐发展成堪比飞机、航母等的人类系统工程能力的结晶。 网络创新将走向何方?硬件随需求而动,经过两年,全球算力投资规模已经膨胀到数百亿美元级别,而模型参数的扩张,巨头的惨烈厮杀依然激烈。现如今,“降本”、“开放”和算力规模之间的平衡将是网络创新的主要议题。 通信介质的更迭:光、铜与硅是人类传输的三大介质,在AI时代,光模块追求更高速率的同时,也迈出了LPO、LRO、硅光等降本之路。在当前时间点,铜缆凭借性价比,故障率等因素占领了机柜内连接。而Chiplet,Wafer-scaling等新半导体技术,则正在加速探索硅基互联的上限。 网络协议的竞争:片间通信协议与显卡强绑定,如英伟达的NV-LINK,AMD的Infinity Fabric等等,其决定了单台服务器或者单个算力节点的能力上限,是非常残酷的巨头战场。而IB与以太网的斗争则是节点间通信的主旋律。 网络架构的变化:当下节点间网络架构普遍采用叶脊架构,叶脊具有便捷、简单、稳定等特点。但随着单个集群节点数增多,叶脊稍显冗余的架构会给超大集群带来较大的网络成本。当下,如Dragonfly架构,rail-only架构等新架构有望成为面向下一代超大集群的演进方向。 投资建议:通信系统核心环节:中际旭创、新易盛、天孚通信、工业富联、英维克、沪电股份。通信系统创新环节:长飞光纤、太辰光、源杰科技、盛科通信-U、寒武纪、德科立。 风险提示:AI需求不及预期,Scaling law失效,行业竞争加剧。 增持(维持) 行业走势 作者 分析师 宋嘉吉 执业证书编号:S0680519010002 邮箱:songjiaji@gszq.com 分析师 黄瀚 执业证书编号:S0680519050002 邮箱:huanghan@gszq.com 分析师 邵帅 执业证书编号:S0680522120003 邮箱:shaoshuai@gszq.com 相关研究 1、《通信:光纤光缆行业:海风为盾、特种为矛》2024-05-14 2、《通信:Open AI新品在即——全球算力及光模块景气加码》2024-05-12 3、《通信:特种光纤:始于通信,立足传感,赋能AI与低空经济》2024-05-10 -32%-16%0%16%32%2023-052023-092024-012024-05通信沪深300 2024年05月16日 P.2 请仔细阅读本报告末页声明 重点标的 股票 股票 投资 EPS (元) P E 代码 名称 评级 2023A 2024E 2025E 2026E 2023A 2024E 2025E 2026E 300308.SZ 中际旭创 买入 2.71 5.62 7.80 10.65 61.54 29.67 21.38 15.66 300502.SZ 新易盛 买入 0.97 2.15 3.16 4.22 83.27 37.57 25.56 19.14 300394.SZ 天孚通信 买入 1.85 3.50 5.10 6.53 73.18 38.68 26.55 20.73 资料来源:Wind,国盛证券研究所 2024年05月16日 P.3 请仔细阅读本报告末页声明 内容目录 1. 投资要件 ............................................................................................................................................................ 5 2. 从云计算时代迈向AI时代,为什么通信愈发重要 .................................................................................................. 6 2.1 大模型时代的多卡合作原理,模型并行与数据并行 ........................................................................................ 6 2.2 大模型时代的多卡互联核心:同步的准确率 .................................................................................................. 8 2.3大模型时代的系统工程:监测-总结-创新,迭代永远在路上。 ...................................................................... 11 3. 通信协议的竞争与迭代:承载AI数据流的话语权 ................................................................................................ 13 3.1节点内通信—大厂核心壁垒,算力“摩尔定律”的希望 ............................................................................... 13 3.2节点间通信协议:历久弥新,封闭与开放之争 ............................................................................................ 19 4. AI推动下,网络硬件创新将走向何方? .............................................................................................................. 23 4.1 光、铜与硅,传输介质之争将走向何方 ....................................................................................................... 23 4.2交换机的创新:光交换机初出茅庐 ............................................................................................................. 24 4.3 网络架构的创新:叶脊之后,走向何方?.................................................................................................... 26 4.4数据中心集群的创新:未来算力网络的终极形式? ...................................................................................... 29 5. 投资建议:创新永不停,核心环节与新变量两手抓 .............................................................................................. 31 6. 风险提示 .......................................................................................................................................................... 33 图表目录 图表1:数据并行演示图 ......................................................................................................................................... 7 图表2:模型并行 ................................................................................................................................................... 7 图表3:多维混合并行下的AI集群构建 .................................................................................................................... 8 图表4:同步并行 ................................................................................................................................................... 9 图表5:异步并行 ................................................................................................................................................... 9 图表6:环形同步 .........