事件描述 在SIGGRAPH 2023上,NVIDIA宣布推出全新的NVIDIA L40S GPU以及搭载L40S的NVIDIA OVX服务器。L40S GPU和OVX服务器主要针对生成式人工智能模型的训练和推理环节,有望进一步提升生成式人工智能模型的训练和推理场景下的计算效率。 分析与判断 (1)由于PCIeGen4接口的限制,L40S在GPU网络计算上的应用有所限制,因此对目前800G光模块的需求量影响有限。 (2)相较于A100,L40S在部分面向生成式人工智能模型的应用场景下有计算效率上的优势,且更具性价比。 (3)相较于A100,L40S使用GDDR6等相对成熟技术,有助于确保上游供应的稳定。 (4)L40S的前述优势可能促使下游云厂商加大采购,或将为以200G和400G光模块为代表的中高速光模块带来新的增长空间。 ◼投资建议 《海外云厂商收支稳健,支持AI基础设施建设长期向好》——2023年08月02日 建议关注: 中际旭创:中高端数通市场龙头,2022年与II-VI并列光模块业务营收全球第一。根据iFinD机构一致预期,截至2023年8月9日,公司2023/2024年的预测PE分别为65/41倍,位于近五年的94%分位。 《 通 信 板 块 承 压 , 细 分 板 块 走 出 分 化 特征》——2023年08月01日 新易盛:光模块领域龙头,成本管控优秀,具备切入增量云计算/AI客户的能力。根据iFinD机构一致预期,截至2023年8月9日,公司2023/2024年的预测PE分别为40/29倍,位于近五年的47%分位。 《板块阶段性回调,通信设备长期利好》——2023年07月31日 ◼风险提示 下游需求不及预期;人工智能技术落地和商业化不及预期;产业政策转变;宏观经济不及预期等。 目录 1面向训练和推理场景,英伟达发布L40S GPU..........................32风险提示.....................................................................................5 图 图1:L40S在微调和推理测试用例下性能较A100有优势...3图2:PCIe协议对L40S的通信带宽有所限制......................4 表 表1:L40S与A100、H100存在差异化设计.......................4表2:光通信领域相关公司对比(截至8月9日,单位:亿元).................................................................................5 1面向训练和推理场景,英伟达发布L40SGPU 在SIGGRAPH 2023上,NVIDIA宣布推出全新的NVIDIAL40S GPU以及搭载L40S的NVIDIA OVX服务器。L40SGPU和OVX服务器主要针对生成式人工智能模型的训练和推理环节,有望进一步提升生成式人工智能模型的训练和推理效率。 L40S基于Ada Lovelace架构,配备有48GB的GDDR6显存和846GB/s的带宽。在第四代Tensor核心和FP8 Transformer引擎的加持下,可以提供超过1.45 PFLOPS的张量处理能力。根据英伟达给出的数据,在微调(Fine-tune)和推理场景的测试用例下,L40S的计算效率较A100均有所提高。 资料来源:NVIDIA,上海证券研究所 相比于A100GPU,L40S在显存、算力等多方面有所差异: (1)L40S采用较为成熟的GDDR6显存,相比A100与H100使用的HBM显存,在显存带宽上有所降低,但技术更成熟,市场供应较为充足。 (2)L40S在FP16算力(智能算力)上较A100有所提高,在FP32算力(通用算力)上较A100提高明显,更适应科学计算等场景。 (3)L40S在功率上较A100有所降低,有利于降低数据中心相关能耗。 (4)根据SuperMicro的数据,L40S在性价比上较A100更有优势。 与A100类似,L40S通过16通道的PCIeGen4接口与CPU进行通信,最大双向传输速率为64GB/s。相比之下,NVIDIAGrace Hopper通过NVLink-C2C技术将Hopper架构的GPU与Grace架构的CPU相连,在CPU到GPU、GPU到GPU间实现900 GB/s的总带宽,较PCIeGen5快7倍。 资料来源:Intel,上海证券研究所 我们认为:(1)由于PCIeGen4接口的限制,L40S在GPU网络计算上的应用有所限制,因此对目前800G光模块的需求量影响有限。(2)相较于A100,L40S在部分面向生成式人工智能模型的应用场景下有计算效率上的优势,且更具性价比。(3)L40S使用GDDR6等相对成熟技术,有助于确保上游供应的稳定。(4)L40S的前述优势可能促使下游云厂商加大采购,或将为以200G和400G光模块为代表的中高速光模块带来新的增长空间。 2风险提示 下游需求不及预期:下游客户分布在多个行业,需求的影响因素多。若下游客户的需求量不及预期,将影响行业的收入和利润。 人工智能技术落地和商业化不及预期:从长期看,以人工智能技术为支撑的公司需要以事实证明其现阶段的成长潜力,若不能及时将技术转化为长期壁垒和现金流回报,可能影响后续市场对人工智能主题的关注和信心。 产业政策转变:生成式人工智能模型的训练需要算力、通信和数据支持,前期投入巨大,需要相关产业政策予以倾斜,若产业政策方向发生转变,可能影响关键领域的技术突破。 宏观经济不及预期:宏观经济影响居民消费,若经济增速放缓,可能导致居民消费信心下降,消费需求受到抑制,消费端相关业务承压。 分析师声明 作者具有中国证券业协会授予的证券投资咨询资格或相当的专业胜任能力,以勤勉尽责的职业态度,独立、客观地出具本报告,并保证报告采用的信息均来自合规渠道,力求清晰、准确地反映作者的研究观点,结论不受任何第三方的授意或影响。此外,作者薪酬的任何部分不与本报告中的具体推荐意见或观点直接或间接相关。 公司业务资格说明 本公司具备证券投资咨询业务资格。 投资评级说明: 不同证券研究机构采用不同的评级术语及评级标准,投资者应区分不同机构在相同评级名称下的定义差异。本评级体系采用的是相对评级体系。投资者买卖证券的决定取决于个人的实际情况。投资者应阅读整篇报告,以获取比较完整的观点与信息,投资者不应以分析师的投资评级取代个人的分析与判断。 免责声明 。本公司不会因接收人收到本报告而视其为客户。 本报告版权归本公司所有,本公司对本报告保留一切权利。未经书面授权,任何机构和个人均不得对本报告进行任何形式的发布、复制、引用或转载。如经过本公司同意引用、刊发的,须注明出处为上海证券有限责任公司研究所,且不得对本报告进行有悖原意的引用、删节和修改。 在法律许可的情况下,本公司或其关联机构可能会持有报告中涉及的公司所发行的证券或期权并进行交易,也可能为这些公司提供或争取提供多种金融服务。 本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见和推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值或投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见或推测不一致的报告。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本报告中的内容和意见仅供参考,并不构成客户私人咨询建议。在任何情况下,本公司、本公司员工或关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何损失负责,投资者据此做出的任何投资决策与本公司、本公司员工或关联机构无关。 市场有风险,投资需谨慎。投资者不应将本报告作为投资决策的唯一参考因素,也不应当认为本报告可以取代自己的判断。