您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[上海证券]:通信事件点评:英伟达发布H200,面向生成式AI推理场景持续升级 - 发现报告
当前位置:首页/行业研究/报告详情/

通信事件点评:英伟达发布H200,面向生成式AI推理场景持续升级

信息技术2023-11-15刘京昭上海证券心***
通信事件点评:英伟达发布H200,面向生成式AI推理场景持续升级

证券研究报告 事件点评 英伟达发布H200,面向生成式AI推理场景持续升级 [Table_Rating] 增持(维持) [Table_Summary] ◼ 主要观点 事件描述 近日,NVIDIA宣布推出NVIDIA HGX H200。NVIDIA HGX H200基于NVIDIA Hopper架构,配备NVIDIA H200 Tensor Core GPU和HBM3e显存,能够更好地支持处理生成式AI和高性能计算场景下的工作负载。NVIDIA H200所配备的141GB HBM3e显存拥有4.8 TB/s的带宽,与NVIDIA H100 相比,显存增加76%,带宽增加43%。以Llama2-70B模型为例,NVIDIA H200的推理速度是NVIDIA H100的1.9倍,大幅提高了对生成式AI推理场景的支持能力。 分析和判断 我们认为: (1)HVIDIA HGX H200的推出,从侧面印证了生成式AI推理场景对算力的巨大需求。 (2)H200在推理场景下性能的提升,有望降低下游科技企业在生成式AI应用落地时的算力使用成本,加速生成式AI应用的技术落地。 (3)在生成式AI研发中处于领先地位的科技企业,有望在产品落地后,更好地将技术转化壁垒和现金流,从而持续投入人工智能基础设施建设,有利于与这些科技企业存在较强上下游绑定关系的算力供应链企业实现持续增长。 ◼ 投资建议 建议关注: 中际旭创:中高端数通市场龙头,2022年与II-VI并列光模块业务营收全球第一,公司800G光模块已在2023年上半年逐步起量。根据iFinD机构一致预期,截至2023年11月14日,公司2023/2024年的预测PE分别为45/23倍,位于近五年的67%分位。 天孚通信:光器件整体解决方案提供商。根据iFinD机构一致预期,截至2023年11月14日,公司2023/2024年的预测PE分别为54/35倍,位于近五年的85%分位。 ◼ 风险提示 下游需求不及预期;人工智能技术落地和商业化不及预期;产业政策转变;宏观经济不及预期等。 [Table_Industry] 行业: 通信 日期: shzqdatemark [Table_Author] 分析师: 刘京昭 SAC编号: S0870523040005 [Table_QuotePic] 最近一年行业指数与沪深300比较 [Table_ReportInfo] 相关报告: 《三大运营商云业务稳中有进,新兴业务产品日臻完善》 ——2023年08月15日 《英伟达发布L40S GPU,中高速光模块或将受益》 ——2023年08月11日 《海外云厂商收支稳健,支持AI基础设施建设长期向好》 ——2023年08月02日 -16%-9%-2%4%11%18%25%31%38%08/2210/2201/2303/2306/2308/23通信沪深3002023年11月15日 事件点评 请务必阅读尾页重要声明 2 目 录 1 英伟达推出H200,大幅提升生成式AI模型推理速度 ............... 3 2 风险提示 ..................................................................................... 5 图 图 1:NVIDIA H200较H100推理能力更强 .......................... 4 图 2:NVIDIA H200首次配备HBM3e .................................. 4 图 3:英伟达有望持续发布面向模型训练和推理的计算卡 ..... 4 表 表 1:H200 SXM与H100 SXM技术指标相仿 ...................... 3 表 2:光通信领域公司对比(截至11月13日,单位:亿元) ................................................................................. 5 事件点评 请务必阅读尾页重要声明 3 1 英伟达推出H200,大幅提升生成式AI模型推理速度 近日,NVIDIA宣布推出NVIDIA HGX H200。NVIDIA HGX H200基于NVIDIA Hopper架构,配备NVIDIA H200 Tensor Core GPU和HBM3e显存,能够更好地支持处理生成式AI和高性能计算场景下的工作负载。 从整体上看,NVIDIA H200 SXM与NVIDIA H100 SXM的技术指标相仿,主要的区别在于NVIDIA H200 SXM的HBM3e显存大小明显增加、带宽明显增大:NVIDIA H200所配备的141GB HBM3e显存拥有4.8 TB/s的带宽,与NVIDIA H100 相比,显存增加76%,带宽增加43%。以Llama2-70B模型为例,NVIDIA H200的推理速度是NVIDIA H100的1.9倍,大幅提高了对生成式AI推理场景的支持能力。 NVIDIA A100/A800、AMD MI200以及多数CSPs自研的加速芯片主要基于HBM2e设计。随着生成式AI的需求持续上升,新一代HBM的开发和技术落地逐渐加速。NVIDIA H100/H800以及AMD MI300系列开始配备SK海力士、三星开发的HBM3。美光则跳过HBM3,直接开发HBM3e。单颗HBM3e容量将提升至24GB,传输速率也将由HBM3的5.6~6.4Gbps提升至8Gbps。我们认为:HBM3e拥有更大的容量、更高的传输速率,因此也更适表 1:H200 SXM与H100 SXM技术指标相仿 技术指标 NVIDIA H200 SXM NVIDIA H100 SXM GPU架构 NVIDIA Hopper NVIDIA Hopper FP64 34 TFLOPS 34 TFLOPS FP32 67 TFLOPS 67 TFLOPS FP64 Tensor Core 67 TFLOPS 67 TFLOPS TF32 Tensor Core* 989 TFLOPS 989 TFLOPS FP16/BF16 Tensor Core* 1979 TFLOPS 1979 TFLOPS FP8 Tensor Core* 3958 TFLOPS 3958 TFLOPS INT8 Tensor Core* 3958 TFLOPS 3958 TFLOPS GPU显存 141 GB HBM3e 80GB HBM3 GPU显存带宽 4.8 TB/s 3.35 TB/s Interconnect NVLINK、PCIe Gen5 NVLINK、PCIe Gen5 功率 Up to 700 W Up to 700 W 资料来源:NVIDIA,上海证券研究所 *面向稀疏矩阵场景 事件点评 请务必阅读尾页重要声明 4 合生成式AI的应用场景。 图 1:NVIDIA H200较H100推理能力更强 图 2:NVIDIA H200首次配备HBM3e 资料来源:NVIDIA,上海证券研究所 资料来源:NextPlatform,上海证券研究所 根据英伟达公布的文件,未来有望继续基于x86架构推出面向人工智能模型推理场景的计算卡B100。同时,英伟达也将继续开发基于800G、1.6T光模块的新一代InfiniBand和以太网交换机,在人工智能基础设施领域持续发力。 图 3:英伟达有望持续发布面向模型训练和推理的计算卡 资料来源:ServeTheHome,上海证券研究所 我们认为:(1)HVIDIA HGX H200的推出,从侧面印证了生成式AI推理场景对算力的巨大需求。(2)H200在推理场景下性能的提升,有望降低下游科技企业在生成式AI应用落地时的算力使用成本,加速生成式AI应用的技术落地。(3)在生成式AI研发中处于领先地位的科技企业,有望在产品落地后,更好地将技术转化壁垒和现金流,从而持续投入人工智能基础设施建设,有利于与这些科技企业存在较强上下游绑定关系的算力供应链企业实现持续增长。 事件点评 请务必阅读尾页重要声明 5 2 风险提示 下游需求不及预期:下游客户分布在多个行业,需求的影响因素多。若下游客户的需求量不及预期,将影响行业的收入和利润。 人工智能技术落地和商业化不及预期:从长期看,以人工智能技术为支撑的公司需要以事实证明其现阶段的成长潜力,若不能及时将技术转化为长期壁垒和现金流回报,可能影响后续市场对人工智能主题的关注和信心。 产业政策转变:生成式人工智能模型的训练需要算力、通信和数据支持,前期投入巨大,需要相关产业政策予以倾斜,若产业政策方向发生转变,可能影响关键领域的技术突破。 宏观经济不及预期:宏观经济影响居民消费,若经济增速放缓,可能导致居民消费信心下降,消费需求受到抑制,消费端相关业务承压。 表 2:光通信领域公司对比(截至11月13日,单位:亿元) 细分板块 股票简称 22营业收入 22归母净利润 23E营业收入 23E归母净利润 PE 23E 24E营业收入 24E归母净利润 PE 24E 近五年PE分位数(%) 光芯片/光器件 源杰科技 2.83 1.00 2.63 0.73 191 3.86 1.24 119 95 仕佳光子 9.03 0.64 9.33 0.66 128 11.12 0.99 66 -- 长光华芯 3.86 1.19 4.33 0.93 118 6.10 1.44 62 99 腾景科技 3.44 0.58 3.87 0.61 74 5.33 0.89 49 97 光模块/光引擎 中际旭创 96.42 12.24 116.31 18.76 45 209.82 36.59 23 67 新易盛 33.11 9.04 31.54 6.94 39 53.35 12.73 24 64 天孚通信 11.96 4.03 17.55 5.87 54 26.59 8.79 35 85 博创科技 14.67 1.94 16.52 2.37 35 19.67 2.91 29 46 华工科技 120.11 9.06 128.85 10.97 28 157.19 14.11 22 27 光迅科技 69.12 6.08 70.16 6.28 38 82.03 7.83 29 54 剑桥科技 37.86 1.71 -- -- -- -- -- -- 54 太辰光 9.34 1.80 10.10 1.78 48 14.69 2.71 31 97 资料来源:iFinD,上海证券研究所 *盈利预测来自iFinD机构一致预期;仅列举各板块部分标的。 事件点评 请务必阅读尾页重要声明 6 分析师声明 作者具有中国证券业协会授予的证券投资咨询资格或相当的专业胜任能力,以勤勉尽责的职业态度,独立、客观地出具本报告,并保证报告采用的信息均来自合规渠道,力求清晰、准确地反映作者的研究观点,结论不受任何第三方的授意或影响。此外,