英伟达正式推出H200,算力再提速。本周英伟达正式推出HGX H200,发布时间早于此前预期的2024年,我们认为,算力硬件竞争激烈,英伟达未来或将继续加速新品发布节奏,此举有望再加速AI进程。 OpenAI意外改组,AGI进程不变。据OpenAI官网报道,Sam Altman将辞去CEO职位并离开董事会,该公司CTO米拉·穆拉蒂(Mira Murati)将担任临时首席执行官。市场担心Sam Altman的离职将影响OpenAI的研发进程,但我们认为,AGI的全球进程已然开启,并不会因为OpenAI的人员变动而改变,同时,OpenAI作为行业领跑者也在“摸着石头过河”,人员和组织调整亦属正常,短期内或利好Anthropic、X.ai等竞争对手以及Google、亚马逊、特斯拉、Meta等玩家。 AI硬件的长期战略焦点:打破“通信墙”。微观H200 SXM的性能参数,其首次采用HBM3e工艺,141GB的显存带宽达到4.8TB/s,与H100 SXM相比,显存扩大76%的同时带宽提升了43%。早在2008年,AMD就率先意识到了通信墙问题并提出了HBM(High-Bandwidth Memory)概念,以充分发挥游戏显卡的潜力。而当今的AI训练推理亟需超大内存来承载千亿参数量、TB级别大小的大模型,内存性能也顺理成章成为AI算力的瓶颈所在。对比来看,根据英伟达数据,内存升级带来了同比例甚至更高的性能升级,也证明了打破通信墙是提升显卡性能的有效方法。 AI硬件的强力辅助——算力调优。英伟达表示未来的软件更新预计将为H200带来额外的性能领先优势。以英伟达TensorRT开源库为例,其可以帮助开发人员优化推理过程,通过稀疏化矩阵降低一部分不必要的精度,从而降低token输出的延迟、增强token吞吐量。我们认为,当下市场主要聚焦于算力的最核心环节显卡,市场普遍聚焦于企业拥有的显卡数量,纸面算力等数据,而忽略了服务器到货只是整个算力链条的第一步,软件侧的算力调优也是重要一环,通过一站式的模型末端调优服务,实现推理准确性与落地成本的平衡,这亦是打造超算互联网需要考虑的场景。 硬件加快迭代,带动光通信再提速。根据英伟达的技术路线图,原本1.6T光模块计划在2025年大规模应用,现在随着H200提前发布,整个技术路线的迭代随之加速,1.6T时代也有望更早来临。市场此前存在疑虑,光模块的需求量可能在一两年内或随着800G充分放量而步入下行阶段。我们认为,AI应用快速迭代成长,算力需求并未见顶,供应侧利好频出,新兴业务蓬勃发展,投资者情绪高涨,当下应积极关注算力板块后续发展。 算力—— 算力调优/调度/租赁:恒为科技、思特奇、中科金财、东方材料、博睿数据、中贝通信、恒润股份、中科曙光、中国移动、中国联通、中国电信。光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、寒武纪、震有科技。液冷:英维克、申菱环境、高澜股份、佳力图。边缘算力承载平台:美格智能、广和通、移远通信、初灵信息、龙宇股份、网宿科技、佳讯飞鸿。卫星通信:中国卫通、中国卫星、震有科技、华力创通、电科芯片、海格通信。 数据要素—— 运营商:中国电信、中国移动、中国联通。数据可视化:浩瀚深度、恒为科技、中新赛克。BOSS系统:亚信科技、天源迪科、东方国信。 风险提示:AI发展不及预期,算力需求不及预期,市场竞争风险。 重点标的 股票代码 1.投资策略:算力板块再入佳境 本周核心推荐: 算力—— 算力调优/调度/租赁:恒为科技、思特奇、中科金财、东方材料、博睿数据、中贝通信、恒润股份、中科曙光、中国移动、中国联通、中国电信。 光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。 算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、寒武纪。 云算力:光环新网、奥飞数据、数据港、润泽科技、科华数据。 液冷:英维克、申菱环境、高澜股份、佳力图。 边缘算力承载平台:美格智能、广和通、移远通信。 卫星通信:三大运营商、中国卫通、中国卫星、震有科技、华力创通、电科芯片、海格通信。 数据要素—— 运营商:中国电信、中国移动、中国联通。 数据可视化:浩瀚深度、恒为科技、中新赛克。 BOSS系统:亚信科技、天源迪科、东方国信。 本周观点变化: 本周英伟达提前发布H200,新卡相较于H100,重点在于增强内存通信能力,这证明了我们一直强调的“通信墙”问题始终限制着显卡性能的发挥,新卡的发布加速了AI硬件的迭代速度,同时也有望强化市场对光通信板块的信心。 光通信热度不减,算力再入佳境。本周市场开始关注LPO、硅光等光模块的核心技术及演进路线。我们认为,不论是分立式激光器、LPO或硅光方案,其核心皆在于降低成本和功耗以贴近AI超算的使用场景和成本控制要求。对于技术路线的争论是短期的,长期应聚焦于“第一性原理”——AI超算对于通信带宽不断增加,因此,降低成本并非对光模块构成利空,通信硬件的性价比越高,企业搭建超算网络时就越愿意为通信系统付出更多资本开支。 英伟达将在北京时间下周三早晨6:00举行业绩说明会,我们建议投资者持续跟进关注。 2.行情回顾:通信板块表现上涨,物联网表现最佳 本周(2023年11月13日-2023年11月17日)大盘收于3054点。各行情指标从好到坏依次为:创业板综>中小板综>万得全A(除金融,石油石化)>万得全A>上证综指>沪深300。通信板块上涨,表现优于大盘。 图表1:通信板块上涨,细分板块中物联网表现相对最优 从细分行业指数看,物联网、光通信、区块链、量子通信上涨6.3%、5.0%、4.3%、3.5%,表现优于通信行业平均水平;移动互联、卫星通信导航、云计算、通信设备上涨2.7%、2.3%、1.3%、1.3%,运营商下跌1.5%,表现劣于通信行业平均水平。 本周受益智慧城市概念,多伦科技上涨61.16%,领涨板块。受益办公用品概念,广博股份上涨23.88%,受益数字支付概念,银之杰上涨14.21%,受益卫星通信概念,盛路通信上涨12.56%,受益光通信概念,新易盛上涨9.93%。 图表2:本周新易盛领涨通信行业 3.周专题:算力板块再入佳境 英伟达正式推出H200,算力再提速。本周英伟达正式推出HGXH200,发布时间早于此前预期的2024年,我们认为,算力硬件竞争激烈,英伟达未来或将继续加速新品发布节奏,此举有望再加速AI进程。 OpenAI意外改组,AGI进程不变。据OpenAI官网报道,Sam Altman将辞去CEO职位并离开董事会,该公司CTO米拉·穆拉蒂(Mira Murati)将担任临时首席执行官。市场担心Sam Altman的离职将影响OpenAI的研发进程,但我们认为,AGI的全球进程已然开启,并不会因为OpenAI的人员变动而改变,同时,OpenAI作为行业领跑者也在“摸着石头过河”,人员和组织调整亦属正常,短期内或利好Anthropic、X.ai等竞争对手以及Google、亚马逊、特斯拉、Meta等玩家。 AI硬件的长期战略焦点:打破“通信墙”。微观H200SXM的性能参数,其首次采用HBM3e工艺,141GB的显存带宽达到4.8TB/s,与H100SXM相比,显存扩大76%的同时带宽提升了43%。早在2008年,AMD就率先意识到了通信墙问题并提出了HBM(High-BandwidthMemory)概念,以充分发挥游戏显卡的潜力。而当今的AI训练推理亟需超大内存来承载千亿参数量、TB级别大小的大模型,内存性能也顺理成章成为AI算力的瓶颈所在。对比来看,根据英伟达数据,内存升级带来了同比例甚至更高的性能升级,也证明了打破通信墙是提升显卡性能的有效方法。 图表3:H100和H200的大模型推理表现对比 AI硬件的强力辅助——算力调优。英伟达表示未来的软件更新预计将为H200带来额外的性能领先优势。以英伟达TensorRT开源库为例,其可以帮助开发人员优化推理过程,通过稀疏化矩阵降低一部分不必要的精度,从而降低token输出的延迟、增强token吞吐量。我们认为,当下市场主要聚焦于算力的最核心环节显卡,市场普遍聚焦于企业拥有的显卡数量,纸面算力等等数据,而忽略了服务器到货只是整个算力链条的第一步,软件侧的算力调优也是重要一环,通过一站式的模型末端调优服务,实现推理准确性与落地成本的平衡,这亦是打造超算互联网需要考虑的场景。 硬件加快迭代,带动光通信再提速。根据英伟达的技术路线图,原本1.6T光模块计划在2025年大规模应用,现在随着H200提前发布,整个技术路线的迭代随之加速,1.6T时代也有望更早来临。市场此前存在疑虑,光模块的需求量可能在一两年内或随着800G充分放量而步入下行阶段。我们认为,AI应用快速迭代成长,算力需求并未见顶,供应侧利好频出,新兴业务蓬勃发展,投资者情绪高涨,当下应积极关注算力板块后续发展。 4.AI驱动下的光模块市场热闹非凡 C114讯今年,光模块行业可谓热闹非凡。带来这场狂欢的是以ChatGPT为代表的AI大模型,揭开了人工智能的“军备竞赛”,特别在国内更是形成了“百模大战”之势,由此带来大规模算力的需求,而单点算力形成集群算力需要高性能的网络连接,光模块在其中扮演着重要角色。 AI是“助燃剂”。 事实上,数字经济的大背景下,对算力这一核心生产力的需求持续攀升,国家“东数西算”战略随之而来,算力网络建设稳步推进。只是,大模型训练把对算力的需求带上了新高度,进一步加强了对网络质量的要求,特别是数据中心网络。 中国电信光传输专业首席专家李俊杰此前表示,“百模大战”带来了数据中心流量的进一步升级,数通光模块正逐渐实现100G-400G-800G三级跳跃。数据中心内部网络(DCN)传输距离普遍在2km以内,考虑低成本IM-DD方案;数据中心间互联(DCI)则必须使用相干(ZR/ZR+)。 LightCounting指出,人工智能集群升级需要使用大量光连接,未来两年主要是400G和800G以太网光模块和AOC。数据中心间连接的升级也在加速,这意味着2024年—2025年400ZR/ZR+和之后800ZR/ZR+的出货量将出现增长。 这些都有数据支撑。今年上半年,需求不足,库存高企,光模块厂商的业绩普遍不尽如人意,全球光模块龙头的旭创科技凭借800G等光端产品的良好订单和市场份额,成为为数不多净利润增长的厂商。而到了第三季度,旭创科技还是保持强势,其他厂商的降幅明显收窄。 可以说,AI是“助燃剂”,加速了光模块市场进入新一轮增长周期。当然人工智能技术的加速升级演进,也为推动数字经济的发展增添新动能。 探寻演进新方向。 提到技术演进,目前AI厂商已明确提出了1.6T的需求,以配合未来更大带宽更高算力的GPU需求。当然封装形式是可插拔、CPO、LPO一直是业界热议的话题,而万变不离其宗的是对光模块高速率、高集成、低功耗、低成本的要求。 中国电信集团科技委主任韦乐平表示,光子集成(PIC)是主要突破方向,其中磷化铟(InP)是唯一的大规模单片集成技术,硅光(SiP)是最具潜力的突破方向,可以将电域的CMOS的投资、设施、经验和技术用在光域。同时,基于硅光的光电共封(CPO)是进一步降低功耗、提升能效、提高速率,适应AI大模型算力基础设施发展的关键器件之一。 CPO能够显著降低功耗,降低电信号传输距离,提供信号质量;与可插拔相比,提高ASIC-光模块互联密度,高集成,节省空间。不过CPO相对依赖硅光子技术才能做到小型化高集成,需要借助硅光的工艺和封装测试平台;另外,更复杂的技术是否能带来收益,目前可插拔方案能耗问题还能应对,没到非用不可的地步。 在此背景下,LPO“线性直驱”成为新势力。LPO仍使用传统光模块封装,DSP被放在