您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[光大证券]:英伟达GTC2024大会点评:Blackwell平台实现AI性能跃升,软硬协同助力英伟达转型AI全链条平台 - 发现报告
当前位置:首页/行业研究/报告详情/

英伟达GTC2024大会点评:Blackwell平台实现AI性能跃升,软硬协同助力英伟达转型AI全链条平台

信息技术2024-03-21付天姿、王贇光大证券杨***
英伟达GTC2024大会点评:Blackwell平台实现AI性能跃升,软硬协同助力英伟达转型AI全链条平台

敬请参阅最后一页特别声明 -1- 证券研究报告 2024年3月20日 行业研究 Blackwell平台实现AI性能跃升,软硬协同助力英伟达转型AI全链条平台 ——英伟达GTC 2024大会点评 海外TMT行业 事件:美国时间3月18日-3月21日期间,英伟达举行GTC 2024大会。其中美国时间3月18日下午1:00-3:00,英伟达CEO黄仁勋发表了《见证AI的变革时刻》的主题演讲,分享在芯片迭代、软件生态和机器人等应用上的进展。 Blackwell新架构:多芯片封装、Transformer 引擎和互联传输升级,助力单芯片性能和整体算力集群性能提升。1)4NP制程+双芯片设计,将2颗GPU以10 TB/s通信速率融合成一颗芯片,晶体管数量由H100的800亿提升至2080亿,大幅提升单芯片处理能力;2)第二代Transformer引擎,使Blackwell具备在FP4精度的AI推理能力,能在将性能和效率翻倍的同时保持混合专家模型的高精度;3)互联传输方面,NVLink + NVLink Switch + X800系列交换机提升集群通信连接速率;4)内嵌解压引擎、RAS引擎和加密协议。 通信互联:推出第五代NVLink、NVLink Switch和X800系列交换机,增强大规模AI算力网络传输速度。1)第五代NVLink:带宽突破1.8TB/s,相比第四代提升一倍;2)NVLink Switch:支持576颗GPU组成计算集群,上一代仅支持256颗GPU连接;3)X800系列交换机:成为全球首款具备端到端 800Gb/s 吞吐量的网络平台,相比上代产品带宽容量提高5倍,网络计算能力提高9倍。 英伟达推出B200 GPU、超级芯片、服务器到大型算力集群等全套算力硬件组合。1)B200:搭载8颗HBM3e,内存容量达192GB,FP4精度下算力高达20 PFLOPS,预计2024年晚些时间上市;2)超级芯片GB200:2颗Blackwell GPU +1颗Grace CPU,FP4精度下算力高达40PFLOPS;3)超级计算机GB200 NVL72:72颗BlackwellGPU+36颗Grace CPU,训练和推理性能相比等同数量的H100 GPU表现提升4倍和30倍;4)DGX Super POD:一站式 AI 超算解决方案,搭载8套 DGX GB200 NVL72系统,有望成为未来重要基础设施。 软件工具链:NIM打通软硬件、降低客户软件开发难度,NeMo帮助企业采用专用数据开发定制大模型,英伟达将逐步转型成类苹果/微软的平台提供商。1)NIM推理微服务:集成数十个企业级生成式AI模型,可提供从最浅层的应用软件到最深层的硬件编程体系CUDA的直接通路,帮助开发者在CUDA GPU上创建和部署生成式AI应用;2)NeMo Retriever:挖掘企业“数据金矿”价值,客户可以使用其他公司或英伟达提供的行业基础NeMo并添加自己的数据来生成专用大模型;3)NIM已在半导体、医药等多领域落地。 软件应用:英伟达拓展AI应用发展方向,积极在机器人和自动驾驶等领域开展合作。1)机器人:英伟达看好AI+机器人领域前景,发布机器人基础大模型Project GR00T,推出Jetson Thor计算机、Isaac软件开发工具和库等,并与众多公司在机器人开发领域达成合作关系;2)自动驾驶:自动驾驶芯片采用Blackwell新架构,英伟达与比亚迪等车企加强合作。 硬件迭代+软件协同+拓展应用领域,我们看好AI算力产业链维持高景气度,建议关注:1)英伟达:AI芯片性能强劲,软硬件协同服务打开想象空间;2)其他AI芯片:AMD、英特尔;3)服务器:超微电脑、联想集团、工业富联、戴尔科技、慧与;4)HBM:三星电子、SK海力士、美光科技;5)ASIC芯片设计:Marvell科技、博通;6)CoWoS:台积电、日月光、Amkor科技;7)CoWoS设备:ASMPT;8)云技术服务商:Oracle;9)光模块:中际旭创。 风险分析:1)下游应用程序开发和场景拓展较慢,导致AI商业化进度不及预期;2)B200等新品产能扩张受限,数据中心业务出货量不及预期;3)若AIGC进展不及预期,大模型训练和推理的算力需求高速增长的可持续性或降低。 买入(维持) 作者 分析师:付天姿 执业证书编号:S0930517040002 021-52523692 futz@ebscn.com 分析师:王贇 执业证书编号:S0930522120001 021-52523862 yunwang@ebscn.com 联系人:董馨悦 021-52523858 dongxinyue@ebscn.com 相关研报 惠普、慧与、戴尔科技业绩表现不一,AI服务器需求强劲增长——AI算力产业链跟踪报告(八).....................2024-03-03 ARM:FY24Q3业绩和Q4指引超预期,强劲AI需求提供增长新动力——AI算力产业链跟踪报告(七)...............2024-02-09 AMD:看好业绩24Q1触底后回升,公司上调24年数据中心GPU指引——AI算力产业链跟踪报告(六).........2024-02-01 英特尔:数据中心业务逆风致24Q1指引疲软,24全年有望修复——AI算力产业链跟踪报告(五)..................2024-01-27 美股巨头财报季序幕拉开,印证AI算力产业链持续高景气——AI算力产业链跟踪报告(四)...........................2024-01-21 AI芯片助力台积电Q3盈利超预期,消费电子需求企稳展现复苏信号——AI算力产业链跟踪报告.....................2023-10-20 要点 敬请参阅最后一页特别声明 -2- 证券研究报告 海外TMT 目 录 1、 硬件:“AI核弹”Blackwell新架构发布,硬件设备全面升级 .............................................. 3 1.1、 Blackwell新架构:单芯片性能和整体算力集群性能提升明显 ............................................................... 3 1.2、 B200 GPU:基于Blackwell架构,实现算力增长、内存升级和网络传输加快 ....................................... 4 1.3、 通信互联:NVLink+NVLink Switch+X800系列交换机,增强大规模AI算力网络传输速度 ................. 5 1.4、 单芯片和互联产品帮助打造大规模AI算力集群,实现性能跃升和能耗降低 ........................................ 6 2、 软件:NIM帮助英伟达转型软硬件平台商,积极拓展AI+机器人等应用领域 ..................... 7 2.1、 工具链:NIM打通软硬件、降低客户软件开发难度,NeMo帮助企业采用专用数据开发定制大模型 .. 7 2.1.1、 NVIDIA NIM:集成生成式AI微服务,构建软硬件生态闭环 .......................................................... 7 2.1.2、 NVIDIA NeMo Retriever:挖掘企业“数据金矿”价值,帮助客户开发定制专用大模型 ...................... 8 2.1.3、 NIM提供优化的推理微服务,已在多个领域应用落地 ..................................................................... 9 2.2、 拓展AI应用发展方向,积极在机器人和自动驾驶等领域开展合作 ....................................................... 9 2.2.1、 英伟达发布机器人基础大模型,致力于帮助AI+机器人领域实现突破 ............................................. 9 2.2.2、 自动驾驶芯片采用Blackwell新架构,英伟达在自动驾驶领域继续加强同车企合作 ...................... 10 3、 投资建议 ......................................................................................................................... 11 4、 风险提示 ......................................................................................................................... 11 图目录 图1:Blackwell和Hopper架构GPU对比,左为Blackwell架构的B200芯片 .................................................. 4 图2:英伟达历代架构算力对比,Blackwell提升明显 ........................................................................................ 4 图3:最新NVLink Switch芯片 .......................................................................................................................... 6 图4:GB200超级芯片性能参数 ......................................................................................................................... 7 图5:DGX版GB200 NVL72超级计算机性能提升明显 ..................................................................................... 7 图6:英伟达发布NVIDIA NIM .......................................................................................................................... 8 图7:NeMo微服务的整体架构 .......................................................................................................................... 9 图8:英伟达GTC 2024大会展示了迪士尼的orange和green机器人 .............................................................. 10 表目录 表1:B2