您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:GTC大会看点总结20250319 - 发现报告

GTC大会看点总结20250319

2025-03-19 未知机构 张博卿
报告封面

2025年03月19日20:59 关键词关键词 AI算力黄仁勋东吴证券陈海静集体大会GPU B300 CPU数据中心推理需求生成式AI agent AI物理AI英伟达flops指数级增长开源模型闭源模型机器人 全文摘要全文摘要 演讲者总结了黄仁勋的主题演讲,强调了2025年前算力投资机会及AI市场扩张对算力需求的推动,预估需求将持续指数级增长。演讲中提及多款新硬件产品,性能和算力有显著提升。推荐标的包括受益于新技术的沪电股份、景旺电子,以及光通信板块的相关公司。 GTC大会看点总结大会看点总结20250319_导读导读 2025年03月19日20:59 关键词关键词 AI算力黄仁勋东吴证券陈海静集体大会GPU B300 CPU数据中心推理需求生成式AI agent AI物理AI英伟达flops指数级增长开源模型闭源模型机器人 全文摘要全文摘要 演讲者总结了黄仁勋的主题演讲,强调了2025年前算力投资机会及AI市场扩张对算力需求的推动,预估需求将持续指数级增长。演讲中提及多款新硬件产品,性能和算力有显著提升。推荐标的包括受益于新技术的沪电股份、景旺电子,以及光通信板块的相关公司。同时,强调了NVIDIA在推动AI计算基础设施增长方面的作用,对其对AI市场和算力需求的乐观预期表示认同。 章节速览章节速览 ● 00:00东吴证券电子首席陈海静:东吴证券电子首席陈海静:AI算力需求指数级增长,关注算力需求指数级增长,关注B300高通版及高通版及PDFE成长空间成长空间东吴证券电子首席陈海静在关于集体大会的总结中指出,AI领域尤其是agent AI和物理AI的市场需求增长,将推动算力消耗呈指数级增长,行业整体空间广阔。她强调,尽管面临预训练撞墙等挑战,行业并未停滞不前。短期市场关注的GP300如饼288及CPU等产品发展符合预期。陈海静推荐关注受益于B300高通版放量的互联股份,以及受益于PDFE成长空间的解放电子生意。此外,光通信板块中的旭创新易盛、天福太阳光和沃尔和彩等企业也值得关注。 ● 01:50电子板块新硬件产品预期与规划电子板块新硬件产品预期与规划针对电子板块,特别是服务器硬件领域,新推出的产品GB300(blackauto )预计在今年下半年推出,符合市场预期。GB300芯片及计算托盘计划于五月份开始生产,系统预计在Q3扩大出口规模。另一产品RubinNL144预计在2026年下半年推出,由两颗800平方毫米的B100芯片拼接而成,因其特殊设计,被命名为ML144。 ● 04:04 Robin L144和和Robin OM1576的性能提升与技术特点的性能提升与技术特点RobinL144和RobinOM1576两款产品在与现有MVR72 基础设施兼容的前提下,对性能进行了显著提升。RobinL144的MP4推理能力和F8训练能力分别达到3.6亿flops和1.2亿flops,相比GB300提升了3.3倍。内存带宽方面,3T每秒的HBM4内存和75T快速内存比GB300提升了60%,同时alink 6.0和C叉9功能提升至2倍。Robin OM1576则在2027年下半年推出,其FP4推理能力和MP8训练能力分别达到15亿flops和5亿flops,整体算力性能提升了14倍。此外,4.6个B的HBM4内存和365TB快速内存相比GB300提升了八倍,NVL link和C叉9能力分别提升了12倍和8倍。 ● 07:17公司推出新型公司推出新型CPU交换机与交换机与AI电脑电脑公司近期推出了支持以太网和IB网的X和MX系列CPU交换机,能支持数百万个GPU的AI 工厂,有效降低能源消耗和运营成本。预计IP网的MXCPU交换机将在今年晚些时候上市,提供高达115TP的带宽。此外,两款AI电脑DJXSpark和EGXstation也已发布,采用高性能芯片,其中DJXSpark外形类似MacMini,而EGXstation体积更大。DJXSpark已开始接受预定,预计未来几个月内上 市,EGX station则将在今年晚些时候由华硕、戴尔、惠普等合作伙伴发售。数据中心硬件方面,B200芯片已全面投产,B300芯片将在今年下半年推出,而2026年将推出更高带宽的CPU交换机和采用新架构的基础设施。 ● 09:59华为对华为对AI产业的展望与发展趋势产业的展望与发展趋势华为将AI的发展历程分为四个阶段:意识AI、生成式AI、Agent AI和物理AI。意识AI 着重于信息感知与理解,如自动驾驶感知系统和语音识别。生成式AI基于大量数据训练,能创造出全新内容,如ChatGPT。Agent AI具备自主性与代理能力,能根据用户指令自主决策和行动,如Siri的会议提醒功能。物理 AI侧重于AI在物理世界的应用,如工业机器人在自动化生产线上的操作,通过AI技术提高生产效率和质量。 ● 13:28黄睿轩对黄睿轩对AI算力需求的展望及复杂推理模型的挑战算力需求的展望及复杂推理模型的挑战在AI时代,复杂推理模型带来的算力需求远超预期,对比简单的生成式语言模型,复杂推理模型在面对复杂问题 时需要更多的计算资源和时间,计算量可达简单模型的100倍。为了提高计算速度并保持准确性,需要通过强化学习优化模型并生成可验证结果,同时平衡效率、成本与准确性。英伟达推出的开源软件通过技术创新,如解耦预填充和解码阶段、动态调度GPU和优化KV缓存,显著提升AI模型的吞吐量和效率,使复杂AI模型能像简单聊天机器人一样快速响应,同时保持高准确性和可扩展性。 ● 17:33英伟达对未来算力需求与机器人技术的展望英伟达对未来算力需求与机器人技术的展望英伟达对于未来算力方向的判断聚焦于推理需求的增长和战略消耗的推动,特别是AI 计算基础设施正处于增长的转折点。预计到2024年,北美四大云服务商的H卡采购量将达到约130万颗,到2025年,B卡的采购量将增至约360万颗。此外,预计到2028年,数据中心建设投资的资本开支将超出1万美金。团队认为,推理需求将呈现指数级增长,尤其在开源与闭源模型各出现领军者后,增长速度将更为迅猛。同时,英伟达在机器人领域也展示了诸多亮点,包括使用仿真引擎和数字孪生技术训练AI,以及与谷歌、迪士尼等合作开发物理引擎,以提升机器人的触觉和灵活性。 ● 20:51东吴电子团队:东吴电子团队:AI与物理与物理AI市场前景及核心推荐标的分析市场前景及核心推荐标的分析东吴电子团队强调了AI和物理AI市场未来持续增长的前景,指出行业空间广阔。短期内,市场对GB300 0288 及CPU的关注符合预期。团队核心推荐受益于B300高通量高通版放量的沪电股份和受益PDFE成长空间的景旺电子。此外,建议关注光通信互联领域,如光模块的徐创新盛天府,以及CPU的太阳光和充电机的沃尔克。随着NV链调整后,比单买上量和Robin放量时间点的明确,建议投资者持续关注。投资者若有进一步问题,可联系东吴电子团队。 问答回顾问答回顾 发言人发言人问:在黄仁勋凌晨的集体大会主题演讲中,关于问:在黄仁勋凌晨的集体大会主题演讲中,关于2025年或未来两三年算力方向的投资机会,你年或未来两三年算力方向的投资机会,你们的们的核心观点是什么?核心观点是什么? 发言人答:我们的核心观点认为,在agent AI和物理AI市场扩张的推动下,推理侧的需求增长将指数级推动算力消耗,整个行业空间依然非常广阔。不会因为预训练遇到瓶颈或其他悲观预期而停滞不前。短期市场关注的GPU(如H300、G300)和CPU板块的内容基本符合预期。 发言人发言人问:针对电子板块,特别是服务器硬件领域的最新动态,有哪些超预期的产品或进展?问:针对电子板块,特别是服务器硬件领域的最新动态,有哪些超预期的产品或进展? 发言人答:关于GB300产品,即之前所说的blackauto,预计今年下半年推出,符合市场预期。此外,黄仁勋还提到了RubinNL144产品,它将在2026年下半年推出,拥有显著提升的性能参数,如3.6亿flops的MP4推理能力和1.2亿flops的F8训练能力,比GB300ML72的算力提高了3.3倍,并且在内存带宽、互联方案速度等方面也有较大提升。 发言人发言人问:对于即将推出的问:对于即将推出的Rubin 288以及其具体性能表现有何了解?以及其具体性能表现有何了解? 案,其中288通过四个方盒子排列,每个包含36个计算版,整体性能相比GB300有巨大提升,具体表现为15亿flops的FP4推理能力和5亿flops的MP8训练能力,整体算力性能比GB300M1 72提升了约14倍,同时在内存带宽和网络互联能力上也有显著增强。 发言人发言人问:在问:在CPU方面,该公司有何新进展?方面,该公司有何新进展? 发言人答:公司推出了以太网X和IB网的codeMXCPU交换机,能够支持数百万个GPU的AI工厂连接,大幅度降低能源消耗和运营成本。其中,IB网的comxCPU交换机预计今年晚些时候上市,提供高达144个基于800G IB网的端口,最高带宽可达112 115个TP以太网4X的CPU交换机则计划在2026年上市,提供102个TB和409个TB两种带宽配置的产品。 发言人发言人问:黄永轩还发布了哪两款问:黄永轩还发布了哪两款AI电脑及其特点?电脑及其特点? 发言人答:黄永轩发布了两款AI电脑——DJX Spark和EGX station,它们均采用black world芯片,其 中DJX Spark采用GB10芯片,外形类似mac mini,而EGX station体积更大,内置GB300WA芯片。DJX Spark本周二开始接受预定,预计未来几个月内上市;而EGX惠普等合作伙伴开始发售。 station将在今年晚些时候由华硕、戴尔、 发言人发言人问:对于数据中心硬件方面的展望,有哪些符合预期的发展情况?问:对于数据中心硬件方面的展望,有哪些符合预期的发展情况? 发言人答:整体来看,数据中心硬件方面的发展基本符合预期。B200芯片已全面投产,B300将在今年下半年推出;2026年下半年会推出Rubin m11144基础设施,与black war m11 72兼容;预计计算托盘、交换托盘的架构配置以及光通互联方案将保持相对稳定,并将在2027年下半年推出采用正交背板互联架构的Robin to m1576。 发言人发言人问:关于问:关于AI产业的发展历程和未来趋势,黄仁勋有什么展望?产业的发展历程和未来趋势,黄仁勋有什么展望? 发言人答:黄仁勋梳理了AI的发展历程,预计我们即将进入A型AI时代,紧接着将是物理AI(即机器人的时代),这是对整个AI产业未来发展趋势的重要展望。 发言人发言人问:意识问:意识AI主要指什么,有哪些应用场景?主要指什么,有哪些应用场景? 发言人答:意识AI主要是指人工智能对各种输入信息的感知和理解能力,目前能够处理视觉、听觉等传感器数据,例如通过摄像头、雷达感知并识别周围环境中的道路、行人、车辆等物体的自动驾驶系统,以及常见的语音识别技术。此外,生成式AI如ChatGPT、kimi豆包等基于大量数据训练,创造出与涉猎数据相似但全新的内容。 发言人发言人问:未来的问:未来的AI发展方向是什么?发展方向是什么? 发言人答:未来AI将侧重于在物理世界中的体现和应用,结合人工智能与物理设备、机器人技术,使设备能更好地通过AI技术感知决策并与物理环境交互。例如工业机器人在自动化生产线上应用,通过安装传感器和AI控制系统实现精准抓取、装配和搬运零部件,提高生产效率和质量。 发言人答:AI推理的计算需求在未来会显著增长,复杂推理模型相较于简单生成式语言模型需要更多计算资源和时间来生成准确答案。因此,未来AI业务需要更高效的解决方案,通过强化学习优化模型并在保证准确性的前提下减少不必要的计算和资源消耗,同时在准确性与速度之间取得平衡,并考虑效率与成本的最优解。 发言人发言人问:英伟达在提升问:英