
2025年09月29日20:34 关键词 英伟达GPU架构算力光模块B系列R系列定制化芯片市场份额显存带宽GDDR7计算节点国产厂商UVCPSUVCPU U0GPU算力率能效比高价值推理内存太宽注意力机制 全文摘要 会议聚焦英伟达在GPU领域的领先地位及其对算力芯片市场的影响。首先,英伟达的通用算力芯片表现强劲,但在AI定制化芯片领域略显疲软,不过中长期来看,其通用芯片应用前景广阔。会议详细分析了英伟达新推出的B系列和R系列产品的潜力,预示其将继续领跑算力市场。 AI之光—新架构.新技术.新时代-英伟达GPU架构-20250928_导读 2025年09月29日20:34 关键词 英伟达GPU架构算力光模块B系列R系列定制化芯片市场份额显存带宽GDDR7计算节点国产厂商UVCPSUVCPU U0GPU算力率能效比高价值推理内存太宽注意力机制 全文摘要 会议聚焦英伟达在GPU领域的领先地位及其对算力芯片市场的影响。首先,英伟达的通用算力芯片表现强劲,但在AI定制化芯片领域略显疲软,不过中长期来看,其通用芯片应用前景广阔。会议详细分析了英伟达新推出的B系列和R系列产品的潜力,预示其将继续领跑算力市场。进一步讨论了英伟达GPU架构的迭代演进,从A1系列到最新一代,重点突出了算力增强、内存带宽增加和NVLink升级对性能提升的贡献。此外,探讨了GPU在服务器和数据中心的架构设计,包括GP200和GP300的详细配置及液冷解决方案,分析了这些设计对成本和价值量的影响。最后,会议展望了国产厂商在英伟达GPU代工份额的增长趋势,以及未来英伟达架构的发展潜力和市场前景,强调了英伟达在推动技术进步和算力领域发展的关键作用。 章节速览 00:00英伟达GPU架构与行业趋势分析 会议回顾了海外算力市场中英伟达的关键作用,指出其通用算力芯片产品虽短期受AI定制化芯片挑战,但长期看仍具广泛使用前景。英伟达GPU架构显示未来趋势,高端市场份额稳固,算力能力行业领先。定制化芯片虽市场规模小,但为达相同算力需大集群规模,对光模块需求量大。先发优势明显,产业链内价值量高,后续将深入讨论英伟达架构细节。 03:12英伟达芯片与服务器架构深度解析 分享了英伟达芯片从A100到B200系列的性能迭代,重点讨论了B200的算力、内存带宽及NVLink的显著提升。深入解析了GB200M1700架构,包括其核心构成、网络设计及接口配置,以及PPT板卡的面积与价值量分析。 08:58英伟达GPU架构与产业链分析 对话深入探讨了英伟达的GPU架构,特别是GP200和GP300的设计差异,包括液冷系统的改进和PCB设计的调整。同时,分析了产业链上的份额变化,指出国产厂商有望获取更多代工份额,以及盛虹、方正科技等厂商在PCB领域的订单情况。整体讨论涵盖了技术细节、成本估算和市场趋势。 13:55 CDS平台GPU架构升级与PCB价值量分析 对话重点讨论了CDS平台采用最新GPU架构,实现算力效率与能效比的显著提升,特别是单机架集成144块GPU及36颗CPU,提供81P的计算力。此外,针对长序列处理优化,单个GPU配备128GB GDDR7显存,显著增强注意力机制处理能力。在硬件层面,装备版设计升级至44层,PCT价值量预计提升三倍以上,CDS系列中PPT与PCB成为关注焦点,预示着后续业绩将持续亮眼。 18:45 AIG方案新架构信息分享会 会议介绍了AIG方案新架构信息,强调了对健康中心团队的支持,并预告了明日国产华为链、阿里云字节链的分享,邀请领导们持续关注和交流。 发言总结 发言人2 他首先对唐老师的发言表示感谢并问候了在场同学,随后深入讨论了英伟达在芯片和服务器架构方面的最新进展。他提到了此前关于瑞达热冷配套的夜冷电话会议,重点介绍了GP200、GP300和CPX的架构特点,强调了这些产品在算力、内存带宽及NVDLA升级上的技术进步。通过英伟达在AI领域的迭代,他具体阐述了B200和GD200性能的增强,包括算力和内存带宽的提升,以及液冷技术的应用。此外,他讨论了PCB设计变化对价值量的影响,特别是GP300在液冷设计上的创新。他着重介绍了CPX架构的高效能、高算力及其对价值量的积极影响,强调了关注PCD带来的价值增长和材料需求的重要性。整体而言,他的发言聚焦于英伟达在芯片和服务器领域的技术创新与市场策略,以及对未来计算能力提升的展望。 发言人1 首先代表天风监控通信团队,邀请与会者参加电话会议,并简要介绍了今天的议程。他开始概述了行业最新的观点,接着强调了英伟达(NVIDIA)在GPU架构和算力领域中的重要地位。尽管近期AI定制化芯片市场有所波动,但他认为,从长期来看,英伟达的通用芯片仍将持续广泛使用。 随后,他讨论了英伟达产品线的未来发展,特别提到了B系列和R系列新产品的推出,以及英伟达在光模块市场中的领先地位。最后,他详细介绍了英伟达架构的具体情况,包括其在高性能计算和人工智能应用中的优势,并对与会者的参与表示感谢,预祝会议顺利进行。 问答回顾 发言人1问:英伟达GPU架构在性能提升方面有哪些显著改进?英伟达B200芯片的整体功耗和设计有何特点? 发言人2答:英伟达GPU架构在性能上有大幅提升,例如B200相较于H100等系列,FP16和FP8的算力分别从989gcrop提升到了350g crop,以及从1979亿票提升到了4500亿票。此外,内存带宽显著增加,从google系列的3.4GB每秒显存带宽提升至B200系列的4.8GB每秒,并且NVNK的升级也使得多区域间通行速度和协同工作效率更高。B200的功耗设计达到了1000瓦水平,并且在硬件架构上进行了优化升级,包括但不限于核心设备、交换机、业务计算节点、互联网络等方面。整体上,B200通过精心设计的网络结构和高效的GPU计算单元,实现了高性能与高能效的结合。 发言人1问:英伟达的整体架构是如何构成的? 发言人2答:英伟达的整体架构由多个部分组成,包括GPU核心设备(如B200M17)、交换机、业务计算节点、类交换机等组件。其中,B200由两台交换机、18个业务计算节点以及相应的电源等设备构成,通过绿色互联网络实现前端、后端和管理网络的高效连接。而整个架构的设计与布局,体现了英伟达在GPU性能提升和系统集成方面的卓越技术实力。 发言人1问:英伟达在AI领域的市场份额及与定制化芯片的竞争情况如何? 发言人1答:英伟达在AI领域占据约10%的市场份额,预计未来会逐步提高到30%。虽然英伟达的市场份额可能会下降,但其在最尖端市场的份额不会减少。相比之下,AI定制化芯片的算力能力只有英伟达高端系列的约1/3或一半左右,为了达到相同能力值,定制化芯片需要更大的集群规模和更多的光模块数量,但对速率的要求相对较低。 发言人2问:PCT的情况如何? 发言人2答:PCT由36块板卡组成,每块板卡包含一个CPU,单个PT板面积约为0.07平方米。因此,整体的PPT设备有36台乘以0.07平米,价值量较高,估计在44万以上。 发言人2问:英伟达200架构及相关PCB和业务的份额情况是怎样的? 发言人2答:英伟达200架构的份额以开放为主,其中master产品厂商如保德、ABC以及双红等占据主导地位,街头市场则主要由美国的帕克和欧洲的丹斯塔比尔等代工厂商提供服务。PCB部分,GPU方面的材料主要来自海外的OIC working厂商,而BCD这边GP200的computer PPT主要包括盛虹等国内厂商。 发言人2问:ZK和GP300的设计有何特点及价值量变化? 发言人2答:ZK最初设计使用了HDI工艺,但后来改版为高多层22层设计,单价较低,在两万多一点,单平米CK大概0.7到0.08左右。而GP300设计上有别于GP200,采用小笼板结构,GPU和CPU各自拥有一个小龙板,接口数量增加。液冷层面,GP300价值量可能接近10万每天,PCB出现更多拆分,采用OAM和UDB架构,其中OM部分为22G5G23层五阶HBI材料,面积接近0.02平米,单价在两万多到3万左右每平米。 发言人2问:对于GP300产业链份额的变化趋势是怎样的? 发言人2答:预计国产厂商将获取更多份额和代工机会,尤其是在PCD领域,之前盛虹在computer上有较大份额,现在方正科技等厂商也开始接订单并获取增量份额。 发言人2问:CPX架构有何特点和优势? 发言人2答:CPX架构集成了GPU、CPU等组件,具备极高算力能效比,系统单机架集成144块GPU、36颗微软CPU,并配备100GB高速内存,适合长序列高效处理优化。此外,单个GPU显存升级至高达30 cox的IP4计算能力,并在注意力机制上带来三倍处理能力提升,显著增强模型训练能力。 发言人2问:Robin系列的变化体现在哪些方面? 发言人2答:Robin系列的算力显著提升,配备128GB GDDR7内存,带宽达到两个亿每秒,并针对婚礼创意进行了优化赋能。硬件配置上增加了mobo CPS芯片,形成集成系统,同时带来了VVS9网卡接口方案。液冷方面需要配置更多冷板和接口提升,整体价值量因功率提升和PCB等方面的变化而增加,特别是装备版设计采用44层架构,单个PPT面积可能达到0.12到0.14平米,价值量是之前GD300的三倍以上。 发言人2问:CDS系列中PPT、电脑及BD部分的变化有哪些? 发言人2答:CDS系列中,PPT和电脑部分有较大数量的关注点,例如PPT的增量主要是装备版设计,采用44层架构,价值量显著提升。BD部分可能采用26层3烧结工艺的高多层背板方案,这也意味着PCD的价值量将进一步提升。后续将持续关注PCD进展以及核心PPT厂商业绩表现。