您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:AI算力产业近况更新 - 发现报告

AI算力产业近况更新

2025-04-21未知机构杜***
AI智能总结
查看更多
AI算力产业近况更新

2025年04月21日 22:32 发言人1 00:10 大家好,欢迎大家参加AI算力产业近况更新的线上会议。本次会议面向华泰证券签约客户及受邀客户提供研究交流,所有信息及观点不构成投资建议,请所有参会人员务必阅读相关页面展示的完整免责声明。未经华泰证券及参会嘉宾事先书面许可,任何机构和个人不得以任何形式将会议内容及相关录音教的文件进行转发、转载、传播、复制、编辑、修改等。如有上述行为,我们将保留一切法律权利,感谢您的理解和支持。目前所有参会人员均处于静音状态。下面有请主讲老师开始发言,谢谢。 发言人1 00:55林老师,您可以发言了。 发言人2 01:00 各位好,我们今天主要的更新内容,主要就是把算力产业的一些情况去做的一个讲解。从最近发生的一些产业变化来看的话,我们觉得主要两块板块是海外的进展,一块是国内的变化。从海外来看的话,大家可能对关于S20这个话题会比较关注一些。因为在上周的话,其实英伟达对这个界面的事情也做了一些回复。提到就是说后续如果想要向中国,包括其他这些第一步的国家进行Q20或者等硝酸类的芯片进行出口的话,那需要取得美国政府相关的授权许可。然后这个许可的话可能会是一个无限期持续生效的这么一个结果。那么基于对这样的一个许可的判断,就是因为他在第一财报第一财第一财季,制造业里面可能会继续大概55亿美元左右的一个这么一个关的费用,包括工程减持,包括违约赔偿,所以对于这样的一个界面的解读的话,大家认为我们会倾向于来说您后面在国内的出口会受到一定的限制。 发言人2 02:20 虽然官方对这个问题的表述,是说需要取得一个美国政府的一个许可证,但实际上我们从之前的这些实践经验来看的话,这个许可证其实是比较难去获取。就包括22年和二三年都发布过类似的新能源法案。我们当时其实也是有这个许可证的一个表述。比如说二三年当时对大牌系列的产品做了一个许可要求的这么一个规定。但是后来的话其实我们也知道,这个世界上其实就是坚硬的这么一个概念。 发言人2 02:58 那这个事情的话,我们觉得可能还是有一些变化的一个可能性。包括二年和二三年的这两轮制裁,其实更多的还是都是发生在拜登政府执政期间的这么一个政策。现在的话,考虑到我们现在所处的这个国际格局,包括这个环境,我们认为这个零幸运可能只是谈判的筹码之一,所以后面也有可能再去围绕这个许可证去做一些像就可能的一些调整。但是对于国内的一些厂商来说的话,我们觉得确实还是会产生一定的影响。因为毕竟包括英伟达在内都已经把这个问题作为一个前置来做了,这还是处理,所以可能还是有一定的出货的一个受限。当然我们跟这有点草拔下来的一个情况,大概是目前已经下订单了,已经整整个地交后的这部分产品,其实是不会受这里面的影响。 发言人2 04:07 那更多的受影响的部分,可能是还未签订合同,以及说意向合同的这部分订单,本身就是已经交过这个定金,包括已经下定的部分的话,那还是可以正常的在这个期限之前去进行一个交互,所以这个是目前的一个影响。但是对于这些ODM厂商来说的话,后续能够取得这些还需要您的可能性,其实就是会受到许可证的一些制约。对于国内的像客户来说的话,因为今年是国内的大厂BAT自己阿里腾讯云销售资本开支的一个重要的,我们看到他他准备投这么多的信贷开支,那一方面就是。这么一个情况。所以我 们认为可能对于国产芯片来说的话,会有一个更大份额的一个权益。也就是国产芯片的市场的交易率可能一个更好的一个提升,那在国产芯片的这个范畴里面的话。 发言人2 05:27 包括像OPPOa系,包括像MG包括海那,我们近期看到有变化的可能还是在升腾的这个方向,就相当于。那是指一个超节点的一个方案。那这个方案的话其实搭建的一个思路就是通过更多芯片的堆叠,从而实现对2 72的这么一个系统机架性能的一个超越,更多是做这个整体岸上的一些创新。 发言人2 06:02 那从这个支架的方案来看,我也做了一个稍微的整理和展开了。首先是这个最低,这次是一个超级点,其实就用到生成最新的这一个920C的一个新品,那这个实际上也是有预期,就是今年会是9207的一个主要收获的一个节点。这个芯片的话其实讲白了底层的这个心理,就是集团那个大其实还是基于传递,只不过他用了一个类似于英伟达B200的1个分割的方式,把两个心力去做一个合作,一个一加一的一个效果比较好。这个算力可以有一个接近三倍的一个三倍以上的这么一个增长。 发言人2 06:47 从这个结果上来看的话,我们一方面是跟。是跟对同类的这个产品去做一个比较,这里面看到首先是跟华为自己的一个比较,就是跟前代是910D相比的话,那目前我们看到是披露的是这个16位算力,在行动上也会比较大概就是增长一倍的这么一个关系,主要是前面讲到双星互联的一个低点的方案。然后另外就是包括像这个显存的带宽,都是有一定的提升,主要得益是用了更大的去变化。这个的CDM会比之前的这个910B端要大一倍,就从64GB变成128GB的这么一个。然后比如说在跟内存交互的这个速率会有一个更好的提升,用的还是CDM2E的这么一个版本。CDM3的话可能还没有能够去用到说这个方案上面。 发言人2 07:57 然后就是再往下就是关于这个货源的部分,其实在主要这上面有一个比较大的一个改善。因为在做B的时候,其实就已经好像是把自己的一些东西会员技术用在这个主板上面。但是当时主要面对这个时期的话,主要还是GB的这个总带宽,392GB的一个带宽的一个版本。其实这是一个聚合带宽的话,真正不应当两卡互联的话,可能就是56GB左右的一个速率。这会使用到卡间互联这个速度上,也有一个再次的一个升级和改进,变成350GB每秒,最快的话大概也是有一个6到7倍左右的一个性能的提升。这个其实对应的就是大家可能看到比较多的2.8TB每秒的一个速度,其实是大B跟小B之间的一个转换关系。转换成大B的话,它就是350GB每秒的一个速度。在这个时间它自己的一个比较,包括性能,包括带宽连接的速率都有提升。 发言人2 09:01 然后如果跟瑞塔去做一个比较的话,这里面我们觉得其实很多地方是跟那个GB200提出了一个新闻对比。但我其实跟这个亚马逊的对比的话,反而可能会更客观一些。因为他CPU加PPU的话是一个单纯双心力,PPU的话那就是应该跟这两党去做一个讲,这利用这个数据有一些挫折,核心的这个强还是跟这个必然把持做性能的对比。比如像在XP16的算力上面的话,保险公司大概是787.3亿,然后大概是4.5G的一个单卡。单如果跟英伟达去比的话,目前其实还是有一定的性能调差,大概也是一个5到6倍左右的一个单卡性能的一个差距。那么考虑到它互联网带宽显示容量的话,整体之后性能差距其实会比这个倍数还要更大一些。所以其实910C虽然是跟TCB有进步,但是跟英伟达的这个经济上面相比的话还是有差距。可能还是对得了英伟达这个钱的这个识别,可能会是一个更更客观的一性能比较的一个水。 发言人2 10:22 然后另外就是说看到这个芯片的设计的方案,其实也是在发生一些变化。主要的变化就是来自于做了这么一个双芯粒互联的这么一个版本。这个思路好,但是跟B环岛的这么一个说法是类似的,都是通过双星的可分中间加入这个操作芯片,来做的这么一个芯片的一个设计。 发言人2 10:46 这里面其实比较重要的一个部分,可能技术难度比较大的一个地方就是在于怎么去做两个新密之间的这个桥接的芯片来做。它是用自己的这个NVHDI技术,它是可以实现目前业界最快的双十一互联的速率,就是TB每秒的一个互联的速度。活920C的话,目前我们了解大概都是4TB左右的一个最高的一个理赔速度。所以跟万达相比的话,就是在单芯片的这么一个链接上面,其实也是有一定因为他本身单卡的或者单心率的这个算力也是比英伟达的更低,所以CCD对于他来说的话,应该也是一个足够满足这个芯片内源和星币互联部分的一个。 发言人2 11:34 后其实我们也看到为什么关注生产这个方向?因为它可能也是今年我们觉得整个出货量市场规模变化比较大的这么一个。因为从去年开始的话,它主要是做这个9ND相关产品的一个收货。我们测算下来的话,大概是去年30到40万件左右的一个出货量。美方的一个单位来算的话,去年大概是410多的一个市场规模进来看的话,我们预计是90C和90B大概是各占一半的这那总的这个芯片出货量大概是在70到80万张。如果对应到这个带的数量的话,大概是7120万张,120万张左右的一个流,这个市场规模的话会比去年大概增长145%,就是三倍以上的这么一个增长的变化。所以关于这个出货量的话,我们觉得也是比较可观的一个增速的这么一个表现。 发言人2 12:37 然后你比如说再回到关于最新的那个超级远的方案有什么新的变化,什么不一样的地方,我们也做一个大致的这么一个审议。这次这个方案的话,其实也看到一些文章,就可能会把它跟这个GBLI的PCR去做一个比较。但其实只是说它从性能上可能会可以去跟这个CBM来去做一个对标。但实际上从这个书面方式来看的话,我们觉得还是有比较大的一个区别,它更偏向于是传统的这种以光为主的style的网络。跟这个GP版本相比的话,对铜的使用其实有有比较大的一个区别。导致说它市场的一个组网结构在组网的效率,包括比如像光电的这个选择效率,其实都是有比较大的一个差异。其实更像是传统的全国的一个组网的方式,也就是一个WTX时代的这么一个组网网的一个方案。 发言人2 13:39 但是从市场上来看的话,确实是可以对标到韦达最先进的这个GP蓝板的这么一个能力所以就是走了一个用芯片数量以量来换性能的这么一个路线。也就比较差的话,他这次是用到了384张卡来实现的一个节点的一个组合。然后这个200的话其实就只有42万卡的。就是芯片的这个比例的话,大概是五倍左右的一个配置的数量。然后从这个效率来看的话,如果看P16的话,这个阶段可以实现300G的一个P10硫酸力。对,因为2GV200的话大概是180T的一个算力。这效率的话大概是因为达到这个1.7倍。所以说通过五倍的一个芯片用量,实现了一个大概1.7倍的一个效率的一个提升,所以这个是,他想要去做的一个效果。 发言人2 14:31 那对于其他的参数上面的话,其实都是有一定的进步。包括HMHBM的总容量、总带宽,其实都是随着芯片规则的量的一个增加,有一个更大的一个提升,对GB200的一个超越。但带来的一个结果就是说因为是一个以量来换性能的一个模式,所以使得总的这个支架的功耗,占地的面积,然后包括这个单位算力单位卡的工号,其实都会有一定的更大的一个损耗。这样的一个结果可能也就是在国内这种特定环境下面,可能还是比较合理的这么一个选择。 发言人2 15:11 如果不考虑这个工耗预算,我们又怎么去实现这个大算力的这个方案的话,华为其实是给过这么一。从这个大概的一个概念图上,其实我们也可以看出来,整个方案是在设计产品比较激进的。就是光为了去实现这样的一个性能表现,所以去配置一个非常庞大的一个绩效的一个技术。这里面不只是我们讲的这个算力的服务式的地价,也包括外部的做交换计价。整个方案大致是包括了12个计算机架,再加上中间的四个交换机架,一共16个机架来组成的这么一个节点的集群。 发言人2 15:58 这个方案的话跟我们熟悉的,比如像英伟达这个GB200相比的话,其实是有很大的一个区别的。大概就是一台之家的这么一个降低空间。但是我们需要用这么大一排的一个空间来换同样的一个新的。 发言人2 16:15 这样的一个做法,其实在英伟达前面的这个就是和这个43万其实会有看到类似的一个做法。比如像志月还有全览,这就是一个类似于这样一个配置的方式。当时也是说英达用16个算力机甲,加上2到4台的交换机架,来实现这个机型的一个配置。然后从这个配置思路上来看的话,我们这个跟这个GH要来可能会更像一点。都是把服务器为基本单元的一个配置的一个方式。但是跟这个跌跌打打的就还是有一定的调差。 发言人2 16:52 目前像NVGPMMVR那个NVR版本的话,在最高是可以实现576张卡的一个全互联。现