2025年09月19日 17:15 发言人1 00:00 谢助理,感谢各位投资人在今天下午收盘后跟我们一起来讨论,近期关于国产专利的一些变化。我是中信证券的首席科技产业分析师许英博。今天在线的还有我们相关的各个行业的分析师的同事。最近我们看到了一些非常明显的变化,就是来自于整个国产算力的一个正向的超预期的这么一个变化。今天上午华为在自己的全联接大大会上,徐志军总也发布了未来的一个三年的产品计划。而且计划之详细,且未来的进取目标相对是激进,还都是让我们觉得很超预期的。所以今天我们开了这样一场电话会来跟市场沟通。我们在上午的会上看到了哪些,听到了哪些,以及我们从中长期战略的角度怎么去理解国产算力的一些变化。 发言人1 00:51 除了华为之外,最近各位投资人也能看到,昆仑芯中标了中国移动的这个订单。对于百度的关注市场进一步起来,以及下周阿里的云栖大会,也会提到平头哥和阿里的自研的芯片的这个体系。包括最近我们在外媒上也能看到外国投海外投资人,对于阿里自研芯片的这件事情的关注度也是越来越高。所以总体上来讲,市场从之前对于国产芯片,对于英伟达链的海外芯片的这条链上的高度关注,到目前对于国产芯片的链会出现一个中长期的战略关注。我们也是非常看好中长期整个中国国产芯片的自主以及市场空间的成长。 发言人1 01:39 所以今天我们会从这个地方做讨论,当然我们也看到今天市场,尤其是在下午的时候,会有些冲击和波动。这里面其实因为前期相关的公司,确实累积了比较大的一个涨幅和获利盘。但是我们更希望寻找的是说,长周期有机会的。经过了一些波动和变化话,还依然能够有机会以及新的技术迭代带来的未来的新的成长空间。现在看起来某些业务在一些公司里还比较小,但是将来这些业务有可能会长大。所以首先我们有请计算机的首席分析师杨泽元,把今天的这个具体的情况和我们对算力的总体看法,给各位投资人做一个汇报。有请周远。 发言人2 02:24 好的,感谢英国总。各位尊敬的投资人,大家下午好。我给大家汇报一下今天华为的发布会。其实大家从各种公开渠道也能看得到,其实公司在整个算力这个大的板块上,不管是在具体的计算卡的能力上,在互联的能力上,在存储的自主能力上,在整个集群的能力,就是算力的方方面面,其实做了一次非常全面的展示。接下来我们的各位同事们也都会针对这些展示去做详尽的解读。 发言人2 02:53 首先我们看到的是一个全面的能力的展现和路线图的规划的共享。通过这个里面大家能看到,在一个其实现在从资本市场,从各个环节能看得到机会非常大的一个市场里面。华为跟大家去share了他自己未来的打法思路。我们也尝试从这个打法思路里面去做解读。我先做一个抛砖引玉。在不管是算力存力网络互联集群,我们接下来同事们都会讲到的。同时我简单点几个或者分几个分享几个我们我能看到的看法。 发言人2 03:23 首先就存就主要的这个卡的路径,大家在各种媒体报道已经能看得到。从之前大家耳熟能详的今年开始出货的910C开始,华为直接开始跳到了叫申腾的9950PR包括950DT2个版本,一直到27年的960到28年 的970这个路线图,包括这里面的带宽、微架构、算力、内存,其实都做了详尽的展示。我们不去机械的去再去念一遍这个参数,但是我们可以给大家分享一下,我觉得值得关注的几个点。 发言人2 03:53 第一个看点就是说这里面的一个技术路线的或者叫微架构的一个调整。从表观来看,大家能看得到是华为有说他从SMD到SM到SMT去做这样的一个切换。如果大家了解这个呃计算机的微架构,包括微处理器的架构,大家要了大家其实应该比较熟悉。 发言人2 04:15 其实T这边主要代表线程对吧?SMD的阶段其实它是一个简单相对简单的基于数据端的这一个控制。它对其实它不太强调现成的概念,而SMT是相对于SMD来说明显要更复杂的一个微架构的体系。它需要通过把一个单一指令去拆解,拆解成并行的超多。通过硬件结构去拆解到有超多个并行的硬件框架去执行各类的线程。也就是说它的整个控制是更加复杂的,而SMD的控制是相对简单的。也就对应来说常见的而言,在不管是CPU中或者是NPU中,其实大家可能比较常见SMD这种相对简单核心就算了,你把指令给大家算就行。 发言人2 04:59 而在过往的像GPU这样的硬件框架之中,其实会比较多的用到SMT这样SIMT这样的微架构的这样的一个体系。也就是说也就是说它整个整个它的通过对单一指令下达之后,它会把它拆解。通过它的复杂的控制单元,拆解的比较多的各种类型的计算单元去做一个分布,而且快速的执行。这个是常见以英伟达为代表的GPGPU基本上都采用SMT的架构。 发言人2 05:29 首先这个背景和过去CPU段内有个SMT的概念是tennis smart thread,也就是同步多线程有相似之处,但不完全一样,通俗的讲就是这样的一个区别。但是除了这个技术概念,我们要理解技术概念背后的一个变化。也就是说大家其实现在看国内的这个或者海外的全球算力,大体上两条路线还是比较清晰的。一条是DSC或者asic为代表的,能够很好的降本,有比较高的峰值算力。但是在这个在与NV的生态兼容性上稍微有些不一样的这样的这这样一种路线。也看到了以AMD为代表的这种跟NV追求强兼容。不管是在硬件架构SMT,包括它底层的算子的规划布局,包括上面的扩大和我之间的相似性,追求一个强兼容。这两种路线大家都能看得到。 发言人2 06:15 而我们在这个包括公开的华为这次公开的路线图能看得到。在910C及以前,整个华为是以DSA这种路线为主力产品路线的。但是通过这次的发布,大家看到华为在做一个其实很多跟踪产业很紧密的同朋友们应该之前也有所耳闻这个事情,在做一个技术架构的调整。从我们可以看到,从这个架构来看,可以说从更像DSA架构变成了更像这个GPGPU架构,或者说更追求于跟NV的一个强兼容性。这是一个比较大的一个技术架构的变化。这个架构的变化其实进而带来一个大的在价值主张上的区别。 发言人2 06:58 也就是说因为这两边的路线,我们一会儿有很多同事会提到,我们去做展开了。这两个路线背后它主打的就是每每一条技术路线是没有优劣的,只有一个取舍,就是强兼容路线。它追求的不是说单点的这个峰值性能一定要明显,要甩开GTAGPU。不是这样的,他追求的可能更多是跟主流生态这个强电容。但是这个就像我刚刚讲SMT的技术概念一样,它会在硬件控制上做很多复杂的设计,使得它的整个架构端 和NV会更像。但是放弃了去拔算力的拔峰值算力的面积。因为它用很多面积来做复杂控制,简单讲是这个意思。所以这是一个取舍,没有对错。 发言人2 07:39 但我们看到华为做的这样的一个选择,而且它公布的几个关键产品里面,从比如说这点形象,2026年的两款产品我着重讲讲,一个是950PR1个是950DT。今天出来很多朋友们也在讨论这两款产品它背后的这个定位和区别。其实我们现在的理解当然还在等官方进一步的。且我们从我们的理解的角度来说,950PR其实是因为现在从整个大模型部署到算力端,其实以dc为代表,一方面在做EP的并行,一方面在做preview和decode的这个分离,也就是PD分离。PD分离对于提升整个计算体系的效率费用非常有帮助的。我们初步的判断,华为明年的两款950PR和950DT本质上就是在做一个PD分离的产品。 发言人2 08:25 也就是说950PR它是更偏prefer这个环节。其实典型的特点就是preview的环节,它对于带宽的要求是没有那么高的,而他对于算力的要求相对来说会高一些,所以我们看到而像地信,其实就是完全反过来的,他对带宽的要求比较高。所以我们看950的PR的,它的这个内存的大概也就是在1128GB,然后大概1.6T每秒的这样的一个带宽。而950DT它不管是在容量上还是内存带宽上都有很大的提升。这个背后其实也就和decode两个的这样的一个定位的差别,这是一个点。 发言人2 09:05 第二个技术上的细节,我们补充的就是说我们整体能看到的就是说950PR可能会和920C包括910C大家也都知道,应该是一个双带和风的一个910B在做了一些调整。950PR应该从我们预计的角度来说,可能会和910C包括之前910B的这个线性一贯性会有更大的一贯性。而到了950DT也就是说26年Q4出的这个版本,应该是从不管是在硬件架构上,在这个软件生态上,应该会和整个NV的这个GPGPU的这套,不管是软件还是硬件上会有更大的相似性。这个其实和我们之前跟市场做交流的相关的产业节奏预期,包括华为改款的节奏的预期基本上是一致的那我们看到了在架构上的调整,在产品和产品定位上的调整。我们还有一点也看到了一个就是说他在比如说大家如果看的比较细,会看到它在支持的数据格式上,其实也有关键的新增。 发言人2 10:00 这里面除了大家业内通用的看到的BBF16FP16FP是88之外,有几个典型的点。一个是MXFP8,是作为FP8的一种特定版本,为了去加速科学计算,把乘法变成加法的这样的一种设定。这个NV也有他也有之外,其实大家还看到有一个这次单独公告的HIFP8。这个版本应该是按照我们自己guti的角度来说,很有可能是华为自己定义的一个特定的FP8版本。而且从概率的角度来说,这个会有比较高的概率。可能是大家在之前DPtake的一个更新公告里面看到的UE8M0的这个FP8格式。也就是说通俗的讲,UE8UE8M0这个FP8是MXFP8的一个子集,MXFP8是FP8的子集。而英伟达做了前面两个,而hifb8或者说叫U18M0有可能或者概率比较高,是我们国产算力和模型公司共研共创的一种针对国内的特点的一种格式。 发言人2 11:01 这个也就是第三个技术细节大家可以关注的点。当然这个细节很多,今天时间有限,我们我们后面有非常多专业的同事分享,我不再接触细节去做过多的展开。我只是提示几个重点值得大家去关注。而这个重点我们更多要share的两个结论是说这个重点背后体现出什么?体现出第一个事情,我们分享的就是说整个华为的创新迭代能力是非常的快的。 发言人2 11:23 因为大家都了解,之前可能产业内对于包括像910C的一些测试的反馈,包括的一些进展。我们看到华为在快速的围绕市场的反馈,就客户的反馈去做了内部的迭代。内部的迭代就是说我们现在看到的预期,从我们自己的预期来说,950这款产品应该不是一个和风的产品。当然我们现在只能说应该不是一个和风,最终还得等和风的判断。他应该是做了微架构迭代之后的一个版本,应该暂时不是和风的。但是即使不是合同,我们也能看到华为的整个算力实现了接近于每年翻倍的这样的一个算力能力的提升。 发言人2 12:05 同时这个背后不管是市场,现在包括英伟达也在做的,因为之前的这个CPX的这个产品,其实也是为了满足传统的NVA的产品价格,相对来说会高一些。它专门针对基地分离去做了一个满足preview环节的一个CPX的产品,对吧?华为也在做这样的产品,也就是说国内头部的厂商或者全世界头部的厂商在创新迭代上非常快,同时又因地制宜的。不管是在数据格式上,我们看到有high FPFP8、IF8这样的格式也好,包括你看华为的这个950PR版,它在128GB1.6T我有可能概率比较高。他用的是ddr这样的存储的这种方式也好。我们看到顶尖的厂商都在一方面叫因地制宜,根据各自的存储可能性制成可能性在讲调整。 发言人2 12:54 同时也结合客户的需求PD分离一批并行也好,再做别的,那也就是我们的第一个结论,就华为的创新迭代能力是非常强的,非常体现出的确是一个非常优秀的公司。但大体上来说,第二我们补充就是它的这个还是在华为这个点上,它的创新迭代能力的节奏来说,目前应该还是整体符合之前跟的比较紧密的产业的预期。也就是它的950D7版本。也就是说我们理解就是通俗语言讲纯GPGPU架构。和NV非常像的这样的一个不管硬件和软件的非常像的这个版本叫NV的标准产品,就是NV的高端标准产品,非常非非常非常像的产品。应该是26年Q4出来,所以这个节