您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:算力国产替代进展专家交流 - 发现报告

算力国产替代进展专家交流

2025-04-18未知机构等***
AI智能总结
查看更多
算力国产替代进展专家交流

2025年04月20日 22:04 发言人1 00:00 国产创业龙头公司的专家来更新交流一下整个国产替代的一个进展。首先在会议开始之前的话,也再强调一下这个合规纪律。我们本次交流的话是不允许去以任何以这个录音或者是纪要形式的这种文字的传播。否则的话天风证券这一边也会保留追究法律责任的一个权利。然后我们现在会议就正式开始,那在开始之前,能不能先请专家给我们,就比如说更新一下现在的这个910C以及最近发布的这个cometric384这个产品的一个具体的量产的时间和现在的一个研发的进度。以及包括说会不会我们会有比如以25年全年维度的出货的一个目标这种的一个更新。 发言人2 00:51 好的,行,我简单说一下。因为可是刚出来哈刚出了花园,刚刚发布了一个38,是这样一个11个1个上级的一个节点,这个算力节点。然后说一下刚才这边有没有问题,我答复一下。首先991,因为我们之前一直说9NC大概什么时候会正式的一张用。也是借着我们这个384这个节点,然后也是正式的,也是刚好910C正式的一个商用进入到一个商用这样的一个一个一个进程。对,然后现在这个操作节点现在的一个进度就是因为也是刚上线,然后现在仅仅限于我们内部的一些大客户使用和谁在用呢?现在像那个国际流动,国际流动现在已经已经在用了。包括现在国内像那个科大讯飞、新浪,我们头部的客户,他们现在已经在用。然后现在完全商业化,是上到我们数据中心的商业化的一个大概会在,因为现在还没就是我们现在还买不到,官网上我们现在还买不到。现在上线了以后,然后应该会差不多是到5月份陆续我们就可以会有一些标准化的一些服务和产品已经出来购买。 发言人2 02:27 好的,然后第二个问题就是你刚说的关于芯片这一块,90B和90C现在一个量产的一个大概的一个规模情况。规模情况我们现之前其实今年910C的一个目标,目标差不多是就是20到30万片这样的一个目标。因为这个也是跟跟产能有关,跟产能有关。然后今年整体的一个芯片,像90B的话,大概是总芯片量大概是80万片。然后90B大概是那个90B大概是50,50到650那个到60万,90C大概是20到30万。对,这样的一个计划。那如果按产能来看的话,如果说因为910C的话,现在也要看正式商用以后,它的一个锥头这一块也要看它使用的一个效果。如果是按在有限的产能的情况下,如果是如果说90C到时候要追求的话,可能9NB可能会减产和然后910B的一个产能会转移到我们9NC的产能上,会有这种情况,这个要看后续的一个具体的一个使用情况。 发言人1 03:58 明白,对,那像384这1块的话,是不是现在也还没有太有这个目标的概念,就可能先要看这个内部大客户的使用的效果,然后再去看具体制定这种具体的目标。 发言人2 04:13 384是这样,384因为我也知道这是一个的一个一个一个超级节点。超级节点的话未来就是会有一个我们叫商业化标准化,肯定会有一个落实的标准化。就是未来我们因为现在只能是一些大客用,大客户用,那未来我们能不能用用于一些比如中小客户中大型客户,中小客户那怎么用?就是他能他顺利资源,比如说是共享还是独享,它标准化这一块还是要还有时间。现在其实现在来说还是偏向于一些半定制半标准化这样的一个过程。所以如果以后因为现在算算不算是私有化的话,算因为现在我们现在芜湖那边的一个我们计算那个计算中心里面所以未来如果上架到我们官网上,自己能我们制作平台能开通能使用的话,这个需要一个标准化的一个这样的一个过程。对。 发言人1 05:19 明白,就这个标准化的这种方案可能就五月份左右去落地,然后后面就可能会有一个量产。 发言人2 05:28 对,因为他按现在这个流程来看是这样的,就因为现在是大课,大客户属于是我这一些应该说是一些成一些战略级的客户,那大客户现在也是属于一个对半生产和半测试这样的一个状态。对,然后未来流未来的流程就是会对会会慢慢的标准化。因为我们除了适配一些蒂萨克使用的,未来就是能针对一些,比如说会出一些不同的版本出来了。然后针对一些就是有一些针对一些比如说有这种需求的,但是他们可能没有这么多追求性价比高的这种客户。怎么样能能让他用上这种他这种超节点预算离合,对这个需要一个过程。 明白,然后想再请教一下,因为我看这个384好像在芜湖那边已经到已经是用上了,就那。 发言人1 06:42 因为现在客户那一块是会有这个反馈,就具体的这个应用,比如说对比起像前面能买到的这个H20这种,它的一个大概的应用上的一个反馈。 发言人2 06:55 是怎么样的反馈,现在他那个评审出来了,因为现在估计流动文化,包括新浪和科大讯飞他们是在我们之前战略合作或者邀请做一些测试,做一些他们已经实测过了,实测过了。然后整体的效果,其实当然我觉得现在384节点的话,肯定我们谈到这三部里面可能摆摆脱不了,摆脱不了GB200这个NVL72这种差别点。肯定是借鉴了人家这种节点一些灵感要去走出来的这样的一个超节点,这样的一个产品。 对,然后现在整体他们实测测下来的话有几个数据,测下来几个数据,一个就是从模型训练上面,模型上,因为这种是适用于和大模型训练这一块,讯飞这一块适用于一些未来的一些。比如说我们是达到万亿,对,万亿、数万亿这种对参数量特别高的这种模型,就这个钞我们未来就是叫超大模型,适合正常使用。然后他们用的话现在清算下来,现在包括我们说的模型里面的PPS这种是现在对标,我们这个数据肯定要对标,我们对标比如说是那个维卡,这边那个HA800,A800这种效果,现在是跟他们是比较接近这种,然后整体的一个训练效率的话,能提升就是通过这三分之差节点了,能提升超45%。然后训练成本我们现在算下来也能成差不多能降到30%。对,是这个是大概的一个数据。 发言人1 08:58 明白,我确认一下,就这是效率提高45%和成本降30%。这个是对比ML72这样去搞出来的结果,还是说对比我们传统的这种服务器模式出来的一个效果。 发言人2 09:12 对比传统的对对比传统的就是我意思就是我们对这种架构这种调节点,相当于我们以就以前以前以前比如说我们用一个模型,这种大模型在以前那种架构上也合合在现在这种架构算力平台上跑,是对比。对,然后刚才说的那个偷看时候,我们现在在20下每秒差不多能能达到差不多有个20斤,差不多2000。这个数据是是对标的是对标我们在同等的一个并发情况下,是对标的安徽的安徽卡的安徽集群的一个数据。 发言人1 09:57这个对标的是HH800和A800吗?还是是要哪个? 发言人2 10:04对。 发言人1 10:07 明白。对,然后第二个想跟您请教一下,就这个怎么定价的一个问题。或者说比如说我们去对比,就直接去买到我们国内能买到的MV卡,然后做成的这种集群的话,我们的这个价格上会是不是会就大概会更贵一点,还是说会更便宜一点。因为我看它其实本质上用到的那个GPU还是会更多,会不会说造成整体的一个投资成本要有一个明显的提高呢? 发言人2 10:38 使用成本这个现在其实商业模式这一块,我们现在测下来,就是说我们再统统就对标。我们刚刚这边不就是用那个2800A800这种,对对对,标那个二维卡去测,其实我们现在成本能降,刚才说的差不多成本能降到3分之11。对,是对,标好,他们成本能降到3分之1。但是我们现在华为这边未来就三万这种超节点的去使用的一个商业模式。现在其实现在还还没有定下来,这个还没有定下来。未来要么就是比如说我们是按租赁,你看看现在91NB这种,就比如说11D8卡这种,整台租赁每个月的一个价钱是多少?这么多,还是说他是按一个集群里面做切片,这样算这个现在还没定,但是可以我们现在他们测出来,测出来成本跟NA卡的比例,现在也测出来了,比他们就外部因素,外部其他的因素都都一样的情况下,能差不多能成本能省个跟他们比省了3分之1,就相当于是他们3分之2的3分之1. 发言人1 11:57 还是对我确认一下是省了3分之1还是降到3分之1。 发言人2 12:06是节省3分之1,不是电脑3分之1. 发言人1 12:09 是节省3万。明白明白明白。对,然后第二个想跟您请教一下,最近不是这个贸易摩擦其实演就演的比较剧烈。对,然后关于这个H20,就最近一会儿可能会被禁,一会儿可能不被禁。这样子就这一块的话,您现在感觉到的客户的态度,会不会说他们是更加激进的在囤这个H20的卡,还是说其实对于华为这边的一些,包括这个920B和920C的一些订单,其实是在明显增加。客户这一块现在的一个选择是怎么样的? 发言人2 12:45 现在就是你说一些客户用一些客户转移转移到国产,这个现在还肯定没这么明显,因为毕竟才没多久时间他们从原来的用安全0和RV卡马上转移到国产卡,没这么快,这没那么明显。然后关于H20这个现在是这样,因为它不是完全的,它只是限制,不是完全的封闭。限制主要是许可,限制的话说也要看情况,有些人就是能拿到许可的,有些可能就拿不到许可。所以还有一点就是现在政策现在也是飘忽不定。说不定就是下个月,因为现在像英伟达他们,黄玉军他们不是也在做一些工作,说不定可能一个月或半个月或几个月以后,他政策会有改变。但现在整体因为他是就他是许可这块管的比较严。那许可现在因为之前搬出的一些许可,之前那些订单没交付的订单还是会按时交付的话,只不过现在你就是说你 新申请新新就是新去采购一些新的H20,这个是非常难的哈他要授权,要license,就这种许可然后现在因为250要求Q1的话,应该说未交付的应该还有小几万编号,所以能能就是还没交付的,应该这个应该是能拿到手的话。 发言人2 14:17 对,然后有影响的。就是说未来如果你你重新去买H20做一些推理也好,这种布局那肯定会受影响,对国内现在的一个市场的影响,那从长期来看的话,那肯定是对国内的芯片厂商会有一些利好,肯定利好。但这个利好要两说。一方面就是你订单未来,比如说未来一两个月23个月订单增加了,但是你产能也要跟得上,对不对?那产能跟不上的话,你这个我觉得也会受影响。对。 发言人1 14:55 明白。那您觉得这个假设说就这严重的一个情况下面,H20他完全就是这个许可,可能后面就彻底拿不到了。就这种情况下,您觉得后面会不会导致国内的整个算力的建设,它可能就比如说放慢了,或者是削减了。这样就可能我这样搞不清楚现在比如说384这边到底产能能不能买得到,以及这个实际应用效果是怎么样的。然后H20又买不到的情况下,会不会说就影响了下游的需求呢?就您现在看到的客户态度是关于这方面是怎么看的? 发言人2 15:32 我们现在这几天确实能没有特别明显。我们像卡这边咨询就咨询我们这边像910191C这些单子的一些客户确实比之前会多起来了。对,就是可能为未来的一些产品去布局,肯定是要囤一些卡。对,然后你说的这个H人如果说有封禁,永久封禁,然后对国内市场,包括技术厂商,包括一些用户来说它的影响。 发言人2 16:07 首先有一点就是我们像华为的话,现在至少能做到一定的一个国产的一个闭环。所谓国产闭环就是我们自己的一个AI芯片和加AI的模型至少能做做到能做到闭环了。但是我们现在对你我意思就是像H20,就是说它影响有影响是存在主要影响就是我们影响一些,比如说我们国内的一些像互联网的头部厂商,像比如说说白了就像腾讯这种,因为他们对那个对N维卡的依赖比较高,对,所以互联网可能影响比较大。因为他们现在因为像用H20。我举个例子,之前DBC其实做推理,性价比最高的就是H20,H0性价比最高。然后如果如果在如果如果是分期的话,那影响肯定挺大的。我们国内模型部署,基本上就是一方面影响,一方面就是我原来在在190上跑,就是在扩大生态扩大上跑。那如果现在我要转移到国内的芯片里面,我要换生态,换生态如果一次性一次一次性好的话,还可以。 发言人2 17:24 一次性差的话,你四倍都差的话,那可能会影响它的一个推动的一个效果。对,这是一点。第二点就是对他们对他未来,我觉得未来的一个市场,就是未来的一个市场的一个布局,影响都很大。对。 发言人2 17:46