文章正文: H100和B100的出货节奏? 由于B100的出货增加,有些客户会在H100上的量会减少,特别是在今年第四季度。但专家个人认为第三季度量没有太大减少。因为整个订单其实是略有滞后的。H100的供应在前三个季度是每个季度都是有增加的。b100的推出的时间是有延迟的,推迟到了9月份。所以这个时候H100的量就不会一下降下去。B100是在第四季度起才算正式起量,然后H100在第四季度量可能才会下去。 B100推迟的原因? 第一,B100今年供应链还没有完全确定下来,B100上有风冷和液冷,现在目前液冷有一些供应链还没有完全确定下来,只有他有一供,但二供还没8 确定。整个b100交付的周期延后大概2~3个月。第二,英伟达本身也是希望延长整个H100供应的时间,H100生命周期还是比较短的,从去年3月份开始批量供应到今年3月份,正常英伟达一个卡的生命周期基本都是2~3年的时间。 H100和B100今年的价格调整空间? H100目前这个价格应该不会再往上调了,预计明年可能会下调一些。专家预计18,000-20,000美金,可能在明年1月份的时候。B100今年基本在37,000-39,000美金。明年量产以后,价格应该降到35,000美金左右。英伟达这种调价节奏一般是在新卡进行批量供应以后,旧卡才会开始进行调价。如果新卡只是个小批量供应,基本都不会调价的。 怎么看工业富联的业绩下滑? 有几方面原因。第一,互联网公司本身的采购量不及工业富联的预期。去年前三季度云厂商的出货量还是比较强劲的,但从第四季度开始,我们看到有些互联网公司,特别是大型互联网公司开始去控制预算。这个原因并不是他们不想买,而说根据他们以往预算的节奏,他们会把这个预算用在今年花。第二,客户的采购模式会有些变化。以往我们看到客户的采购模式都是训练卡和主机都会让ODM厂商一同去进行下单购买。但从去年四季度开始像微软、亚马逊在尝试一种新的采购模式,叫Consign模式。就是客户会自己买卡,然后把卡给到工业富联或广达。这对于ODM厂的营收会有比较大影响。比如,他以前一台A100的训练服务器单体售价基本在12~13万美金,如果去掉8张卡的话基本这台服务器就是4-5万美金一台。我们看到是在去8 年有些客户在小批量尝试这么做。第三,在利润方面主要是受营收下滑导致。另外它的维保费用和垫资费用其实也会有所减少。 B100出货量有可能更多吗?目前瓶颈是HBM还是CoWoS? 今年B100出来应该不会很多了,因为整个B100出货节奏在往后推了大概一个季度,由之前的7月份推到9月份。我们现在看主要瓶颈还是在HBM,台电的CoWoS足够。今年台电基本上是按照500万张卡的容量给英伟达准备的。 HBM目前来看供应商太少了,而且量确实也比较小,供应量比较紧张 怎么判断非CSP今明两年对训练和推理的需求增速? 整个非云厂商这两年增长比较快了。第一,现在很多客户,特别是一些中大型客户已经不完全依赖于公有云了。他们其实现在是在搭建自己的私有云的一些数学模型。这种情况下其实对于这些非云厂客户来说,特别是一些中大型客户他们现在都要自己去采购GPU,然后搭建自己的数学模型。他们都有下云的趋势。第二,对于这些非云厂来说,他们的自己的技术实力现在也蛮强的。所以他们现在会去买一些训练卡去训练自己的数学模型。这也是为什么英伟达在今年推出了B100和H200这两款卡。B100就是对应到整个互联网公司,而H200基本对应非互联网公司。2023年之前云厂商在英伟达里面占比从65%,降到今年差不多55%。明年我们预计云厂商和非云厂商在英伟达的出货占比基本是能各占一半,所以我们看到明年B100和H200的的出货量基本就相同了。在国内现在英伟达的卡出货量还是集中在互联网行业,而在一些非互联网行业,比如说运营商金融,他们的份额确实是降了很多。今年H20在国内的绝大部分的出货量还是出给云厂商的。 8 我们预计在未来两三年内英伟达的份额应该不会有太大减弱。 为什么H200明年需求会大? 一方面是市场驱动的,因为H200的算力比H100提高两倍,但价格就多了不到5000美金。 这个对于客户诱惑力是比较大的。所以对于客户来说大部分还是会选择H20 0。第二,英伟达推出H200的目的一方面是定位在一些非互联网行业,另外因为AMD推出MI300系列,MI300系列是直接阻击H100。英伟达会感觉到有些潜在风险,所以当时的推出H200的目的就是这款卡的性能会远超H100和MI3 00,那么价格当然会高一点。这样也会迫使客户去采购H200。 今年是训练大年vs训练转推理的一年? 数学模型是从去年3月份开始做的,从第四季度开始,我们预计整个数据模型就基本结束,开始转商业化。所以从今年第四季度开始整个云厂商训练卡的采购的增幅就在放缓了。H100在今年第四季度的销量下降其实就是这个原因导致的,当然b100会对它有一定冲击。那么在变现过程中,终端用户包括这些算力公司就会采购大量的推理服务器来为未来接入海量用户算力中心来做准备了。 英伟达今后的策略? 第一,数学模型训练完毕以后,它的整个训练卡的增幅就会放缓,因为毕竟在2023年之前,英伟达还没开始火的时候其实每年的Al服务器还是都在增加的,只不过增幅每年幅度比较小,基本每年增幅在15%~20%。所以我们8 看到即使26年到顶峰以后,它Al服务器是不会有降的,只是增长放缓。第二,他们今年也在着力推自己的GH200和GB200的CPU系列。它的推广力度是非常强的。 明年或者后年比较有机会实现的2C场景? 第一个是自动驾驶。自动驾驶的级别越高,对于整个数学模型训练的反应速度和计算量的要求越大。现在之所以L4还没有开始普及,主要原因就是它的精确度还没有那么高,还是很容易出现问题。但是当你的数学模型的训练完毕以后,只要它的数学模型的训练参数量足够大,然后推理端的数据处理速度足够快,那对于自动驾驶的水平会有比较好的提升。第二个是Al手机。这也是苹果现在开始做自研Al服务器的原因。大家未来都会把很多应用放在手机端,是现在智能手机不能实现的。比如可以把手机来作为一个小型的边缘的微型的推理服务器,然后在上面去做海量的数据的输入或推荐、数学分析,然后直接连到我们后端的一些这种数学模型上。随着整个数学模型现在快接近尾声的时候,我们可以看到很多Al相关的硬件产品全部就推出来了。其他的,像国内的一些算力公司像智谱科技现在已经也已经训练出了一些数学模型。因为由于他们本身没有足够量的数据中心,所以它会把自己的这种数学模型以私有云的方式,或者说以软件的形式卖给他的最终用户,比如他一些金融行业的。所以我们看到现在其实很多的这种数学模型落地的场景很多,只不过是绝大部分现在还没有完成,但是有少部分已经完成了。明年对于这种数学模型落地会更多一些。 英伟达GPU板卡和模组的生产过程?PCB供应商?8 首先台积电会帮英伟达把最核心的芯片组装封装好以后会把交付给板卡的代工厂商,比如工业富联。他会把卡做成一块SXM接口的训练卡。这种训练卡是不能直接插到我们服务器的主板上的,那么它需要去把它组装成一个8卡的模组,就是baseboard。工业富联把小卡做完会交给纬创进行8卡模组组装,组装完毕后再把交付给英伟达。 英伟达服务器的代工情况? 从英伟达来看目前的板卡代工模式在收敛,基本上就是推理卡唯一供应商,训练卡唯一供应商。模组基本就是纬创和工业富联做,不会再去把代工分散下去的。一是便于管理,二是避免技术泄露风险。 怎么看鸿海提到的整体Al服务器4成市占率的目标? 专家觉得还是有希望的,但也有难度。因为工业富联三大业务产线中数据中心只占它1/3。当然专家表示去年数据中心板块是在上涨的,一方面是确实得力于Al服务器的快速上涨,第二也是由于苹果那块业务确实有些下滑。 从明年开始,如果要是英伟达推出新的推理卡以后,我们看到整个训练卡的增幅放缓,那么其实对于整个工业富联的数据中心业务的增速就会有所影响。所以我们看到工业富联在今年开始也在和其他的一些板卡厂商,比如说AMD在谈明年整个代工的一个情况,所以我觉得它要想达到40%,也是难度的。因为我们看到Al服务器到2026年基 本就到一个顶峰期了,2027基本就不会再有像22-24年这种大幅度增加了。所以如果在26年他还起不来的话后面就很难再起来了。 GPU板卡和模组的组装收费是采用加工费加价模式,还是毛利率加价模式?8 它是按代工费来计算的。比如H100一张小卡的代工费用基本在400美金一张,一个8卡模组的费用基本在2500美金一张。伟创费用应该比工业富联高。这种纯代工的毛利率还蛮高的,基本都是在30%左右。 工业富联往外卖英伟达Al服务器是按组装费模式还是目标毛利率的方式确定售价? 两种模式都有,去年第四季度之前,基本上工业富联会替客户去购买GPU。所以当时一台服务器很贵,大概十几万到二十几万美金都有,毛利率大概是5-6%。但到了第四季度,我们看到有些客户他的采购模式会有在转变,他会自己去买这个卡。这个时候它对ODM服务器的代工费用就会降低了,比如说之前一台服务器大概是13万美金,里面是包含了8张A100的卡,那么现在如果8张A100的卡都由客户来采购,那么这台服务器工业富联只收取5万美金。对于工业富联来说,它的毛利额是不变,就是代工费用是不变的。比如当时我帮你买这个卡的时候一台的代工费用大概是1万美金,那么我现在不帮你去买卡了,其实代工费用基本还是在1万美金左右,所以这里面影响是会影响毛利率。 比如包含卡的时候,毛利率可能到5%,不包含卡的时候毛利率可能在20%。 工业富联组装一台Al服务器基本上就是固定1万美元的组装费是吗?A100和H100还是之后的b100。像B100和H200这种初期基本是在15,000~17,000美金,推理服务器就没这么高了。推理服务器基本是在4000-5,000美金。