H100的采 购量,特别是在第四季度。但由于订单滞后和B100推出时间的延迟,第三 季度H100的量不会有太大减少。 2. **B100推迟原因**:B100的供应链尚未完全确定,特别是液冷部分的供 应链。此外,英伟达希望延长H100的供应时间,因为其生命周期较短。3. **价格调整空间**:H100的价格预计不会继续上调,明年可能会下调。B100今年的 价格基本在37,000-39,000美金,明年量产后价格可能降至 35,000美金左右。4. **工业富联业绩下滑原因**:互联网公司采购量不及预期,客户采购模 式变化,以及维保 费用和垫资费用减少。 5. **B100出货量瓶颈**:B100出货节奏推迟一个季度,主要瓶颈在HBM,台电的CoWoS供应足够。6. **非CSP需求增速**:非云厂商近两年增长快,中大型客户开始搭建私 有云和采购GP U,预计明年云厂商和非云厂商在英伟达的出货占比基本各占 一半。8 7. **H200需求增长原因**:H200算力提高两倍,价格相对较低,定位于非互联网行业,性能远超H100和AMD的MI300。 8. **训练与推理需求**:云厂商训练卡采购增幅放缓,推理服务器采购增加。9. **英伟达策略**:训练卡增幅放缓,推自己的GH200和GB200的CPU系列。 10. **2C场景机会**:自动驾驶和AI手机是未来可能实现的2C场景。 11. **生产和代工情况**:台积电负责芯片组装封装,工业富联和纬创作 为代工厂商,工业富联也负责组装AI服务器。12. **市占率目标**:工业富联有希望达到40%的市占率目标,但也存在难 度。13. **组装收费模式**:按代工费计算,H100小卡代工费用约400美金,8 卡模组约2500美金。14. **工业富联售价确定方式**:两种模式都有,取决于客户是否通过工 业富联购买GPU。8 15. **AI服务器组装费用**:A100和H100初期费用在15,000~17,000美金,推理服务器费用较低。文中对英伟达的发展前景表示看好,主要原因包括:– 产品线更新换代,如B100和H200的 推出,满足了市场对高性能计算的需 求。– 非云厂商的增长为英伟达带来了新的市场机会。 – 英伟达在自动驾驶和AI手机等2C场景的潜在机会。 – 英伟达的策略调整,如推理卡的推广和CPU系列的推出,以适应市场变化。 – 尽管存在供应链和市场变化的挑战,但英伟达通过调整策略和产品线,保持了其在行业中的领先地 位。 文章正文:H100和B100的出货节奏?由于B100的出货增加,有些客户会在H100上的量会减少,特别是在今年第 四季度。但专家个 人认为第三季度量没有太大减少。因为整个订单其实是 略有滞后的。H100的供应在前三个季度是每个季度都是有增加的。b100的 推出的时间是有延迟的,推迟到了9月份。所以这个时候H100的量就不会一 下降下去。B100是在第四季度起才算正式起量,然后H100在第四季度量可能才会下去。B100推迟的原因? 第一,B100今年供应链还没有完全确定下来,B100上有风冷和液冷,现在 目前液冷有一些供 应链还没有完全确定下来,只有他有一供,但二供还没 8确定。整个b100交付的周期延后大概2~3个月。第二,英伟达本身也是希望 延长整个H100 供应的时间,H100生命周期还是比较短的,从去年3月份开始 批量供应到今年3月份,正常英伟达一个卡的生命周期基本都是2~3年的时 间。H100和B100今年的价格调整空间? H100目前这个价格应该不会再往上调了,预计明年可能会下调一些。专家预 计18,000-2 0,000美金,可能在明年1月份的时候。B100今年基本在37,000-39,000美金。明年量产以后,价格 应该降到35,000美金左右。英伟达这种调价节奏一般是在新卡进行批量供应以后,旧卡才会开始进行调价。如果新卡只是个小批量供应,基本都不会调价的。怎么看工业富联的业绩下滑? 有几方面原因。第一,互联网公司本身的采购量不及工业富联的预期。去 年前三季度云厂商的出货量还是比较强劲的,但从第四季度开始,我们看 到有些互联网公司,特别是大型互联网公司开始去控制预算。这个原因并 不是他们不想买,而说根据他们以往预算的节奏,他们会把这个预算用在 今年花。第二,客户的采购模式会有些变化。以往我们看到客户的采购模 式都是训练卡和主机都会让ODM厂商一同去进行下单购买。但从去年四季度 开始像微软、亚马逊在尝试一种新的采购模式,叫Consign模式。就是客户 会自己买卡,然后把卡给到工业富联或广达。这对于ODM厂的营收会有比较 大影响。比如,他以前一台A100的训练服务器单体售价基本在12~13万美金,如果去掉8张卡的话基本这台服务器就是4-5万美金一台。我们看到是在去8 年有些客户在小批量尝试这么做。第三,在利润方面主要是受营收下滑导 致。另外它的维保费用和垫资费用其实也会有所减少。 B100出货量有可能更多吗?目前瓶颈是HBM还是CoWoS?今年B100出来应该不会很多了,因为整个B100出货节奏在往后推了大概一 个季度,由之前的 7月份推到9月份。我们现在看主要瓶颈还是在HBM,台电 的CoWoS足够。今年台电基本上是按照500万张卡的容量给英伟达准备的。HBM目前来看供应商太少了,而且量确实也比较小,供应量比较紧张 怎么判断非CSP今明两年对训练和推理的需求增速? 整个非云厂商这两年增长比较快了。第一,现在很多客户,特别是一些中 大型客户已经不完全依赖于 公有云了。他们其实现在是在搭建自己的私有 云的一些数学模型。这种情况下其实对于这些非云厂客户来说,特别是一 些中大型客户他们现在都要自己去采购GPU,然后搭建自己的数学模型。他 们都有下云的趋势。第二,对于这些非云厂来说,他们的自己的技术实力 现在也蛮强的。所以他们现在会去买一些训练卡去训练自己的数学模型。这也是为什么英伟达在今年推出了B100和H200这两款卡。B100就是对应到 整个互联网公司,而H200基本对应非互联网公司。2023年之前云厂商在英 伟达里面占比从65%,降到今年差不多55%。明年我们预计云厂商和非云厂商 在英伟达的出货占比基本是能各占一半,所以我们看到明年B100和H200的 的出货量基本就相同了。在国内现在英伟达的卡出货量还是集中在互联网 行业,而在一些非互联网行业,比如说运营商金融,他们的份额确实是降 了很多。今年H20在国内的绝大部分的出货量还是出给云厂商的。8 我们预计在未来两三年内英伟达的份额应该不会有太大减弱。为什么H200明年需求会大? 一方面是市场驱动的,因为H200的算力比H100提高两倍,但价格就多了不到5000美金。这个对于客户诱惑力是比较大的。所以对于客户来说大部分还是会选择H20 0。第二,英伟达推出H200的目的一方面是定位在一些非互联网行业,另外 因为AMD推出MI300系列,MI300系列是直接阻击H100。英伟达会感觉到有些 潜在风险,所以当时的推出H200的目的就是这款卡的性能会远超H100和MI3 00,那么价格当然会高一点。这样也会迫使客户去采购H200。今年是训练大年vs训练转推理的一年? 数学模型是从去年3月份开始做的,从第四季度开始,我们预计整个数据模 型就基本结束,开始转商 业化。所以从今年第四季度开始整个云厂商训练 卡的采购的增幅就在放缓了。H100在今年第四季度的销量下降其实就是这 个原因导致的,当然b100会对它有一定冲击。那么在变现过程中,终端用 户包括这些算力公司就会采购大量的推理服务器来为未来接入海量用户算 力中心来做准备了。英伟达今后的策略?第一,数学模型训练完毕以后,它的整个训练卡的增幅就会放缓,因为毕 竟在2023年之前,英伟 达还没开始火的时候其实每年的Al服务器还是都在 增加的,只不过增幅每年幅度比较小,基本每年增幅在15%~20%。所以我们8看到即使26年到顶峰以后,它Al服务器是不会有降的,只是增长放缓。第 二,他们今年也在着力 推自己的GH200和GB200的CPU系列。它的推广力度是非常强的。明年或者后年比较有机会实现的2C场景? 第一个是自动驾驶。自动驾驶的级别越高,对于整个数学模型训练的反应 速度和计算量的要求越大。 现在之所以L4还没有开始普及,主要原因就是 它的精确度还没有那么高,还是很容易出现问题。但 是当你的数学模型的 训练完毕以后,只要它的数学模型的训练参数量足够大,然后推理端的数 据处理速度足够快,那对于自动驾驶的水平会有比较好的提升。第二个是 Al手机。这也是苹果现在开始做自研Al服务器的原因。大家未来都会把很 多应用放在手机端,是现在智能手机不能实现的。比如可以把手机来作为 一个小型的边缘的微型的推理服务器,然后在上面去做海量的数据的输入 或推荐、数学分析,然后直接连到我们后端的一些这种数学模型上。随着 整个数学模型现在快接近尾声的时候,我们可以看到很多Al相关的硬件产 品全部就推出来了。其他的,像国内的一些算力公司像智谱科技现在已经 也已经训练出了一些数学模型。因为由于他们本身没有足够量的数据中心,所以它会把自己的这种数学模型以私有云的方式,或者说以软件的形式卖 给他的最终用户,比如他一些金融行业的。所以我们看到现在其实很多的这种数学模型落地的场景很多,只 不过是绝大部分现在还没有完成,但是有少部分已经完成了。明年对于这 种数学模型落地会更多一些。英伟达GPU板卡和模组的生产过程?PCB供应商?8 首先台积电会帮英伟达把最核心的芯片组装封装好以后会把交付给板卡的 代工厂商,比如工业富联。 他会把卡做成一块SXM接口的训练卡。这种训练 卡是不能直接插到我们服务器的主板上的,那么它需要去把它组装成一个8 卡的模组,就是baseboard。工业富联把小卡做完会交给纬创进行8卡模组 组装,组装完毕后再把交付给英伟达。英伟达服务器的代工情况? 从英伟达来看目前的板卡代工模式在收敛,基本上就是推理卡唯一供应商,训练卡唯一供应商。模组基 本就是纬创和工业富联做,不会再去把代工分 散下去的。一是便于管理,二是避免技术泄露风险。怎么看鸿海提到的整体Al服务器4成市占率的目标? 专家觉得还是有希望的,但也有难度。因为工业富联三大业务产线中数据 中心只占它1/3。当然专家表示去年数据中心板块是在上涨的,一方面是确 实得力于Al服务器的快速上涨,第二也是由于苹果那块业务确实有些下滑。从明年开始,如果要是英伟达推出新的推理卡以后,我们看到整个训练卡 的增幅放缓,那么其实对于 整个工业富联的数据中心业务的增速就会有所 影响。所以我们看到工业富联在今年开始也在和其他的一些板卡厂商,比 如说AMD在谈明年整个代工的一个情况,所以我觉得它要想达到40%,也是难度的。因为我们看到Al服务器到2026年基本就到一个顶峰期了,2027基本就不会再有像22-24年这种大幅度增加了。所以如果在26年他还起不来的话后面就很难再起来了。GPU板卡和模组的组装收费是采用加工费加价模式,还是毛利率加价模式?8 它是按代工费来计算的。比如H100一张小卡的代工费用基本在400美金一张,一个8卡模组的费用基本在2500美金一张。伟创费用应该比工业富联高。这 种纯代工的毛利率还蛮高的,基本都是在30%左右。工业富联往外卖英伟达Al服务器是按组装费模式还是目标毛利率的方式确 定售价? 两种模式都有,去年第四季度之前,基本上工业富联会替客户去购买GPU。所以当时一台服务器很贵,大概十几万到二十几万美金都有,毛利率大概 是5-6%。但到了第四季度,我们看到有些客户他的采购模式会有在转变,他会自己去买这个卡。这个时候它对ODM服务器的代工费用就会降低了,比如说之前一台服务器大概是13万美金,里面是包含了8张A100的卡,那么现 在如果8张A1 00的卡都由客户来采购,那么这台服务器工业富联只收取5万 美金。对于工业富