接下来我将分享国内AI芯片企业的一些情况,包括产品、竞争格局、供应状况以及国产化推进的进展和现状。在此过程中,如果大家有任何问题,随时可以打断。首先,让我们简要回顾一下目前国内主流AI芯片企业的产品状况。根据2024年出货量的数据以及互联网公开渠道的数据,去年国产AI芯片出货量最大的仍然是华为。其主要产品是昇腾910B,而今年华为还将推出昇腾910C。因此,目前在国内企业中,华为的出货量最大,其市场主要面向政府项目、运营商项目以及互联网大厂。 除华为外,国内出货量较大的公司还包括寒武纪和海光等。目前,寒武纪的主要产品是外界流传的思元590,这是一款主力产品。从性能或参数层面看,华为的主力出货产品910B和思元590都属于大模型类产品,适用于训练或推理。然而,从目前的情况来看,国内大多数企业主要将这些产品用于推理。 从当前竞品的情况来看,这两款产品主要与英伟达的A100或A800系列产品对标。华为今年新推出的910C实际上是最高一代的H100系列产品的继任者。总体来看,国内AI芯片的发展仍稍逊于英伟达,我们后面会详细展开讲,这主要是由于在先进节点的限制,目前在国内主要推广的是H100系列,而B100这一代产品目前还处于研发阶段,尚未推出市场。除了华为寒武纪之外,国内其他厂商如海光等的产品也开始逐渐增加市场供给。 关于海光,我们简要回顾一下。实际上,海光之前已经开发过类似AI的产品。然而,之前的深算一和深算二主要应用于超算领域。从今年开始,他们主要推广的产品是深算3,外界也有称之为深算四。这款产品是专为大模型领域或AI通用计算领域,不是超算领域而设计的。所以他们今年主推的这个我们叫DCU的第三代,目前看来已经进入小批量生产阶段,包括客户端导入和小批量销售。相较于去年,今年的出货量相对较多。 至于海光的深算3系列,实际上也是在系列的基础上进行了较大的改良。之前,其产品主要集中在高精度超算领域,如FP32和FP64的集中算力。现在,它也扩展到了通用的16位算力,因此也可以应用于大模型的推理和训练。所以今年海光的量相对来说也会有一些。 另外,关于昆仑芯,我们也简要介绍一下,因为昆仑芯主要还是百度自用为主,不过其产品已经迭代到第三代。其中第一代和第二代产品在百度内部也有较大规模的使用,尤其是昆仑芯二代,在百度推理中使用量非常大。 去年,昆仑芯实际上已经推出了第三代产品。尽管第三代在制程工艺和算力方面都较为先进,其算力已超过A100,但目前尚未进入大批量生产阶段。不过,从去年到今年,已经积累了不少测试数据,从目前的情况来看,其性能也超过了A100水平。因此,我们前面提到的这四家公司,其算力规格及产品状态已经达到了A100级别的水平。当然,这一切是在整个产业链遭受制裁,以及AI领域普遍受到制裁的背景下,国内优秀企业所面临的挑战,他们正想尽各种办法推动研发和生产。 从客户端的角度来看,目前主要的几个领域中,最大的需求仍然是来自互联网行业。从H20的采购情况我们可以看出,国内在大算力卡或者大模型这方面,需求量最大的仍然是互联网领域。据观察,大型互联网企业一年的采购量通常超过100万块,甚至达到数百万张卡以上。因此,互联网行业是最大的市场需求。此外,国内的运营商和政策支持项目也占据了相对较大的市场份额。这三大领域基本覆盖了国内算力需求市场的90%以上。在产品方面,我们稍后会进行详细介绍。 除此之外,国内还有一些其他的企业,我们简单说一下。在退役端,还有像摩尔、壁仞以及天数之星这样一些做得还不错的企业。这些企业的产品相对来说也做得不错。然而,整体来看,它们仍稍逊于你之前提到的那几家。尽管如此,目前第二梯队的这几家企业的整体发展情况已经具备成熟量产的产品,并且已经开始向客户端进行批量化出货。然而,整个进展,包括产业链的进展,相对来说比第一梯队的产品慢一些或者说落后一些。但是也已经在迎头赶上。但由于制裁的原因,各家可能还需解决各自的供应问题,包括供应端的一些问题。 因此,尽管第二梯队的企业已经有成熟的产品,但其出货量和市场份额相较于第一梯队仍较小。 在竞争格局方面,我们看到,影响国内AI芯片企业竞争格局的主要因素有多个维度,这些与产品直接相关,包括我们提到的生态领域,尤其是软件生态。这一方面对整体竞争格局产生了显著影响。由于之前国内大型互联网企业及主要市场大多基于英伟达的生态系统,但现在由于制裁的原因,不得不转向国内的国产化供应。无论是百度、腾讯还是阿里等头部互联网企业,都在进行算力卡的国产化。因此,它们不得不从英伟达的生态系统转向国内的国产卡生态。在生态层面,如果英伟达与国产卡相比,英伟达的生态系统无疑更加成熟。 然而,国产卡之间的生态差异并不显著。例如,华为与寒武纪主要专注于自研生态,沐曦和海光则代表了另一个大的生态。这些生态之间的竞争优势,并没有在产品和供应层面产生与硬件和最终竞争格局同等重要的影响。因此,在国产卡领域,我认为生态的作用其实并不显著。 然后在互联方面,可能会是未来竞争的一个焦点。尽管目前许多用户仍主要使用国产卡进行推理,对集群的要求并不高,但未来肯定需要在训练层面实现国产卡的替代。因为英伟达的高端卡会越来越严格,所以国产卡最终还是要用来做大集群的训练,因此对多卡互联的要求肯定会越来越高,同时集群的稳定性等也会有较高的要求。 由于大模型应用的增加,显存需求也在持续上升。随着HBM和HBM2E等技术的迭代升级,目前正朝着第四代发展,显存容量呈现出不断增长的趋势。 算力的提升也面临类似的挑战。由于国内受到先进制程工艺的限制,算力的迭代并没有预期中那样迅速。我们无法使用5纳米及以下的制程,这导致我们在算力发展上落后于英伟达。目前,由于制程工艺的限制,国内在迭代算力方面相对受阻。未来可能采用3D封装技术来提升整体性能。至少目前,国内的头部企业也在持续迭代产品。因此,对标H100系列的产品也将于今年陆续推出。尽管在硬件层面,我们与英伟达仍至少有一代的差距,但通过近两年的供应链改善和先进制程工艺的国产化,我们正在逐步追赶和跟进。 生态方面国产卡之间的差距并不显著,但与英伟达的差距较大。这实际上是一个需要时间积累的过程。随着国产卡在国内市场份额的增加,国产芯片厂商支持的生态系统应用将日益丰富。通过不断的迭代,这些生态系统的性能将不断优化,整体表现也将提升。因此,国产卡与英伟达之间的差距将会持续缩小。关于国产AI芯片企业的产品及其在竞争格局中的地位,以及影响整个竞争态势的其他因素,我们已经进行了初步的介绍。 接下来,我想讨论当前先进制程的状况。众所周知,7纳米制程或者说7纳米以下制程,全球能做的企业也不是特别多。在之前的AI芯片,在制裁之前,基本都是采用台积电的7纳米工艺,或者再往下的5纳米这些为主。包括现在像英伟达的主流产品,采用的都是台积电的4纳米和4纳米工艺,其中5纳米采用的是同一代的工艺。因此,从先进制程的角度来看,全球能够生产AI芯片的公司实际上非常有限。 以台积电为例,三星等公司也有其先进的技术支持。然而,包括英伟达和AMB在内的主流厂商,主要还是依赖台积电的工艺。在国内,已经具备了相当于台积电7纳米的先进制程,并且目前的AI芯片已经在工程批次和部分量产批次中进行验证。目前来看,国产制程足以支持国内企业AI芯片的生产。唯一的问题是,国产先进制程的良率相对偏低。但随着过去两年的持续优化,包括华为和其他企业不断的尝试和优化,目前国产的良率已经有所提升,并达到了量产标准。 相对而言,当前产能状况已不那么充裕。主要是因为先进的制程,尤其是光刻机的制约。因此,产能似乎并不充足。但目前的情况正朝着积极的方向发展。至少,国产的先进制程技术现在已足以支持国内企业进行AI芯片的生产与制造。未来,随着越来越多的企业进入该领域,台积电已经基本上暂停了对大部分国内企业的供应,包括那些没有下过订单的企业。 这导致许多国内企业不得不转向国产化供应商。因此,像SPEAK这样的公司面临的压力非常大。他们正在逐步制定持续的规划,以支持国产企业及国产AI芯片的发展。 鉴于美国不断明确的限制规则,台积电可能会提供一定的支持,但对规格的控制将更加严格。然而,对于想要在国内市场扩展的头部企业而言,目前来看,选择国产芯片仍然是更为明智的决定。因为在台积电生产将会受到各种限制,这会限制产品的规格。相比之下,国产芯片更容易生产出能与英伟达竞争的产品。因此,从个人角度来看,我目前比较看好国内AI领域国产化落地的前景,以及后续的放量增长。 关于产能分配并没有特别复杂的机制。它并不像外界传言那样依据企业来进行分配。简而言之,产能分配通常遵循“先验证工程,先下订单,先生产”的原则。换言之,是根据谁能够更快地启动量产并稳定生产来分配产能。因此,那些早期完成验证并实现稳定量产的企业,通常会获得更多的产能。由于新企业无法在验证完成之前获得产能,所以从这个角度看,已经在进行大规模生产的芯片的企业,拥有更多产能的决定权。他们不会轻易减少已有的大量生产芯片的产能,去分配给新导入的企业,除非有新增的产能可供分配。 通常情况下,一旦产品进入稳定量产阶段,公司就会继续生产,因为这已经成为其稳定收入的一部分。如果产品需要进行工程导调,那是需要时间的,但稳定量产的产品是为了贡献持续的收入。 各家之间的一个优势,国产这几家企业之间的优势,相对来说确实各有各的特点。我们说几个比较有代表性的,从华为来看,其优势在于其整体的研发投入是国内其他企业无法比拟的。华为对芯片和AI的重视程度已上升至战略层面,并提供了最大的内部支持。华为还具备从芯片到整服务器整机的全产业链研发和制造能力,以及在软件生态方面的持续投入和能力,这些方面均使其他国内企业难以匹敌。唯一的不足可能在于,华为在AI领域的技术积累相对不够深厚,因为其进入AI领域的时间较晚,相较于英伟达、寒武纪和百度而言,其在AI技术的积累尚未达到一定水平。然而,华为正在不断迭代更新并加大研发投入,因此,华为在这一领域的领先优势预计将会得以保持。 因此,该公司在全产业链方面的实力并非一般企业所能比拟。无论是软件层面的资源优势,还是硬件层面的资源优势,亦或是其在市场端的影响力,包括在智算项目和运营商项目上的表现,均显示出其卓越的能力。其与运营商在欺诈和通信方面的良好合作关系,使其在市场端的影响力无人能及。其他企业各有特点,例如寒武纪,它以深厚的技术积累和完全自主的自研AI架构及生态而著称。基于其科研成果的产业化,它对处理器内部结构有深刻理解,这使得它在产品迭代和硬件、软件升级更新方面具备强大的自主研发能力。这无疑为其带来了显著的优势,但可能的劣势在于其商业化进展相对较慢。16年成立以来,该公司的产品迭代和商业化起初并不成功。然而,随着打压的升级,其产品逐渐在国内大型企业尤其是商业客户中实现了规模化销售,并通过持续的迭代逐步走向成功。因此,从趋势来看,该公司逐渐实现了商业化,并将这一反馈再次投入研发中。因此,它拥有了一个非常强大的技术研发能力,这是它的核心优势。 而且,从当前情况来看,研发能力实际上是一种非常宝贵的资源。这不仅因为研发能力可以持续迭代和优化产品,而且一旦客户粘性增强,其产品迭代的roadmap和思路也会变得非常迅速且优秀。因此,这是它的最大优势。 它的不足之处在于专业化领域不包括市场方面的影响,显然不及华为。然而,海光有其独特之处,其产品基于超级计算领域发展起来的。现在,它对AI领域的重视程度非常高,无论是在研发、生态系统还是客户端方面,都有持续投入并推动其系列产品的发展。由于有曙光的支持和应用,它的产业链能力、国内影响力以及CPU产品的综合能力都非常出色,因此在国内AI芯片市场中占据着有利地位。 昆仑芯无需多说,作为百度孵化企业,它拥有百度的支持进行产品端的测试和验证,以 及应用层面的验证。因此,其产品和技术的迭代速度相较于其他公司更快。尽管如此,由于过度依赖百度,它并不是一个独立的第三方芯片企业,无法像其他公司那样支持更广泛的客户,这可能对其规模化产生一定影响。此外,国内还有许多第二批的企业