这份会议记录主要围绕华为昇腾950芯片及其自研HBM(会议中更倾向于称为定制化HMC)的技术细节、架构变化、与国内外产品的对比,以及由此带来的产业链影响进行了深入分析。以下是详细内容总结: 一、昇腾950芯片核心架构分析 封装结构重大变化:与上一代昇腾910C(由两颗910B通过CoWoS封装拼接而成)不同,昇腾950采用了“四芯片封装”结构。 核心组成:中间是两个计算芯片(Die),左右两侧各有一个I/O芯片。 华为研究–昇腾950全解全新自研HBM 20251215 这份会议记录主要围绕华为昇腾950芯片及其自研HBM(会议中更倾向于称为定制化HMC)的技术细节、架构变化、与国内外产品的对比,以及由此带来的产业链影响进行了深入分析。以下是详细内容总结: 一、昇腾950芯片核心架构分析 封装结构重大变化:与上一代昇腾910C(由两颗910B通过CoWoS封装拼接而成)不同,昇腾950采用了“四芯片封装”结构。 核心组成:中间是两个计算芯片(Die),左右两侧各有一个I/O芯片。 连接方式:中间四个芯片(2计算+2 I/O)之间通过CoWoS-L(使用硅桥)技术进行高速互联。上下共搭载了8颗自研的HBM/内存芯片。 内存连接:自研HBM并非通过硅中介层与计算芯片直接连接(传统HBM方式),而是通过绿色的封装载板(Substrate)走线进行连接,这与传统GPU封装形式明显不同。 关键性能参数与对比: 算力:高精度(FP16)算力弱于910C(约800 TFLOPS),但通过架构优化支持中低精度(如FP8)算力,峰值可达约1 PFLOPS(1000 TFLOPS)。计算芯片总面积更小。 互联带宽:由于采用了独立的、面积较大的I/O芯片(约100+ mm²),互联带宽得到大幅提升。这是华为提升系统性能的关键路径之一。 内存:规划了两个版本: 950PR(上半年):搭载第一代自研HBM“白露”,性能等效于HBM2e。 950DT(下半年):搭载第二代自研HBM“朱雀”,性能目标等效于HBM3(容量、带宽大幅提升)。 产品路线图:后续的960、970芯片将在互联带宽、算力、内存等不同维度持续提升,目标是在整体系统性能上对标英伟达B100/B200系列,但与更先进的Rubin架构相比仍有差距,主要受限于国内制程工艺。 二、自研HBM(定制化HMC)技术解读 本质是定制化HMC:会议明确指出,华为的方案从严格定义上更接近定制化的内存立方体(HMC),而非标准HBM。其核心区别在于:HBM通过硅中介层与 计算芯片紧耦合集成,而华为方案是将内存堆叠(HMC)通过封装载板与计算芯片连接,物理距离更远。 采用此方案的原因分析:供应链自主可控:高端HBM(如HBM3e、HBM4)采购受限,发展自研/定制化路线是必然选择。 散热与功耗考虑:国内计算芯片功耗相对较高,将高功耗的内存单元与计算芯片适当物理分离,有助于缓解局部热堆积问题。 成本考量:避免使用大面积的硅中介层(Interposer),可以降低CoWoS封装的相关成本,转而采用对线宽线距要求更高的高端载板(ABF)。 技术路线:第一代“白露”:8颗堆叠,每颗16GB容量,带宽204GB/s,等效HBM2e。第二代“朱雀”:预计用于950DT ,堆叠层数可能为6/8/12层,目标性能等效HBM3(如6层堆叠方案,每颗24GB,带宽683GB/s)。 三、与国内外芯片对比及竞争策略 与英伟达对比:H100:在互联带宽、算力、内存等综合指标上,昇腾910C与之性能大致相当。B100/B200系列:华为的950 、960、970将通过多代产品,分别在互联带宽、算力、内存带宽上追赶,最终实现系统级性能对标。 竞争策略:华为强调“系统性思维”,不单纯比拼算力,而是通过提升互联带宽(提高算力利用率)、内存带宽(加速辅助计算)等综合能力来提升整体竞争力。应对H200入华的挑战:会议认为,单芯片性能短期难以直接对抗H200,发展需要大量交换芯片的超级节点(超大规模集群)是国内算力与英伟达竞争的重要手段。 四、产业链影响与投资机会分析会议认为,昇腾950的架构及自研HBM 技术将驱动国内相关产业链需求:芯片制造与封装:计算芯片:面积约400+ mm²,一片晶圆可切割出的有效芯片数量有限(例如NPU计算芯片约18颗/片),消耗大量先进制程产能。 封装环节:多层堆叠的HBM/HMC封装,将利好刻蚀、键合(Bonding)等设备厂商。同时,环氧塑封料(EMC)、凸块(Bump)、电镀液、底部填充料(Underfill)等封装材料需求将显著增加。 载板(Substrate):由于HBM通过载板连接,对ABF载板的需求量和技术要求将提升。 存储产业链: 存储颗粒:由国内非上市存储厂商代工。 封装测试:能够进行多层堆叠的封装厂将受益,市场份额可能相对分散,涉及多 家国内封装企业。 市场空间:会议预测,随着明年国产GPU放量,配套的HBM/HMC需求将真正启动。以昇腾950为例,一颗芯片需8颗HBM,若出货量达百万级,将带来千万颗级别的HBM需求,2025年可能是国产HBM放量元年。 五、风险提示 会议最后强调,相关内容及测算基于当前信息分析,不构成正式投资建议,投资 者需谨慎决策。 核心结论:华为昇腾950通过四芯片CoWoS-L封装和自研定制化HMC内存的技术路线,在受限的制程条件下,以提升互联与内存带宽为突破口,走系统级性能 优化路线。这将对国内半导体产业链的先进封装、封装材料、载板、存储制造与封测等环节产生实质性拉动,并标志着国产高端AI芯片及配套存储技术进入新的发展阶段。