您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:半导体行业“AI革命”模拟&接口篇:配套核心计算,量价齐升 - 发现报告

半导体行业“AI革命”模拟&接口篇:配套核心计算,量价齐升

电子设备2023-04-10国盛证券听***
AI智能总结
查看更多
半导体行业“AI革命”模拟&接口篇:配套核心计算,量价齐升

多相电源为CPU供电核心。服务器内存、部分芯片组采用单相供电,而CPU/GPU由于功耗巨大,须采用多相供电保证其稳定工作。计算力系数字经济时代的核心生产力;云计算、人工智能、自动驾驶等应用,对核心处理器XPU(CPU、GPU、DPU、AI等)的算力要求越来越高,使这些主芯片对供电的要求越来越严苛,特别是中高端的XPU处理器,需要更多相数、多路输出、多种协议的电源管理芯片。典型的单相开关供电电路通常由PWM控制器((Pulse Width Modulation)控制器)、电感(L)、电容(C)、一对场效应管(MOSFET)以及MOSFET驱动芯片(Driver Mos)组成。多个单相供电回路并联在一起,且工作时间交错,即组成多相供电。 杰华特:多相控制器送样中,DrMOS已出货服务器领域。公司DrMOS 2022年已量产出货,公司应用最先进的工艺做最先进DrMOS。目前,公司DrMOS在笔电领域和服务器领域都有出货;公司多相控制器目前正在送样,多相产品也会陆续推出,会跟DrMOS配套出货。晶丰明源:全套电源方案值得期待。1)多相数字控制器:公司已发布10相BPD93010、16相BPD93036, 2)智能DrMOS:公司目前产品内部测试中,即将推向市场。3)全集成DCDC转换器POL(Converter):12A BPD60312已量产,2A~40A全系列陆续推出。 4)电子开关/热插拔控制eFuse、Hotswap产品:大电流、多种规格、带PMBUS调节、支持多颗并联。芯朋微:布局高压数字电源控制芯片,有望拓展服务器应用场景。公司2022年定增项目布局高压数字电源控制芯片,拟开发集成32-bit数字内核,集成数字PID控制,可实现多相并联控制,用于多相并联Buck电源主控芯片。 互联及网络接口升级:(1)互联接口:A100的NVLink3代和NVSwitch2代升级到了H100的NVLink4代和NVSwitch3代。DGXA100是8块A100通过12个NVLink3连接到6块NVSwitch2;DGXH100是8块H100通过18个NVLink4连接到4块NVSwitch3。(2)网络接口:DGXA100服务器计算网络是8张单口200Gbps的CX6或者CX7的IB网卡。DGXH100服务器4个800G的OSFP接口内部是8个CX7的网卡芯片组成。 内存接口:服务器CPU与内存桥梁,迎DDR5升级。内存接口芯片行业高增长,AI、云计算等发展如火如荼,海量数据对存储的需求持续推动内存接口芯片量价齐升和市场高速扩容:(1)量:持续受益于服务器出货量增长和单台服务器内存模组用量不断上升(2)价:内存接口技术向DDR5升级及LRDIMM结构渗透驱动内存接口芯片ASP提升。 澜起科技:内存接口加速扩容,平台型布局展宏图。内存接口芯片行业壁垒高、格局优,澜起科技强者愈强。秉持“平台型”发展战略,拓展津逮服务器平台&PCIe Retimer和AI芯片产品线,向更广阔空间进军。聚辰股份:SPD受益于算力需求增加及DDR5升级。SPD用于服务器等领域,受益于算力需求增加及DDR5升级。公司与澜起科技合作开发配套新一代DDR5内存条的SPD产品,该产品系列内置SPD EEPROM,系DDR5内存模组不可或缺组件。 风险提示:下游需求不及预期,国产化替代不及预期,产品研发不及预期。 一、多相电源为CPU供电核心 多相电源为CPU供电核心。主板主要有两种供电方式:线性电源和开关电源,其中开关电源式为功耗相对较大的元器件,例如CPU、内存和芯片组等供电。其中,内存和芯片组皆采用单相供电,而CPU由于功耗巨大,须采用多相供电保证其稳定工作。计算力作为数字经济时代的核心生产力,推动着经济蓬勃向前发展。作为计算应用的代表领域,云计算、人工智能、自动驾驶等应用,对核心处理器XPU(CPU、GPU、DPU、AI等)的算力要求越来越高,使这些主芯片对供电的要求越来越严苛,特别是中高端的XPU处理器,需要更多相数、多路输出、多种协议的电源管理芯片。典型的单相开关供电电路通常由PWM控制器((Pulse Width Modulation)控制器)、电感(L)、电容(C)、一对场效应管(MOSFET)以及MOSFET驱动芯片(DriverMos)组成。多个单相供电回路并联在一起,且工作时间交错,即组成多相供电。 图表1:主板级供电方案 图表2:从主板级供电到数据中心级供电 图表3:CPU供电方案 图表4:12V直流母线转低电压多相Buck的小占空比供电架构方案 CPU电能基本来源于12V 8PIN接口,下图以12V作为输入端。12V输入经过MOSFET上桥进入电容与电感,在电感与电容填充电能并达到所需的电压后,上桥中断,下桥开启。此时电容电感释放能量,同时起到滤波稳定功能,下桥控制电路。通过PWM控制器频繁切换实现持续稳定的电流与电压供给。整体流程循环如下:(1)MOS上桥开启,输入12V电压;(2)电感电容储电;(3)MOS上桥关闭,MOS下桥开启;(4)电感电容放电,提供所需电压与电能。 图表5:主板电能转换过程原理图(“>”代之电流流向) 二、互联&网络&内存等接口升级 互联接口升级: A100的NVLink3代和NVSwitch2代升级到了H100的NVLink4代和NVSwitch3代。DGXA100是8块A100通过12个NVLink3连接到6块NVSwitch2;DGXH100是8块H100通过18个NVLink4连接到4块NVSwitch3。 第三代NVSwitch芯片(NVSwitch3),可以连接服务器内部各GPU卡,同时还可以将GPU服务器扩展外连来建立一个独立完整的GPU高速集群。同时在NVSwitch芯片内通过硬件加速器来支持组播报文加速和引入SHARP(Scalable Hierarchical Aggregation and Reduction Protocol),主要用来加速和优化All-Reduce的AI计算性能。通过第三代NVSwitch芯片组成的物理交换机,可以建立一个最多256个H100 GPU卡的集群,整网提供57.6TB/s的all-to-all带宽。NVLink4.0技术规范可以大大优化GPU的性能和扩展性。 图表6:NVSwitch升级情况 NVLink是为了解决服务器内部GPU之间点到点通讯的一种协议。NVLink对比传统网络不会有例如端到端报文重传,自适应路由,报文重组等开销。极度简化的NVLink接口可以为CUDA提供从会话层,表示层到应用层的加速。NVLink随GPU架构演进而发展,从第一代P100的NVLink1到现在H100的NVLink4。NVLink3可同时支持50G NRZ和56G PAM4,NVLink4首次引入112G PAM4Serdes,可以提供900GB/s的双向带宽,较NVLink3的600GB/s提升1.5倍。 图表7:英伟达产品NVLink升级情况 网络接口升级: DGX服务器包括4个网络:计算网络、存储网络、In-band管理网络和Out-of-band管理网络。 计算网络接口:DGXA100服务器计算网络是8张单口200Gbps的CX6或者CX7的IB网卡。DGXH100服务器4个800G的OSFP接口内部是8个CX7的网卡芯片组成,可支持IB或者Eth,每个OSFP口可以通过分线来支持2个NDR 400G的IB网络或者2个400G以太网络,并且这里已经从A100的56G PAM4 Serdes升级到了112G PAM4的Serdes。 存储&In-band网络接口:DGXA100服务器存储是两张双口CX6或者CX7的IB或者Eth网卡,每一块双口网卡上,一口作存储用,另一个口做in-band管理。 DGXH100服务器同样是使用两张双口400G的CX7 VPI网卡,可支持IB或者Eth,官方建议一个NDR400G走IB存储,另一个降速成Eth200G走In-band管理网。 Out-of-band:DGXA100服务器是两个千兆电口Lan和BMC。DGXH100服务器Out-of-band网络还是推荐使用BMC RJ45千兆电口。 图表8:DGXA100服务器网络接口 图表9:DGX H100服务器网络接口 内存接口升级: 内存接口芯片,是用于服务器内存模组(又称内存条)的核心逻辑器件,是服务器CPU与内存之间数据及指令传输的桥梁。内存模组用于暂时存放CPU中的运算数据,是影响服务器性能的重要因素,由于服务器CPU对内存模组的高传输速率、大容量需求日益增长,因此为了服务器系统性能得到最佳发挥,服务器内存模组往往需要配置内存接口芯片,用于提升访问速度和稳定性。从数量上来讲,服务器内存模组与内存接口芯片一一对应。 内存模组根据其结构,大致可分为UDIMM、RDIMM和LRDIMM 3类,仅考虑DDR~DDR4,UDIMM内存模组无缓冲,价格低廉,但容量较小,不能满足服务器的要求,多用于桌面式PC。 RDIMM支持Buffered模式和高性能的Registered模式,较UDIMM更为稳定,此外,RDIMM支持更高的容量和频率,容量最大可支持32GB,频率最大支持3200 MT/s。 缺点在于由于寄存器的使用,其延迟较高,能耗也较大。 LRDIMM作为RDIMM的替代品出现,其最大容量进一步提升至64GB。 图表10:三类内存条对比 内存接口芯片主要包括DB芯片和RCD芯片,RDIMM与LRDIMM在结构上的差异主要在于有无RCD。DB即数据缓冲器,用来存储缓冲来自内存控制器或内存颗粒的数据信息;RCD即寄存缓冲器,用来存储缓冲来自内存控制器的地址、命令、控制信号。以目前主流的内存技术DDR4为例,DDR4RDIMM内存条需1个RCD,而DDR4 LRDDIM需1个RCD及9个DB,即“1+9”架构。 图表11:DDR4 RDIMM与LRDIMM对比 我们判断,海量数据时代对数据处理和存储需求将持续推动内存接口芯片迎量价齐升和市场高速扩容。我们接下来将从量价两个维度展开分析:1)量的方面,受益于服务器出货量增长和单台服务器内存模组用量不断上升,2)价的方面,内存接口技术升级及内存接口芯片结构升级渗透带来内存接口芯片本身价值量提升。 图表12:内存接口芯片市场扩容推演 内存接口芯片伴随内存技术的发展而发展,当前主流的DDR4内存技术面世至今历经多次迭代,已进入成熟期。2020年7月DDR5标准正式推出,内存技术迭代大幕正式拉起。 我们判断未来内存技术升级将推动内存接口芯片市场加速扩容:1)DDR5突破处理器性能瓶颈,处理器及存储龙头大力推进,有望加速渗透替代DDR4市场份额;2)新一代内存接口芯片技术难度增大,ASP有望大幅抬升;3)DDR5时代内存接口芯片采用“1+10”架构,价值量相较前代提升。 图表13:单核平均内存带宽呈现下降趋势 图表14:DDR5相较DDR4带宽大幅提升 DDR5内存性能远超DDR4的规格上限,配套内存接口芯片性能及技术难度随之提升,推高内存接口芯片ASP。DRR5相较于DDR4单颗DRAM内存密度提升4倍至64Gbit,最大数据传输速率提升一倍达到6.4Gbps,工作电压由1.2V压低至1.1V使对应功耗降低超过20%,故而DDR5内存将对保证内存数据传输速率和稳定性的内存接口芯片提出更高要求,进而新一代内存接口芯片在满足更高性能要求的同时技术难度也相应提升,从而提高新一代内存接口芯片价值量。 图表15:历代内存技术参数 三、投资标的 3.1杰华特:多相控制器送样中,DrMOS已出货服务器领域 公司DrMOS 2022年已量产出货,公司应用最先进的工艺做最先进DrMOS。目前,公司DrMOS在笔电领域和服务器领域都有出货;公司多相控制器目前正在送样,多相产品也会陆续推出,会跟DrMOS配套出货。 模拟芯片新秀,切入龙头客户供应链。公司成立