您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[金元证券]:电子/行业深度报告:AI用电的“困”与“破” - 发现报告

电子/行业深度报告:AI用电的“困”与“破”

电子设备2025-11-23唐仁杰金元证券王***
电子/行业深度报告:AI用电的“困”与“破”

AI用电的“困”与“破” 证券分析师:唐仁杰S0370524080002行业评级:增持 摘要 •随着近些年AI模型竞赛日益激烈,训练最先进人工智能模型所需的数据量和计算量呈指数级增长。训练是一个耗时且耗能的过程,计算在GPU/ASIC等专用芯片上进行。当前,单个GPU的最大额定功耗可达1000瓦。GPT-4训练时间约95天(2280小时),采用84%的负载因子计算,其训练能耗需求约为38.2GWh,折合训练期间内日均能耗约0.40吉瓦时(40万度电),如果以一个家庭单日电力消耗约为10度,GPT-4日均能耗约等于4万个家庭单日用电量。 •不同于训练,推理任务的能耗需要考虑因素较多。比如,输入Token量及输出Token量、硬件配置以及批处理规模、键值缓存管理、注意力机制等操作优化策略的多重影响。此外,由于面向用户的商业AI模型在规模与实施细节方面缺乏透明度,难以精确测算其算力需求及后续能耗。不过随着长上下文任务及多模态模型的加速渗透,即使通过MoE或其他算法提升效率,但是总耗能或仍然持续提升 •2024年全球数据中心用电量达415TWh,约占全球总用电量的1.5%,但耗电量较为集中。美国、欧洲及中国的数据中心用电量合计约占全球总量的85%。其中,美国自2015-2024年期间,数据中心电力消耗以每年约12%的速度增长,增量约250TWh。2024年美国数据中心的用电量约为180TWh,占全球数据中心总用电量近45%,并且占据美国全口径总用电量的4%。根据IEA预测,基准情况下2030年数据中心电力消耗将增长至约945 TWh,比2024年翻倍以上,年均增长率约15%,占2030年全球电力消耗的近3%。其中,美国是最大市场,在基准情况中,2030年消耗将增至约420 TWh(比2024年增长130%),占全球增长的40%。 •用电方面,真正的挑战在于电力基础设施制造周期与AI需求周期错配。为满足数据中心电力需求可来源于多种途径,每种技术性能、成本、排放、开发流程和建设周期方面都具有独特特性。随着数据中心预计在未来数年快速增长,构建并确保稳定高效电力来源的战略变得尤为关键。目前,美国唯一能在较短时间开发完成的可靠电力来源是太阳能光伏和燃气轮机,与数据中心的典型建设时间线相吻合。但即使在这些情况下,供应链延迟或供应紧张也可能进一步延长开发时间。但是,光伏输出受到太阳辐射的自然周期影响,发电功率在白天高、夜间为零,且实时随天气变化。对于7×24小时持续运行的AI算力中心来说,太阳能本身并不是稳定的电源。通常数据中心的负荷昼夜相差不大(甚至夜间仍维持高负荷以连续运行训练任务),而光伏在日落后完全停发电,白天的峰值出力也不一定刚好匹配数据中心负荷曲线。如果没有储能或其他调节手段,光伏对削减数据中心用电高峰的作用将十分有限。 •完整的电化学储能系统主要由:电池组、电池管理系统(BMS)、能量管理系统(EMS)、储能变流器(PCS),统称为“3S”以及其他电气设备构成。大型储能PCS多采用硅基IGBT(绝缘栅双极型晶体管)作为主功率开关器件。IGBT在PCS中的作用包括电压变换、DC/AC逆变以及功率控制等,直接决定了储能逆变器的性能指标。变流器市场,2024年全球变流器市场规模约1292亿美元。当前主流应用在工业电机、光伏及xEV,BESS市场规模约84亿美元。根据YOLE预测,BESS(电池储能系统)应用端增速最高,预计2024-2030年前期年复合增速18.5%,BESS应用市场预计至2030年达到233亿美元,或将成为变流器应用新增量。 •功率市场方面,IGBT、硅基MOSFET占比份额较大。2024年,IGBT分立+模块市场规模约88.87亿美元,预计至2030年将达到161.51亿美元,年复合增长率10.47%。面对国内储能、光伏、新能源车推动下,国内厂商快速渗透,有望在市场规模增长+国产替代推动下加速增长。其次,随着储能及AI数据中心模块化和高压需求,碳化硅MOS模块、碳化硅分立器件、碳化硅整流器件也有望维持高增长,2024年三者合计市场规模29.67亿美元,预计至2030年市场规模增长至95.20亿美元,年复合增长率达21.45%。 •相关公司:斯达半导(603290.SH)、扬杰科技(300373.SZ)、芯联集成-U(688469.SH)、士兰微(600460.SH)、东微半导(688261.SH)等 •风险提示:1、国内厂商渗透率不及预期:当前功率器件市场仍以海外厂商为主,国内厂商渗透进展存在不确定性,或导致业绩波动或不及预期;2、产能扩张导致的价格风险:国内厂商在功率器件市场布局较多,竞争剧烈或导致价格压力;3、技术风险:当前功率器件技术路线较多,如平面及沟槽型MosFET,新技术的应用或导致其他产品销量不及预期。 目录 风险提示: 国内厂商渗透率不及预期:当前功率器件市场仍以海外厂商为主,国内厂商渗透进展存在不确定性,或导致业绩波动或不及预期 一、AI推升电力消耗 二、解决方案一:燃气轮机 产能扩张导致的价格风险:国内厂商在功率器件市场布局较多,竞争剧烈或导致价格压力 三、解决方案二:光伏+储能 四、储能+光伏或带动功率器件需求 技术风险:当前功率器件技术路线较多,如平面及沟槽型MosFET,新技术的应用或导致其他产品销量不及预期。 五、相关公司 AI推升电力消耗 ➢随着近些年AI模型竞赛日益激烈,训练最先进人工智能模型所需的数据量和计算量呈指数级增长。例如,GPT-4的训练数据量约为4.9万亿个数据点(DataPoints),训练计算量约为22万亿亿次(即2.2×1025)。 ➢训练是一个耗时且耗能的过程,计算在GPU/ASIC等专用芯片上进行。当前,单个GPU的最大额定功耗可达1000瓦,这与一台烤面包机的功耗相当。超大型的模型是在由多个GPU组成的集群上进行训练的。例如,GPT-4是在25,000个GPU上经过多日训练而成,算力芯片合计额定功率近10MW。除此之外,加上用于模型训练的其他服务器部件包括CPU、内存、网络设备和交换机等以及非IT设备功耗,用于训练GPT-4的设备总额定功率高达约20MW。 ➢并且,GPT-4训练时间约95天(2280小时),采用84%的负载因子计算,其训练能耗需求约为38.2GWh,折合训练期间内日均能耗约0.40吉瓦时(40万度电),如果以一个家庭单日电力消耗约为10度,GPT-4日均能耗约等于4万个家庭单日用电量。 AI推升电力消耗 ➢不同于训练,推理任务的能耗需要考虑因素较多。比如,输入Token量及输出Token量、硬件配置以及批处理规模、键值缓存管理、注意力机制等操作优化策略的多重影响。此外,由于面向用户的商业AI模型在规模与实施细节方面缺乏透明度,难以精确测算其算力需求及后续能耗。不过随着长上下文任务及多模态模型的加速渗透,即使通过MoE或其他算法提升效率,但是总耗能或仍然持续提升。 AI推升电力消耗 ➢基于不同的生成任务,能耗差异较大。使用小型语言模型进行文本生成约消耗0.3瓦时,中型语言模型则需消耗约5瓦时。图像生成任务每项约耗电1.7瓦时。而视频生成的能耗强度高出两个数量级,生成一段短时长、相对低质量的视频(时长6秒,每秒8帧)需消耗约115瓦时。 ➢采用混合专家模型能耗改善明显,而推理模型则产生较大能耗。混合专家模型参数总量是中型模型的2.5倍,但能耗仅增加约45%。推理模型通过推理时缩放技术在处理数学、编程等复杂问题时需要进行更深入的"思考"。但将推理模型用于简单文本生成任务时,其耗电量将达到同等规模常规模型的2倍。 AI推升电力消耗 ➢数据中心是一种集中式设施,主要用于容纳大量计算机服务器、网络设备、存储系统及IT组件。所有上述设备均需配备专用电源单元,以确保为每台设备提供适配的输入电压。当前数据中心中,服务器平均约占60%的用电需求,但比例因数据中心类型存在显著差异。存储系统是用于集中化数据存储与备份的设备,约占总耗电量的5%。网络设备包括连接数据中心的交换机、引导流量的路由器以及优化性能的负载均衡器,其电力消耗最高可达总需求的5%。冷却与环境控制系统通过调节温湿度确保IT设备处于最佳运行状态。冷却系统能耗占比差异显著,高效能的超大规模数据中心约为7%,而能效较低的企业数据中心可能超过30%。不间断电源电池与备用发电机可在断电时维持数据中心运行。这些设备虽很少启用,但对保障数据中心必须实现的超高可靠性至关重要 AI推升电力消耗 ➢数据中心总能耗≈[Σ(服务器空闲功耗+(峰值功耗-空闲功耗)*利用率)]*PUE*运行时间。数据中心的电力消耗由IT设备容量、利用率、空闲功率及基础设施能效(PUE)共同决定,并受其内部CPU、GPU等计算架构的直接影响。提高IT设备利用率、降低空闲功耗、降低PUE是管理能耗的核心要素。 ➢总安装容量包括IT容量和辅助设备的电力容量。一般情况下,数据中心并未完全装满服务器。最大设计容量指的是数据中心若装满服务器所能达到的最大功率容量;通常,该值小于总安装容量。 AI推升电力消耗 ➢功率与能耗之比是多少?数据中心并非全天24小时、全年8760小时都消耗满负荷功率,因为其计算负载会随用户需求和计划任务而波动,导致全年(如节假日、维护周期等期间)的功耗使用情况变化不定。因此,相应的有效满功率运行小时数应进行微调。 ➢考虑一个典型的使用场景:P为数据中心额定最大功率,2/3的时间处于75%负载,1/3的时间处于25%负载。能耗计算如下:(75%Px2/3+25%Px1/3)x24小时x365天≈5,110xP。以IT设备额定容量1GW时计算,年能耗约为5000GWh。若1GW为IT设备额定功率,则还需要考虑PUE的影响。 数据中心1年有效工作时长约为5000小时,即能耗与功率比值约为5000,1GW数据中心年耗电量约为5000GWh 数据来源:金元证券研究所整理 AI推升电力消耗 ➢2024年全球数据中心用电量达415TWh,约占全球总用电量的1.5%,但耗电量较为集中。美国、欧洲及中国的数据中心用电量合计约占全球总量的85%。其中,美国自2015-2024年期间,数据中心电力消耗以每年约12%的速度增长,增量约250TWh。2024年美国数据中心的用电量约为180TWh,占全球数据中心总用电量近45%,并且占据美国全口径总用电量的4%。2024年欧洲数据中心耗电量约为70TWh,约占欧洲总用电量比重略低于2%。 ➢中国数据中心也在2015年开始扩张,2015-2024年的电力需求年复合增长率达到15%。2024年国内数据中心用电量约为100TWh,大致与中国电动汽车的用电量相当,2024年占国内用电量比重约1.1%。不过,中国占全球数据中心耗电量的份额从十年前的不足20%升至25% AI推升电力消耗 ➢是否有用电量顾虑?全球2024年新增太阳能发电量达474TWh,新增太阳能发电量已经可以完全覆盖数据中心用电量(415TWh)。以Ember数据口径计算,2024年全球太阳能+风能合计发电量约为4625.45TWh,同比增长16.55%,约占全球用电量(以30,000TWh估算)的15.41%。其中,光伏2024年累计发电量2131.01TWh,约占全球用电量的7.1%。 ➢根据IEA预测,基准情况下,2030年数据中心电力消耗将增长至约945 TWh,比2024年翻倍以上,年均增长率约15%,占2030年全球电力消耗的近3%。其中,美国是最大市场,在基准情况中,2030年消耗将增至约420 TWh(比2024年增长130%),占全球增长的40%。人均消耗从2024年的540 kWh升至2030年的1,200 kWh。预计中国2030年达约275TWh(比2024年增长170%)。欧洲增长较缓,预计2030年消耗约115TWh(比2024年增长70%),但效率较高。 AI推升电力消耗 •采购可靠且成本效益高的电力供应,对于满足数