AI智能总结
算力租赁运营是国家算力节点大推进背景下,以及结合当前算力供需不匹配的矛盾下,迅速进入风口的新兴行业。(1)电信运营商具备强大的资源禀赋和算力网络,均在持续发力云业务的扩张,推荐标的为中国联通(A)、中国电信(H)、中国移动(H);(2)传统通信网络服务商:受益标的为润建股份、中贝通信;(3)国资IT服务商:受益标的为云赛智联;(4)传统IDC服务商:推荐光环新网,受益标的为润泽科技、首都在线;(5)其他赛道切入:受益标的为鸿博股份、恒润股份、利通电子。 算力租赁提供商介于下游算力需求方和上游算力生厂商之间,扮演提供算力的中介服务,降低了算力使用的门槛。算力租赁是指通过租用计算资源(如GPU)来提供计算能力的服务,这种模式的特点是“即租即用”,大型数据中心和云服务提供商将自身闲置的计算资源出租给下游急需算力资源的需求方,需求方无需自身投入大量的资金进行设备购买和运维团队搭建,就可以灵活、快速、高效的获得所需算力,降低了算力使用的门槛。 算力租赁的商业模式和核心竞争力与IDC十分类似。IDC全生命周期包括建设期、爬坡期和成熟期,算力租赁的商业模式与其十分类似,算力建设期通过渠道和现金能力搭建好算力资源后,爬坡期需要强大的获客能力将其转化为收入,缩短投入回收周期,同时强大的运维实力也能在整个生命周期有效提高各阶段毛利率,成熟期需要尽可能提高出租率摊薄成本,同时提供差异化的增值服务提高客户粘性。 各家公司根据自身基因切入算力租赁赛道,资金、渠道、获客、布局、运维是关键。(1)资金:搭建算力资源需要考虑大量的一次性成本投入、后期融资输血能力以及回收周期,这方面账面现金充裕以及大型的平台公司更具优势。(2)渠道:当下的高端GPU算力资源极度紧缺,这方面原先业务有一定关联性、具备稳定的、可持续的拿卡渠道资源的公司更具优势。(3)获客:未来获客和拿订单的能力才是转化成收入、提高毛利率的关键,这方面原先有稳定的大客户、和运营商有较好合作关系的公司更具优势。(4)布局:早期的布局规划一定程度上决定了后期的需求,这方面布局在“东数西算”核心枢纽节点的公司更具优势。(5)运维:运维能力能够在中后期有效降低成本,这方面以往有过运维经验的公司更具优势。 风险提示:算力资源供应不稳定的风险,下游租赁需求不及预期的风险,AI技术迭代的风险,行业竞争加剧的风险。 1.AI时代算力紧缺,算力租赁需求应运而生 1.1.AI模型训练算力增长速度超越芯片摩尔定律 AI模型训练算力增长速度超越芯片摩尔定律。AI训练任务中的算力增长(所需算力每3.5个月翻一倍)已经超越摩尔定律(晶体管数量每18月翻一倍)。 ChatGPT仅推出两个月,月活跃用户数预计已达1亿。ChatGPT在2023年1月达到1亿月活跃用户,平均每天有1,300多万访客,用2个月时间达到1亿月活数,成为史上最快达到1亿月活跃用户的应用,TikTok、Instagram、Facebook、Twitter则分别用了9个月、2年半、4年半、5年的时间。 图1:大模型时代算力需求增长超越摩尔定律 图2:ChatGPT仅用两个月月活跃用户突破1亿 1.2.短期无法匹配的供给缺口衍生出算力租赁需求 国内外算力需求爆发,GPU受限于产能扩张,供给严重短缺。英伟达旗下A100、H100、A800和H800等高性能GPU芯片应声涨价,旗舰级芯片H100四月中旬在海外电商平台售价超4万美元,甚至最高达到过6.5万美元。英伟达的中国特供版A800和H800芯片也不例外,A800的售价已较之前上涨约30%,服务器现货则由120多万元一台涨至接近140万元。目前A100、H100由台积电代工生产,并且依赖于CoWoS先进封装技术。 算力租赁提供商介于下游算力需求方和上游算力生厂商之间,扮演提供算力的中介服务,降低了算力使用的门槛。算力租赁是指通过租用计算资源(如GPU)来提供计算能力的服务,这种模式的特点是“即租即用”,大型数据中心和云服务提供商将自身闲置的计算资源出租给下游急需算力资源的需求方,需求方无需自身投入大量的资金进行设备购买和运维团队搭建,就可以灵活、快速、高效的获得所需算力,降低了算力使用的门槛。 图4:算力租赁使得下游灵活使用算力的门槛降低 2.AI时代算力激增衍生出算力租赁需求 2.1.AI大模型需要消耗大量算力,对中小企业来说成本负担较高 根据OpenAI资料,AI大模型的算力需求主要分为以下三类: 预训练算力需求:训练一次13亿参数的GPT-3 XL模型需要的全部算力约为27.5PFlop/s-day,而训练一次1,746亿参数的GPT-3模型需要的算力约为3,640 PFlop/s-day,对应的单次训练成本高达460万美元,普通的中小企业恐难承受。 日常运营算力需求:ChatGPT在日常与用户交互过程中需要大量的算力支持,结合访问量与内容量测算,单月运营算力约4,800PFlop/s-day;2023年1月ChatGPT官网总访问量已经达到6.16亿次,而ChatGPT每次交互产生的算力云服务成本约1~5美分,对应的单月运营成本高达千万美元。 调优迭代算力需求:ChatGPT模型需要不断进行Finetune模型调优,以确保模型处于最佳应用状态;预计每月模型调优带来的算力需求为82.5~137.5 PFlop/s-day。 图3:模型的尺寸在过去5年增长了5000倍 表1:不同NLP模型参数量及训练算力对比 2.2.算力租赁需求能够实质性降低下游的使用门槛 自建算力:以训练一次1,746亿参数的GPT-3模型为例,需要的算力约为3,640 PFlop/s-day,根据单张A100(80G)的参数,单张卡的算力约为0.6PFlop,则需要6000张左右,考虑到45%的训练有效性,则需要1.3万张左右,参考线上各渠道商报价,当下A100(80G)的单价约为10万元左右,则完成一次训练的成本过亿元,这还不包括日常运营算力需求和调优迭代算力需求。 算力租赁:同样以训练一次1,746亿参数的GPT-3模型为例,需要的算力约为3,640 PFlop/s-day,以国内目前不同平台同等规格的A100(80G)租赁价格为样本,均价为35.75元/小时,需要1.3万张左右,按一天24小时,训练一次30天来计算,通过算力租赁完成一次训练的成本为3亿元左右。 表2:国内目前不同平台的GPU租赁价格(截至2023年9月3日) 3.类IDC租赁模式,资源、订单、客户、布局等是 关键 3.1.我们认为算力租赁的商业模式与IDC十分类似 算力租赁的商业模式和核心竞争力与IDC十分类似,资金、渠道、获客、布局、运维是关键。IDC全生命周期包括建设期、爬坡期和成熟期,算力租赁的商业模式与其十分类似,算力建设期通过渠道和现金能力搭建好算力资源后,爬坡期需要强大的获客能力将其转化为收入,缩短投入回收周期,同时强大的运维实力也能在整个生命周期有效提高各阶段毛利率,成熟期需要尽可能提高出租率摊薄成本,同时提供差异化的增值服务提高客户粘性。 (1)资金:当下一张A100(80G)GPU的单价约为10万元左右,搭建算力资源需要考虑大量的一次性成本投入、后期融资输血能力以及回收周期,这方面账面现金充裕以及大型的平台公司更具优势。 (2)渠道:当下的高端GPU算力资源极度紧缺,这方面原先业务有一定关联性、具备稳定的、可持续的拿卡渠道资源的公司更具优势。 (3)获客:未来获客和拿订单的能力才是转化成收入、提高毛利率的关键,这方面原先有稳定的大客户、和运营商有较好合作关系的公司更具优势。 (4)布局:早期的布局规划一定程度上决定了后期的需求,这方面布局在“东数西算”核心枢纽节点的公司更具优势。 (5)运维:运维能力能够在中后期有效降低成本,这方面以往有过运维经验的公司更具优势。 图4:IDC各时期要求的能力和壁垒不同 图5:算力租赁各阶段的核心竞争力与IDC十分类似 3.2.各家公司根据自身基因切入算力租赁赛道 各家公司根据自身基因切入算力租赁赛道,行业方兴未艾。各级公司的布局思路如下表: 表3:各家公司根据自身基因切入算力租赁赛道 4.投资建议 算力租赁运营是国家算力节点大推进背景下,以及结合当前算力供需不匹配的矛盾下,迅速进入风口的新兴行业,与当年IDC发展初期类似,资源禀赋、区域布局和获客能力、运维能力是关注重点。(1)电信运营商具备强大的资源禀赋和算力网络,均在持续发力云业务的扩张,推荐标的为中国联通(A)、中国电信(H)、中国移动(H);(2)传统通信网络服务商:受益标的为润建股份、中贝通信;(3)国资IT服务商:受益标的为云赛智联;(4)传统IDC服务商:推荐光环新网,受益标的为润泽科技、首都在线;(5)其他赛道切入:受益标的为鸿博股份、恒润股份、利通电子。 表4:主要公司盈利预测与估值(全部使用人民币计价) 5.风险提示 风险提示:算力资源供应不稳定的风险,下游租赁需求不及预期的风险,AI技术迭代的风险,行业竞争加剧的风险。