行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

高端GPU供需错配驱动算力租赁高景气-华尔街见闻-20260428

2026-04-29 未知机构尊敬冯

高端GPU供需错配驱动算力租赁高景气

核心观点

供需错配：高端GPU禁令导致国内算力供需缺口巨大，第三方租赁成为大模型厂商获取核心算力的刚性渠道。
商业模式演进：算力租赁由固定租金向Token分成模式演进，通过“算电融合”利用绿电补贴降低成本，实现1.2-1.5年的快速回本周期。
核心壁垒：拿卡能力与算电融合构筑核心壁垒，核心竞争力由单纯资金实力转向对GPU的获取、拆解、运输、组装及测试的全链路掌控力。

关键数据

GPU价格：H800/H100现货与期货市场需求旺盛，预计2025年转向H200，2025年下半年起订单转向B系列GPU期货（B200/B300）。
需求规模：大型企业如阿里巴巴面临“一卡难求”，预计2026年A公司GPU卡需求量10万张左右，总需求可能达20万张以上。
国产GPU性能差距：国产算力在推理性能上与H100/B200存在4-5倍代差，训练场景下英伟达GPU仍具垄断地位。
投资回报：理想情况下投资回报周期2年左右，退税等政策可提升净利润率。

竞争格局

云厂商采购标准：要求供应商具备千卡至万卡规模、数据中心近场优势及NCP（英伟达云合作伙伴）背书。
主要供应商：协创、盈峰、利通、宏景等已具备获取B系列GPU能力，协创作为英伟达NCP拥有稳定台湾货源渠道。
合作模式：固定价格租赁为主，Token分成模式为辅，后者需深度合作且对供应商技术能力要求高。

核心竞争力

资金实力：支持大规模采购和运营。
拿卡能力：涵盖海外采购、拆解运输、国内组装及压力测试的全链路技术与渠道掌控力。
数据中心选址：靠近客户数据中心以降低数据迁移成本和合规风险。

盈利模式

传统模式：基础租赁费用+Token超额利用率分成。
Token分成模式：基于模型产生的Token进行收益分成，需深度合作且算力提供方需具备绿电等成本优势。
平台价值：通过资源池化、超配技术榨取算力价值，将超额收益留在公司内部。

未来趋势

算力需求：持续旺盛，无上限扩张空间。
竞争焦点：B系列GPU集群资源，具备获取能力的供应商将占据优势。
商业模式：Token分成模式或成为重要补充，但固定价格租赁仍是主流。

VIP原创行业：制造业2026/04/2810:14:11 要点高端GPU禁令导致国内算力供需缺口巨大，第三方租赁成为Ali、Kimi、DeepSeek等大模型厂商获取H200/B200等核心算力的刚性渠道。算力租赁商业模式由固定租金向Token分成演进，通过“算电融合”利用绿电补贴降低成本，实现1.2-1.5年的快速回本周期。大型云厂商对供应商准入门槛极高，要求具备千卡至万卡规模、数据中心近场优势及NCP（英伟达云合作伙伴）背书。核心竞争力由单纯资金实力转向“拿卡能力”，涵盖海外采购、拆解运输、国内组装及压力测试的全链路技术与渠道掌控力。国产算力在推理性能上与H100/B200存在4-5倍代差，且训练场景下英伟达GPU仍具不可替代的垄断地位。云厂商通过资源池化与超配技术榨取算力价值，倾向于固定价格租赁以独享Token产出增值，算力采购规模随盈利闭环无上限扩张。本文共5734字，预计阅读时间12分钟已享VIP免费以下内容为专家观点： Q&A 当前算力租赁行业的整体景气度如何？以英伟达B系列GPU为例，其现货与期货市场的价格情况是怎样的，并且您预估此轮高景气周期将持续多久？算力租赁赛道一直存在，但近两三年规模显著扩大，尤其是在2023年A800GPU出现短缺后，各公司的对外租赁需求明显增加。核心驱动因素在于英伟达高端GPU无法正常进入中国市场，预计未来一到三年内，这种旺盛的市场需求将持续存在。当前，以大模型为主导的应用需求，特别是模型迭代速度极快，导致国内主要厂商如Ali、Kimi、智谱AI、DeepSeek及其他大型企业的高端算力严重不足，供需缺口巨大。这一缺口主要依赖第三方算力租赁来填补，因为需求具有确定性和刚性。第三方租赁公司规模相对较小，不易成为制裁目标，只要在国内获得政策许可并正常纳税，就能形成商业闭环。因此，当前是国内算力租赁市场发展的良好时机。从需求端看，无论是现货还是期货，市场需求都非常旺盛。企业在2023年和2024年主要采购H800和H100，到2025年则转向H200。自2025年下半年起，订单开始转向B系列GPU的期货，例如B200和B300。关于B系列GPU的价格走势，您认为其价格上涨的趋势是否会持续，从而使服务器长期维持在高价位水平？价格预计将持续上涨。这主要是由供需关系决定的：需求确定存在，但供给受限。由于英伟达的GPU无法通过正常渠道进入，导致供给无法满足旺盛的需求，尤其是来自大型企业的需求。虽然租赁市场能够获得部分货源，但这些GPU在故障率、稳定性、完整性和规模性方面存在一定瑕疵。租赁商难以一次性采购数万张规模的GPU，因为这会增加被监管的风险。此外，这些GPU通常需要拆分运输而非整机交付，这些因素共同导致了供给的稀缺性，从而推动价格持续走高。像阿里巴巴这样的大型企业是否也面临“一卡难求”的局面？目前在阿里巴巴的算力租赁供应商中，哪些公司占据了主要份额，整个竞争格局如何？是的，大型企业同样面临GPU短缺的问题。只要供应商资质符合要求，阿里巴巴这类公司对于算力租赁合作的意愿是很强的。大型科技公司在选择算力租赁服务商时，会重点考量哪些特质？大型科技公司选择算力租赁服务商时，主要考量以下几个关键因素：首先是算力规模，由于内部流程涉及法务、财务等多个部门，协调成本较高，因此服务商至少需要具备千卡规模，万卡规模则更具吸引力，几十张卡的规模不具备商谈的可行性。所以卡的数量重要。其次是数据中心的位置，考虑到数据迁移的便捷性和合规性，靠近公司机房的数据中心更具优势。例如，若算力服务商的数据中心位于广东，而客户（如广汽）的数据主要存储在公司云上，远距离的数据迁移会引发合规问题。第三是算力集群的稳定性，公司会对算力集群进行稳定性及故障率等指标的测试，并设有相应的标准。第四是价格。最后，服务商的背景和资质也至关重要。具备强大背书，如英伟达为其NCP（NVIDIACloudProvider）伙伴协创提供的背书，能显著增强信任。对于新晋服务商，获得如运营商（例如联通）的背书，或拥有良好的财务状况和银行信用背书，有助于快速进入采购渠道。结合当前市场需求紧缺的背景，未来哪些算力服务商在B系列GPU集群的竞争中可能更具发展前景？当前市场算力需求非常紧缺，即便是快手这类规模的公司也面临算力不足的困境。在此背景下，能够获得B系列GPU（如B200或B300）资源的供应商将拥有显著的竞争优势，因为市场对此类资源的需求没有上限。在国内市场，协创、盈峰、利通、宏景等几家公司在2026年据了解已具备获取B系列GPU的能力，因此有机会参与市场竞争。其中，协创作为英伟达的NCP，拥有富士康等稳定的台湾货源渠道，在2025年已是市场重要的算力来源。除了获取GPU的能力，服务商的综合实力同样关键。具备雄厚资金实力、丰富渠道资源以及与大型科技公司历史合作经验的服务商。此外，盈峰在绿电方面的布局也是一个加分项，因为使用绿电可以获得地方政府的补贴，符合大型科技公司对可持续发展的要求。尽管合同中可能约定了交付罚则，但从2025年的实践来看，若供应商因故无法按时交付，虽无实际经济惩罚（其实有保证金惩罚），但会失去未来的合作机会。除了传统的算力租赁模式，市场上是否出现了新的合作与计费模式？是的，市场上正在探索一种新的合作模式，即Token分成模式，也称为Token租赁。在这种模式下，模型公司与算力服务商不再采用传统的按时或按卡付费的租赁方式，而是基于模型产生的Token进行收益分成。这种深度的绑定合作方式，能够促使双方进行更深层次的系统级落地与协同，从而建立更稳固的合作关系。若算力服务商能与大型科技公司达成此类深度合作，将有助于其在市场竞争中占据更有利的地位。在算力租赁业务中，基础的租赁费用模式与新兴的Token分成模式有何不同？后者实现的条件、潜在优势以及对租赁市场可能产生的影响是什么？算力租赁的商业模式正在演变。传统模式下，会有一个基础的租赁费用，例如一张H800卡每月租金约为25万至30万元，这保障了算力提供方的基本收入。在此基础上，当算力使用超出约定阈值时，例如日均Token处理量超过10亿或30亿，算力利用率也随之提升，便会触发分成机制。一种新兴的模式是“算电融合”或“电算融合”，即基于Token产出的分成模式。这种模式的实现需要租赁双方进行深度合作，确保Token的输入与输出对双方都是透明可见的。算力提供方需要具备独特的优势，例如能够提供绿电资源，从而吸引云厂商或大模型公司进行合作。通过利用绿电政策，算力提供方可以降低单个Token的成本，当Token产出量超过一定阈值时，其收益便能与基础租赁费用持平甚至更高。算力提供方必须能够精确计算出这一成本与收益的平衡点，才能具备与云厂商谈判的资格。对于大模型厂商而言，尤其是一些初创公司如智谱AI，这种分成模式也颇具吸引力。它们可以将大部分（例如60%至80%）的Token销售收入分给算力提供方，自身保留剩余部分。由于大模型厂商在此模式下没有前期高昂的算力硬件成本，只赚取技术服务费，因此依然能够盈利。这种基于Token分成的模式为租赁市场带来了新的可能性。它改变了传统租赁模式中因租赁周期短（如仅6个月）而导致的高闲置成本风险。服务器一旦闲置，成本极高，一台月租30万的服务器若闲置6个月，就很难收回成本，而通常算力卡的回收周期在11个月到1年半之间。基于分成的模式则有望实现长期且可持续的盈利。不过，这种模式并非普遍适用，与腾讯、阿里、字节跳动等大厂谈判此类合作的门槛较高，除非存在深度的战略合作关系，否则他们未必会接受。从算力供给角度看，当前国内市场面临的主要挑战是什么？这些挑战如何影响算力服务的价格，并对相关公司的核心竞争力提出了哪些要求？当前国内算力供给面临的核心挑战是高端GPU卡的严重短缺，这导致了算力服务价格的持续上涨。由于美国的限制政策以及国内海关的管制，高端NVIDIAGPU卡无法像过去那样通过正常渠道大规模进入国内市场，无法获得官方的售后保障。预计今年（2026年）市场主力是B系列芯片，明年（2027年）将是Rubin架构芯片，但需求将持续无法得到满足。进入国内的卡数量非常有限，预计总量不到正常状态下供应量的20%。巨大的需求缺口与有限的供给形成鲜明对比，使得算力短缺成为一个长期存在的刚性问题。在这一背景下，企业的核心竞争力体现在以下几个方面：首先是资金实力，必须有雄厚的资本支持。其次是“拿卡能力”，即获取GPU卡的渠道能力，这成为最关键的因素。谁能打通更多通道，谁就能获得更多卡，效率也更高。这种能力不仅指购买，还包括一系列复杂的操作流程：在海外购买后进行拆解，运至国内后再进行分装、组装和压力测试。这个过程需要具备强大技术背景的专业团队和高效的工厂流水线作业能力，以确保拆解后的GPU卡在国内重新组装后能够正常运行。最后，数据中心的选址也至关重要。因此，未来具备成长性的公司，必须是在资金、拿卡渠道及后续处理能力上都具备优势的企业。在当前的算力市场格局下，哪些公司与A公司的合作较为紧密？预计A公司今年（2026年）的GPU卡需求量以及潜在的合作方有哪些？去年（2025年），宏景和协创是市场上出货量较大的几家公司。对于今年（2026年），A公司的GPU卡需求量预计在10万张左右是比较可靠的估算，尽管有传闻称总需求可能达到二十万张以上。这个预估也考虑到了A公司可能会扩大其自研芯片（如昇腾芯片）的使用规模。在潜在的合作方中，盈峰，其拥有的绿电资源以及资金优势可能成为今年（2026年）获取合作机会的一大优势。盈峰公司2026年的算力集群规划是怎样的？其在华南地区的选址布局是否具备竞争优势？在新的万卡份额中，盈峰可能获得比较多集群的份额，盈峰在阿里的业务中仍有较大机会，主要得益于其优越的选址。特别是在华南地区，盈峰有两处选址颇具吸引力，而A公司去年的业务主要集中在华北和华东。对于A公司这类大型云厂商而言，与其合作的算力集群需要满足怎样的最低规模要求？具体的业务合作流程是怎样的？ A公司这类大型云厂商对合作的算力集群有明确的规模门槛，通常最低要求是千卡级别。一个仅有几十或几百张高端卡的集群，它们基本不会考虑合作。因为这些算力资源最终是提供给其客户使用的，如果集群规模过小，无法满足客户的需求，客户不会采购，A公司自然也不会采购。业务合作是一个完整的项目制流程，例如，当客户提出1,800张卡的明确需求，且对某处集群的位置满意，相关部门便会启动项目。该项目需经过内部申报、报价、法务、财务等多个环节的审批，最终由业务方确认买单。此外，终端客户通常需要预先签订合同并支付一定比例（如30%或40%）的预付款，整个项目才能顺利推进。若客户需求为18,000张卡，而供应商只能提供1,800张，项目则无法成立。算力租赁行业的净利润率水平和投资回报周期是怎样的？税收返还和绿电等因素对利润有何影响？算力租赁行业的净利润率比较稳定。在理想情况下，特别是与大厂签订长期租赁合同（如三年或五年），投资回报周期可以缩短至两年左右。根据内部测算，通常在2至2.5年内可以实现回本。至于退税等额外利润贡献，并非普遍情况，主要取决于地方政府的扶持政策。例如，如果能够获得绿电资源，将大幅降低电力成本，从而显著提升净利润率。当前算力租赁的租金定价模式是怎样的，是固定价格还是会根据服务器价格浮动？租金价格会浮动，但并非跟随服务器价格，而是根据客户情况而定。具体而言，定价基于获取算力（例如B200）的成本。在此基础上，业务部门可以根据具体情况将价格再上浮30%至40%。即使客户无法接受较高的溢价，出于内部财务审核要求，也至少会象征性地增加一定利润。能够对客户提价的主要原因是什么？是因为当前算力需求旺盛，供不应求吗？需求旺盛是其中一个方面，但更根本的原因在于平台自身的价值和能力。公司拥有强大的平台调度能力和infra能力，能够对算力资源进行池化和超配，从而最大

点击免费查看完整报告