共4866字阅读需10分钟 AI云服务公司Nebius发布了GPU定价调整通知,自6月1日起将H100、H200、B200、B300全系列GPU的按需租赁价格全面上调。H100从2.95美元/小时涨至3.85美元/小时,涨幅31%;B200从5.50美元/小时涨至7.15美元/小时,涨幅30%。 这一表面看似普通的"涨价通知",实则是全球AI算力供需极度失衡在定价端的一次集中映射。据SemiAnalysis数据,H100一年期GPU租赁合同价格已从2025年10月的1.70美元/小时/GPU飙升至2026年3月的2.35美元/小时/GPU,涨幅近40%。更激进的B300算力卡现货租赁价格从2025年12月的5.68美元/小时攀升至2026年4月的9.87美元/小时,涨幅高达74%。国内方面,腾讯云、阿里云、百度云等主要云供应商2026年上半年已集体将AI相关服务价格上调5%至400%不等。 一、发生了什么?GPU租赁价格再涨 AI云服务公司Nebius发布了GPU定价调整通知,自6月1日起将H100、H200、B200、B300全系列GPU的按需租赁价格全面上调。H100从2.95美元/小时涨至3.85美元/小时,涨幅31%;B200从5.50美元/小时涨至7.15美元/小时,涨幅30%。 这一表面看似普通的"涨价通知",实则是全球AI算力供需极度失衡在定价端的一次集中映射。据SemiAnalysis数据,H100一年期GPU租赁合同价格已从2025年10月的1.70美元/小时/GPU飙升至2026年3月的2.35美元/小时/GPU,涨幅近40%。更激进的B300算力卡现货租赁价格从2025年12月的5.68美元/小时攀升至2026年4月的9.87美元/小时,涨幅高达74%。国内方面,腾讯云、阿里云、百度云等主要云供应商2026年上半年已集体将AI相关服务价格上调5%至400%不等。 以Nebius为代表的头部算力租赁平台全面涨价,并非简单的市场短期套利行为,而是高端GPU供给刚性、AI工作负载从训练驱动转向推理驱动、以及下游企业AI应用全面渗透三者共振下的结构性价格中枢系统性抬升。在这三者中,"推理驱动"的结构性变革最为关键——Nebius官方数据显示,当前90-95%的企业需求来自推理而非训练,这意味着Token经济的爆发正以前所未有的速度消耗算力资源。 Nebius涨价的直接驱动力,在数据层面呈现为需求结构的根本性转变。Nebius代表曾公开表示,当前90-95%的企业需求并非 来自模型训练,而是来自推理——即运行已构建好的AI应用。这一数字的产业含义极为深远。 传统的算力需求增长叙事通常遵循"训练先行→训练功耗上升→推理滞后增长"的线性路径。但Nebius数据揭示的图景截然不同:推理需求已经取代训练,成为算力消耗的第一大驱动力。这意味着,当前算力租赁市场的需求端出现了彻底的范式切换——算力不再只是"开发者的工具",而是"AI应用的日常基础设施"。 Token调用量的激增为这一转变提供了定量印证。据国家数据局披露,2024年初中国日均Token调用量为1000亿,到2025年底跃升至100万亿,2026年3月已突破140万亿,两年增长超千倍。国盛证券指出,预计到2030年中国整体Token调用量将进一步扩容至日均19306万亿,2025-2030年CAGR高达210%。当每一条Token的生成都对应着一次推理调用,而每一次推理调用都需要GPU算力支撑时,算力租赁需求的指数级扩张便具备了坚实的微观基础。 Nebius涨价并非孤例。2026年上半年,包括腾讯云、阿里云和百度云在内的中国主要云供应商均宣布了AI算力相关服务的价格上调,涨幅从5%到400%以上不等。腾讯高层在业绩会上明确表示,AI相关服务需求在持续增长,今年资本支出相比去年 将有所增加,特别是在下半年。阿里巴巴CEO吴泳铭更直言,"现在阿里服务器内几乎没有一张卡是空的",基于未来3-5年的需求判断,资本支出或将超过最初宣布的3800亿元。 从边际供需看,这一轮涨价的底层逻辑非常清晰:ChatGPT、Claude、豆包、Kimi等大模型的推理需求爆炸式增长,叠加企业级AI应用规模化落地,使算力供给在短时间内从"产能紧张"演变为"结构性短缺"。而在定价端,租用算力的客户并未因涨价而退出——相反,Nebius的用户宁可承受涨价也不愿释放已锁定的算力资源,这恰恰是价格接受度最有力的信号。 AI算力作为一种“准基础设施资产”,其租赁价格的连续上涨背后,存在更本质的逻辑——AI正在从“工具”演变为“基础设施”,推理侧的Token消耗模式不再遵循传统算力的边际递增规律,而是呈现出“应用越多—Token消耗越大—算力需求越刚性”的特征。 二、为什么重要?算力租赁正从"可选项"演变为"必选项" ①需求侧:Token经济的指数级扩张 算力租赁的需求增长并非线性的,而是呈现出由生态裂变驱动的跳跃式扩张。Agent及AI Coding正在带动需求端的结构性跃升,供需缺口推动算力租赁及云服务价格上修。 这一判断可以在微观层面得到充分验证。Anthropic推出的编程Agent Claude Code商业化能力突出,使得Anthropic的ARR在2026年4月已达300亿美元,一个季度内增长两倍多,较2025年底的90亿美元实现了数量级跃迁。紧随其后,开源项目OpenClaw在GitHub上线后掀起全球"养虾热",其创始人曾公开表示"一行代码都没写",而是作为产品经理向AI描述需求,由AI生成代码。 与此同时,中国AI模型的海外表现同样亮眼。OpenRouter数据显示,2026年初连续六周,全球调用量最高的顶级AI模型均来自中国。Kimi海外收入已超过国内收入,MiniMax约73%的收入来自国际市场。这一"中国模型出海"的趋势不仅是商业上的突破,更意味着中国AI模型产生的推理Token中有相当一部分需要在中国以外的算力资源上处理,形成对全球算力基础设施的增量需求。 ②供给侧:算力交付的"量"与"价"双重约束 供给侧的刚性约束可以从供应量和供应成本两个角度展开。 在供应量层面,英伟达从核心GPU供应商升级为AI算力交付体系的指挥塔,意味着单颗GPU的缺口,已不再是"芯片不够",而是"GPU+服务器+网络+冷却+电力"全栈短缺。英伟达自身已将其2026年Rubin GPU产量目标从200万颗下修至150万颗。 TrendForce数据表明,2026年英伟达高端GPU出货量的年增率将从原本预估的约26.8%微幅下修至近26%。这个看似小幅的修正背后,是在绝对基数膨胀后面临的更大产出缺口。更关键的是,2026年8-9月前上线的新一代Blackwell系列产能已被全部预订,算力仍是当前绝对的稀缺资产。 在供应成本层面,硬件价格上涨已开始向算力租赁端传导。由于全球AI需求爆发、供应链涨价,行业核心硬件采购成本显著上涨,海外市场涨价动作更早,国内云厂也纷纷上调算力及相关服务价格。对于算力租赁企业来说,在增量供给释放速度有限的情况下,涨价成为平衡供需、保障资本开支回报的唯一路径。 算力租赁赛道之所以成为当前AI产业链中“锐度最高”的资产,根源在于商业模型具备双重优势:业绩兑现周期清晰可控,且折旧前置带来的长期利润弹性为表观利润提供了非线性增长空间。 算力租赁企业的商业模式以周期为2至5年的承诺制长期合同为主。按英伟达存储的整体架构为例,合同期限内客户必须预留算力容量并支付固定费用,计费单位按“每签约GPU每小时”定价。 折旧期的隐性红利之外,算力设备的残值重估也为盈利空间注入了额外弹性。以当前供需比测算,即便进入折旧末期,二手GPU在挖矿与边缘场景中的商业化价值仍将高于账面残值。该情形在企业出售回租、设备置换或资产证券化环节均可能实现账面额外的资本利得。 我们正见证一场前所未有的“硅基资产”重估。算力租赁,这一曾被视为单纯IDC(数据中心)演进的业务,已正式跨越“资源中介”阶段,演变为AI时代的数字金融与战略物资中心。预计未来三年全球算力租赁市场将保持55%以上的复合年增长率。 三、接下去关注?算力大宗商品化 2026年5月12日,芝加哥商品交易所集团(CME)与GPU市场情报和基准数据供应商Silicon Data宣布将合作推出算力期货市场。新期货合约将基于Silicon Data编制的指数构建,这是全球首个针对按需租赁GPU费率的每日基准指标。期货合约类型为现金结算期货,无实物交割。CME首席执行官直言,"作为数字经济的支柱,算力是21世纪的新石油",算力本身正迅速成为一个新兴的资产类别。 算力期货的推出标志着AI基础设施正式进入金融资本时代。对算力租赁行业而言,这意味着三个重要变化:一是算力资源的定价将变得更加透明和标准化,有利于头部提供商通过风险管理工具锁定收益率;二是算力租赁行业将获得更多主流资本市场的认可和接入,融资成本有望进一步下降;三是算力的"资产 属性"被正式定价,这与Nebius等公司正在推动的"长期合约锁定现金流"策略形成了完整的金融闭环——算力不再只是租赁品,而是具有可交易、可对冲、可定价的完整资产属性。 我们认为算力租赁赛道已从概念验证期跨入业绩加速兑现期,行业价值可沿“主赛道核心资产—上游组件高弹性—下游运营基础设施”三条主线进行穿透布局。 主线一:主赛道算力租赁/云计算(核心直接受益层) 此板块包括A股最具代表性的算力服务厂商——该板块的共性是财务上的“量价双增”与“长约锁定”双保障,以及头部厂商定增、融资租赁等资本运作持续领跑行业。在当前整体行业标的相对稀缺的环境下,主赛道资产对应的业绩确定性最强。 主线二:超节点与服务器代工(扩产受益层) 超节点系统中的核心OEM及交换机企业同步深化设施级算力。超节点建设已从前期战略布局阶段进入实际部署和规模化交付阶段,从当前NVL72机柜的供应链扩散测度看,相关公司的收入弹性仍处上升初期。 主线三:服务器组件(上游延伸层) 将算力租赁的景气逻辑在上游转化为零部件的需求放量和产品升级。首选方向是光模块,存储,散热,电源以及连接器。 下游:数据中心基础设施(底层负荷受益层) 当数据中心从通用托管向高密度智能算力中心转换之际,提供底层机柜资源和智算一体化运维的公司具备重估潜力。 对于价格走势,未来12个月存在两种关键情景: 情景A(基准预测):持续高位震荡。在该情景下,高端GPU供给释放速度基本匹配需求增速,下游客户接受涨价并将成本向下传导。Nebius等头部厂商维持"长协锁定+现货溢价"双轨策略,现货价格维持在约20-30%的溢价区间。该情景实现概率约60%。 情景B(乐观预测):进一步超预期上涨。若Token调用量增速持续超预期,或英伟达供给端再次出现扰动,现货溢价可能进一步扩大到30-50%。B300现货租金有可能突破12美元/小时。该情景实现概率约20%。 算力租赁行业正处于推理型ToC产业周期的左侧初期——上、中、下游数据的全链路交互验证表明,算力赛道在一级市场和公开市场的投融资活跃度仍将持续升温趋势,VC市场中已完成超10亿元量级推理GPU专场融资等多轮标志性事件。相较于智 能制造、具身智能等市场商业化高不确定性的领域,算力租赁凭借3至5年长约锁定的业绩可预测性、量产规模带来的高毛利空间和与AI大模型产业相生相伴的强需求黏性,正成为机构资金从“配置预期”向“配置变现”过渡的核心载体。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。