行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

算力再涨价：从Nebius全面涨价看GPU供需的结构性错配 – 华尔街见闻-20260522

2026-05-22 未知机构 Michael Wong 香港继承教育

核心观点与关键数据

GPU供需结构性错配导致算力价格上涨：Nebius等头部算力租赁平台全面上调H100、H200、B200、B300系列GPU按需租赁价格，H100涨幅31%，B200涨幅30%。全球AI算力供需极度失衡，H100一年期租赁价格涨幅近40%，B300现货租赁价格涨幅高达74%。
AI工作负载从训练转向推理：Nebius数据显示，90-95%的企业需求来自推理而非训练，Token经济的爆发正以前所未有的速度消耗算力资源。中国日均Token调用量从2024年初的1000亿跃升至2025年底的100万亿，2026年3月突破140万亿，预计到2030年将进一步扩容至日均19306万亿。
算力租赁需求跳跃式扩张：Agent及AI Coding带动需求端结构性跃升，Anthropic ARR在2026年4月达300亿美元，OpenClaw掀起全球"养虾热"。中国AI模型海外表现亮眼，Kimi海外收入已超过国内收入，MiniMax约73%的收入来自国际市场。

供给侧刚性约束

供应量受限：英伟达将自身2026年Rubin GPU产量目标下修至150万颗，高端GPU出货量年增率微幅下修至近26%。2026年8-9月前上线的新一代Blackwell系列产能已被全部预订。
供应成本上涨：硬件价格上涨已开始向算力租赁端传导，行业核心硬件采购成本显著上涨，推动海外及国内云厂上调算力及相关服务价格。

算力租赁赛道优势

商业模式具备双重优势：业绩兑现周期清晰可控，折旧前置带来长期利润弹性。算力租赁企业以周期为2至5年的承诺制长期合同为主，计费单位按“每签约GPU每小时”定价。
算力租赁成为AI时代的数字金融与战略物资中心：算力租赁赛道已从概念验证期跨入业绩加速兑现期，预计未来三年全球算力租赁市场将保持55%以上的复合年增长率。

算力大宗商品化

算力期货市场推出：CME与Silicon Data合作推出算力期货市场，标志着AI基础设施正式进入金融资本时代。
三个重要变化：算力资源定价将更加透明和标准化，算力租赁行业将获得更多主流资本市场的认可和接入，算力的"资产属性"被正式定价。

投资建议

三条主线进行穿透布局：
- 主线一：主赛道算力租赁/云计算（核心直接受益层）
- 主线二：超节点与服务器代工（扩产受益层）
- 主线三：服务器组件（上游延伸层）
- 下游：数据中心基础设施（底层负荷受益层）

价格走势预测

情景A（基准预测）：持续高位震荡，高端GPU供给释放速度基本匹配需求增速，下游客户接受涨价并将成本向下传导。Nebius等头部厂商维持"长协锁定+现货溢价"双轨策略，现货价格维持在约20-30%的溢价区间。
情景B（乐观预测）：进一步超预期上涨，若Token调用量增速持续超预期，或英伟达供给端再次出现扰动，现货溢价可能进一步扩大到30-50%。B300现货租金有可能突破12美元/小时。

研究结论

算力租赁行业正处于推理型ToC产业周期的左侧初期，算力赛道在一级市场和公开市场的投融资活跃度仍将持续升温趋势。相较于智能力制造、具身智能等市场商业化高不确定性的领域，算力租赁凭借3至5年长约锁定的业绩可预测性、量产规模带来的高毛利空间和与AI大模型产业相生相伴的强需求黏性，正成为机构资金从“配置预期”向“配置变现”过渡的核心载体。

共4866字阅读需10分钟 AI云服务公司Nebius发布了GPU定价调整通知，自6月1日起将H100、H200、B200、B300全系列GPU的按需租赁价格全面上调。H100从2.95美元/小时涨至3.85美元/小时，涨幅31%；B200从5.50美元/小时涨至7.15美元/小时，涨幅30%。这一表面看似普通的"涨价通知"，实则是全球AI算力供需极度失衡在定价端的一次集中映射。据SemiAnalysis数据，H100一年期GPU租赁合同价格已从2025年10月的1.70美元/小时/GPU飙升至2026年3月的2.35美元/小时/GPU，涨幅近40%。更激进的B300算力卡现货租赁价格从2025年12月的5.68美元/小时攀升至2026年4月的9.87美元/小时，涨幅高达74%。国内方面，腾讯云、阿里云、百度云等主要云供应商2026年上半年已集体将AI相关服务价格上调5%至400%不等。一、发生了什么？GPU租赁价格再涨 AI云服务公司Nebius发布了GPU定价调整通知，自6月1日起将H100、H200、B200、B300全系列GPU的按需租赁价格全面上调。H100从2.95美元/小时涨至3.85美元/小时，涨幅31%；B200从5.50美元/小时涨至7.15美元/小时，涨幅30%。这一表面看似普通的"涨价通知"，实则是全球AI算力供需极度失衡在定价端的一次集中映射。据SemiAnalysis数据，H100一年期GPU租赁合同价格已从2025年10月的1.70美元/小时/GPU飙升至2026年3月的2.35美元/小时/GPU，涨幅近40%。更激进的B300算力卡现货租赁价格从2025年12月的5.68美元/小时攀升至2026年4月的9.87美元/小时，涨幅高达74%。国内方面，腾讯云、阿里云、百度云等主要云供应商2026年上半年已集体将AI相关服务价格上调5%至400%不等。以Nebius为代表的头部算力租赁平台全面涨价，并非简单的市场短期套利行为，而是高端GPU供给刚性、AI工作负载从训练驱动转向推理驱动、以及下游企业AI应用全面渗透三者共振下的结构性价格中枢系统性抬升。在这三者中，"推理驱动"的结构性变革最为关键——Nebius官方数据显示，当前90-95%的企业需求来自推理而非训练，这意味着Token经济的爆发正以前所未有的速度消耗算力资源。 Nebius涨价的直接驱动力，在数据层面呈现为需求结构的根本性转变。Nebius代表曾公开表示，当前90-95%的企业需求并非来自模型训练，而是来自推理——即运行已构建好的AI应用。这一数字的产业含义极为深远。传统的算力需求增长叙事通常遵循"训练先行→训练功耗上升→推理滞后增长"的线性路径。但Nebius数据揭示的图景截然不同：推理需求已经取代训练，成为算力消耗的第一大驱动力。这意味着，当前算力租赁市场的需求端出现了彻底的范式切换——算力不再只是"开发者的工具"，而是"AI应用的日常基础设施"。 Token调用量的激增为这一转变提供了定量印证。据国家数据局披露，2024年初中国日均Token调用量为1000亿，到2025年底跃升至100万亿，2026年3月已突破140万亿，两年增长超千倍。国盛证券指出，预计到2030年中国整体Token调用量将进一步扩容至日均19306万亿，2025-2030年CAGR高达210%。当每一条Token的生成都对应着一次推理调用，而每一次推理调用都需要GPU算力支撑时，算力租赁需求的指数级扩张便具备了坚实的微观基础。 Nebius涨价并非孤例。2026年上半年，包括腾讯云、阿里云和百度云在内的中国主要云供应商均宣布了AI算力相关服务的价格上调，涨幅从5%到400%以上不等。腾讯高层在业绩会上明确表示，AI相关服务需求在持续增长，今年资本支出相比去年将有所增加，特别是在下半年。阿里巴巴CEO吴泳铭更直言，"现在阿里服务器内几乎没有一张卡是空的"，基于未来3-5年的需求判断，资本支出或将超过最初宣布的3800亿元。从边际供需看，这一轮涨价的底层逻辑非常清晰：ChatGPT、Claude、豆包、Kimi等大模型的推理需求爆炸式增长，叠加企业级AI应用规模化落地，使算力供给在短时间内从"产能紧张"演变为"结构性短缺"。而在定价端，租用算力的客户并未因涨价而退出——相反，Nebius的用户宁可承受涨价也不愿释放已锁定的算力资源，这恰恰是价格接受度最有力的信号。 AI算力作为一种“准基础设施资产”，其租赁价格的连续上涨背后，存在更本质的逻辑——AI正在从“工具”演变为“基础设施”，推理侧的Token消耗模式不再遵循传统算力的边际递增规律，而是呈现出“应用越多—Token消耗越大—算力需求越刚性”的特征。二、为什么重要？算力租赁正从"可选项"演变为"必选项" ①需求侧：Token经济的指数级扩张算力租赁的需求增长并非线性的，而是呈现出由生态裂变驱动的跳跃式扩张。Agent及AI Coding正在带动需求端的结构性跃升，供需缺口推动算力租赁及云服务价格上修。这一判断可以在微观层面得到充分验证。Anthropic推出的编程Agent Claude Code商业化能力突出，使得Anthropic的ARR在2026年4月已达300亿美元，一个季度内增长两倍多，较2025年底的90亿美元实现了数量级跃迁。紧随其后，开源项目OpenClaw在GitHub上线后掀起全球"养虾热"，其创始人曾公开表示"一行代码都没写"，而是作为产品经理向AI描述需求，由AI生成代码。与此同时，中国AI模型的海外表现同样亮眼。OpenRouter数据显示，2026年初连续六周，全球调用量最高的顶级AI模型均来自中国。Kimi海外收入已超过国内收入，MiniMax约73%的收入来自国际市场。这一"中国模型出海"的趋势不仅是商业上的突破，更意味着中国AI模型产生的推理Token中有相当一部分需要在中国以外的算力资源上处理，形成对全球算力基础设施的增量需求。 ②供给侧：算力交付的"量"与"价"双重约束供给侧的刚性约束可以从供应量和供应成本两个角度展开。在供应量层面，英伟达从核心GPU供应商升级为AI算力交付体系的指挥塔，意味着单颗GPU的缺口，已不再是"芯片不够"，而是"GPU+服务器+网络+冷却+电力"全栈短缺。英伟达自身已将其2026年Rubin GPU产量目标从200万颗下修至150万颗。 TrendForce数据表明，2026年英伟达高端GPU出货量的年增率将从原本预估的约26.8%微幅下修至近26%。这个看似小幅的修正背后，是在绝对基数膨胀后面临的更大产出缺口。更关键的是，2026年8-9月前上线的新一代Blackwell系列产能已被全部预订，算力仍是当前绝对的稀缺资产。在供应成本层面，硬件价格上涨已开始向算力租赁端传导。由于全球AI需求爆发、供应链涨价，行业核心硬件采购成本显著上涨，海外市场涨价动作更早，国内云厂也纷纷上调算力及相关服务价格。对于算力租赁企业来说，在增量供给释放速度有限的情况下，涨价成为平衡供需、保障资本开支回报的唯一路径。算力租赁赛道之所以成为当前AI产业链中“锐度最高”的资产，根源在于商业模型具备双重优势：业绩兑现周期清晰可控，且折旧前置带来的长期利润弹性为表观利润提供了非线性增长空间。算力租赁企业的商业模式以周期为2至5年的承诺制长期合同为主。按英伟达存储的整体架构为例，合同期限内客户必须预留算力容量并支付固定费用，计费单位按“每签约GPU每小时”定价。折旧期的隐性红利之外，算力设备的残值重估也为盈利空间注入了额外弹性。以当前供需比测算，即便进入折旧末期，二手GPU在挖矿与边缘场景中的商业化价值仍将高于账面残值。该情形在企业出售回租、设备置换或资产证券化环节均可能实现账面额外的资本利得。我们正见证一场前所未有的“硅基资产”重估。算力租赁，这一曾被视为单纯IDC（数据中心）演进的业务，已正式跨越“资源中介”阶段，演变为AI时代的数字金融与战略物资中心。预计未来三年全球算力租赁市场将保持55%以上的复合年增长率。三、接下去关注？算力大宗商品化 2026年5月12日，芝加哥商品交易所集团（CME）与GPU市场情报和基准数据供应商Silicon Data宣布将合作推出算力期货市场。新期货合约将基于Silicon Data编制的指数构建，这是全球首个针对按需租赁GPU费率的每日基准指标。期货合约类型为现金结算期货，无实物交割。CME首席执行官直言，"作为数字经济的支柱，算力是21世纪的新石油"，算力本身正迅速成为一个新兴的资产类别。算力期货的推出标志着AI基础设施正式进入金融资本时代。对算力租赁行业而言，这意味着三个重要变化：一是算力资源的定价将变得更加透明和标准化，有利于头部提供商通过风险管理工具锁定收益率；二是算力租赁行业将获得更多主流资本市场的认可和接入，融资成本有望进一步下降；三是算力的"资产属性"被正式定价，这与Nebius等公司正在推动的"长期合约锁定现金流"策略形成了完整的金融闭环——算力不再只是租赁品，而是具有可交易、可对冲、可定价的完整资产属性。我们认为算力租赁赛道已从概念验证期跨入业绩加速兑现期，行业价值可沿“主赛道核心资产—上游组件高弹性—下游运营基础设施”三条主线进行穿透布局。主线一：主赛道算力租赁/云计算（核心直接受益层）此板块包括A股最具代表性的算力服务厂商——该板块的共性是财务上的“量价双增”与“长约锁定”双保障，以及头部厂商定增、融资租赁等资本运作持续领跑行业。在当前整体行业标的相对稀缺的环境下，主赛道资产对应的业绩确定性最强。主线二：超节点与服务器代工（扩产受益层）超节点系统中的核心OEM及交换机企业同步深化设施级算力。超节点建设已从前期战略布局阶段进入实际部署和规模化交付阶段，从当前NVL72机柜的供应链扩散测度看，相关公司的收入弹性仍处上升初期。主线三：服务器组件（上游延伸层）将算力租赁的景气逻辑在上游转化为零部件的需求放量和产品升级。首选方向是光模块，存储，散热，电源以及连接器。下游：数据中心基础设施（底层负荷受益层）当数据中心从通用托管向高密度智能算力中心转换之际，提供底层机柜资源和智算一体化运维的公司具备重估潜力。对于价格走势，未来12个月存在两种关键情景：情景A（基准预测）：持续高位震荡。在该情景下，高端GPU供给释放速度基本匹配需求增速，下游客户接受涨价并将成本向下传导。Nebius等头部厂商维持"长协锁定+现货溢价"双轨策略，现货价格维持在约20-30%的溢价区间。该情景实现概率约60%。情景B（乐观预测）：进一步超预期上涨。若Token调用量增速持续超预期，或英伟达供给端再次出现扰动，现货溢价可能进一步扩大到30-50%。B300现货租金有可能突破12美元/小时。该情景实现概率约20%。算力租赁行业正处于推理型ToC产业周期的左侧初期——上、中、下游数据的全链路交互验证表明，算力赛道在一级市场和公开市场的投融资活跃度仍将持续升温趋势，VC市场中已完成超10亿元量级推理GPU专场融资等多轮标志性事件。相较于智能制造、具身智能等市场商业化高不确定性的领域，算力租赁凭借3至5年长约锁定的业绩可预测性、量产规模带来的高毛利空间和与AI大模型产业相生相伴的强需求黏性，正成为机构资金从“配置预期”向“配置变现”过渡的核心载体。风险提示及免责条款市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

点击免费查看完整报告

算力再涨价：从Nebius全面涨价看GPU供需的结构性错配 – 华尔街见闻-20260522

核心观点与关键数据

供给侧刚性约束

算力租赁赛道优势

算力大宗商品化

投资建议

价格走势预测

研究结论

你可能感兴趣

高端GPU供需错配驱动算力租赁高景气-华尔街见闻-20260428

重塑算力底座：ABF载板行业涨价超预期？看懂三重共振引爆供需错位 – 华尔街见闻 – -20260515

重塑算力底座：ABF载板行业涨价超预期？看懂三重共振引爆供需错位 – 华尔街见闻-20260513

CPO产业化元年：谁有订单，谁在缺货，谁能涨价？ – 华尔街见闻 – -20260522

日元套息规模或持续上升，股债再平衡或抑制美债收益率，国内生产订货放缓出口订单扩张—0521宏观脱水 – 华尔街见闻-20260522

算力即国力：GPU租赁价格6周涨114pct，算力租赁业绩超预期爆发！ – 华尔街见闻-20260505

美国制造业PMI突然跳涨创48个月最高强劲的数字背后印着两个字：滞胀 – 华尔街见闻-20260522

算力网来了，运营商醒了：TaaS会是运营商的下一个万亿级生意吗？ – 华尔街见闻 -20260520

大厂的算力需求看不到尽头半导体寡头们却在集体_躲飞刀_ – 华尔街见闻-20260429

特朗普国家资本主义：从看不见的手到看得见的铁拳 – 华尔街见闻 20250908

算力再涨价：从Nebius全面涨价看GPU供需的结构性错配 – 华尔街见闻-20260522

你可能感兴趣

高端GPU供需错配驱动算力租赁高景气-华尔街见闻-20260428

重塑算力底座：ABF载板行业涨价超预期？看懂三重共振引爆供需错位 – 华尔街见闻 – -20260515

重塑算力底座：ABF载板行业涨价超预期？看懂三重共振引爆供需错位 – 华尔街见闻-20260513

CPO产业化元年：谁有订单，谁在缺货，谁能涨价？ – 华尔街见闻 – -20260522

日元套息规模或持续上升，股债再平衡或抑制美债收益率，国内生产订货放缓出口订单扩张—0521宏观脱水 – 华尔街见闻-20260522

算力即国力：GPU租赁价格6周涨114pct，算力租赁业绩超预期爆发！ – 华尔街见闻-20260505

美国制造业PMI突然跳涨创48个月最高 强劲的数字背后印着两个字：滞胀 – 华尔街见闻-20260522

算力网来了，运营商醒了：TaaS会是运营商的下一个万亿级生意吗？ – 华尔街见闻 -20260520

大厂的算力需求看不到尽头 半导体寡头们却在集体_躲飞刀_ – 华尔街见闻-20260429

特朗普国家资本主义：从看不见的手到看得见的铁拳 – 华尔街见闻 20250908

美国制造业PMI突然跳涨创48个月最高强劲的数字背后印着两个字：滞胀 – 华尔街见闻-20260522

大厂的算力需求看不到尽头半导体寡头们却在集体_躲飞刀_ – 华尔街见闻-20260429