本周观点 全球算力服务继续通胀,价格端持续验证算力紧俏。英伟达全系算力卡租赁价格仍处于高位,据GetDeploying数据,截至2026年6月15日,英伟达B200按需租赁均价较2025年6月以来上涨约7%,英伟达B300按需租赁均价较2025年11月上涨超50%,旧款产品H200、H100租赁价格亦小幅上涨约3%。此外,Baseten披露其云服务商计划于2026年10月将B200租赁续约价格上调约94%,每小时单价将由当前的2.63美元上涨至5.10美元。供给端紧张局面亦未消解,千卡级GPU采购订单的交付周期已延长至2027年,等待时间长达12-15个月,租赁价格上涨叠加交付瓶颈未解,算力资产稀缺持续强化。 算力服务的商业模式从卡时租赁向Token分成升级,有望打开长盈利天花板。推理时代客户需求逐步从获取算力资源转向获取推理结果,行业收入模式正由按GPU卡时收费向按Token产出分成演进,算力资产开始与下游模型调用量相关联,算力租赁的商业逻辑更加清晰。产业实践验证这一趋势,1)海外方面,FriendliAI推出InferenceSense,通过调度闲置GPU承接付费推理任务,并按Token收入与算力运营商分成。2)国内方面,三大运营商均已推出Token套餐,推动Token成为标准化、可计价的算力产品;润建股份、弘信电子、超讯通信等算租企业相继布局Token工厂,探索以Token为计价锚点的全链条算力服务。我们认为,算力租赁行业有望从租金经济迈向Token经济,盈利模式由资源收费升级为价值分成,具备更高的盈利弹性。 供需共振向上,重申国内算力黄金年代。1)GPU:需求侧,据OpenRouter,6月15日至19日中国AI大模型周调用量近13万亿Token,持续领跑全球;国产模型与国产芯片加速协同,DDeepSeek V4、GLM 5.2均与华为昇腾、寒武纪、海光等多家国产芯片厂商实现Day0适配。供给侧,寒武纪拟申请120亿元授信、字节跳动洽购数万颗天数智芯芯片,国内互联网大厂上修资本开支,新增AI基建投资有望向国产算力倾斜,产业化放量临界点已至。2)CPU:推理时代到来使CPU需求量提升,Intel、AMD率先提价,国产CPU有望同步受益于量价齐升趋势。3)国产机柜:超节点出货带来ODM格局与利润率双升,交付单元从白盒服务器跃迁至整机柜乃至Pod级系统,头部ODM凭借工程溢价推动毛利率向更高区间迁移。4)AIDC:海内外云厂商资本开支体量显著跃升,期待算力供给丰富后同步迈入涨价周期。相关标的 算力租赁:1)持续专注业绩加速型:协创数据、利通电子、盈峰环境、东阳光、润泽科技;2)规划深入有进展型:京基智农、金刚光伏、罗曼股份、亿田智能、先河环保、晶科科技、华策影视、盛视科技、行云科技、奥尼电子、智微智能。 海外算力:工业富联、胜宏科技、东山精密、中际旭创、中钨高新、鹏鼎控股、江海股份、东阳光、欧科亿、天孚通信、天岳先进、新易盛、兆易创新、大普微、源杰科技、元力股份、景旺电子、英维克、唯科科技、领益智造等;英特尔、SK海力士、Lumentum、闪迪、铠侠、美光、中微公司、北方华创、拓荆科技、长川科技。 国内算力:寒武纪、海光信息、东阳光、禾盛新材、杰华特、利扬芯片、天数智芯、壁仞科技、芯原股份、百度集团、中芯国际、华虹半导体、华勤技术、浪潮信息、中国长城、网宿科技、华丰科技、星环科技、鸿日达、首都在线、神州数码、中科曙光、润泽科技、大位科技、润建股份、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。 风险提示 行业竞争加剧的风险;技术研发进度不及预期的风险;特定行业下游资本开支周期性波动的风险。 内容目录 一、全球算力服务继续通胀,价格端持续验证算力紧俏...............................................3二、Token分成模式加速成型,算租厂商商业模式升级...............................................3三、供需共振向上,重申国内算力黄金年代.........................................................43.1国内算力风眼:国产模型能力跃升、调用量持续攀升.........................................43.2 GPU:需求端芯模适配提速,供给侧改善....................................................53.3 CPU:推理时代是CPU需求大起点..........................................................53.4国产机柜:超节点出货带来ODM组装厂商格局/利润率双提升..................................63.5 AIDC:期待算力供给丰富后同步迈入涨价周期...............................................6四、相关标的...................................................................................7风险提示.......................................................................................7 图表目录 图表1:NVIDIA B200按需租赁价格维持高位......................................................3图表2:NVIDIA GB300 NVL72每MW并发代理数比上一代NVIDIA H200多达20倍...................3图表3:上海电信在中国电信第六届科技节上发布Token套餐........................................4图表4:五象云谷词元(Token)工厂.............................................................4图表5:五象云谷智算中心总算力规划40000P.....................................................4图表6:寒武纪预付款项大增验证供给端改善......................................................5图表7:寒武纪存货持续高增保障后续订单交付....................................................5图表8:CPU收入增长率将在2028年前超过GPU和XPU的增长....................................6图表9:中科曙光scaleX40具备低门槛部署、高稳定运行和开箱即可用的系统创新优势.................6图表10:阿里磐久超节点ScaleUp互连拓扑图.....................................................6图表11:2020-2028年中国智能算力规模及预测(EFLOPS,基于FP16计算)........................7 一、全球算力服务继续通胀,价格端持续验证算力紧俏 英伟达算力租赁价格保持上行,通胀周期仍在延续。据GetDeploying数据,截至2026年6月15日,英伟达B200按需租赁均价较2025年6月以来已上涨约7%,从5.84美元/小时/GPU提升至6.26美元/小时/GPU;英伟达B300按需租赁均价较2025年11月涨幅高达51%,已从5.00美元/小时/GPU上涨至7.55美元/小时/GPU;除高端旗舰算力产品外,英伟达H200与H100按需定价相比2025年6月亦均小幅上涨约3%。从北美主流算租平台定价来看,截至2026年6月,CoreWeave H200、B200单卡租赁价格分别达到6.31、8.60美元/小时/GPU,老款芯片价格稳定维持在较高水平,新一代Blackwell产品持续享受价格溢价,算力紧俏程度未减。 B200租赁价或将翻倍,算力供需差远未弥合。据AI推理基础设施服务商Baseten首席执行官Tuhin Srivastava表示,其云服务商已于今年5月提前通知,英伟达B200 GPU租赁合同在10月续约时,每小时单价将由当前的2.63美元上调至5.10美元,涨幅高达94%;与此同时,当前采购1000块GPU的订单交付周期已普遍延长至2027年第二季度,等待时间长达12—15个月。交付瓶颈与租赁价格上涨叠加,算力资源持续紧俏。 来源:GetDeploying,国金证券研究所 算力租赁资产属性继续强化,竞争维度从拿卡能力向系统级效率升级。在Artificial Analysis2026年6月12日发布的Agentic AI基础设施基准测试AA-AgentPerf中,英伟达Blackwell Ultra GB300 NVL72在智能体AI工作负载中取得最佳成绩,在DeepSeek V4 Pro测试环境下,其单位功耗可支持的并发Agent数量最高达到Hopper H200平台的20倍,每MW算力最多可承载60,000个并发智能体。GB300 NVL72展现出稳定承载大规模智能体代码类工作负载,并在多路并发智能体会话场景下始终维持GPU高满载利用率,其系统级优化能力已在Agent场景中得到充分验证,算力租赁的竞争焦点将从单纯的采购能力,逐步转向全链条系统集成能力与运营效率。 来源:NVIDIA技术博客,国金证券研究所 二、Token分成模式加速成型,算租厂商商业模式升级 传统GPU租赁逐步向Token经济演进,算租的商业逻辑更加清晰。传统模式下,算力租赁厂商主要以裸算力出租作为收费模式,即客户按GPU卡时、服务器节点或机柜资源进行采购;英伟达CEO黄仁勋在2026年3月的GTC大会上提出Token工厂概念,认为未来的数据中心不再是存储文件的仓库,而是生产Token的工厂,随推理时代到来,客户需 求逐步从获取算力资源转向获取推理结果,驱动算力租赁商业模式从收固定租金向Token分成转变。 FriendliAI推出InferenceSense以实现闲置GPU容量变现,Token分成模式雏形初现。2026年3月,推理基础设施公司FriendliAI推出InferenceSense,GPU云服务运营商接入后,InferenceSense能够自动识别基础设施中的闲置GPU资源,并将付费推理任务调度至GPU云服务运营商,由FriendliAI统一承接DeepSeek、Qwen、MiniMax等模型的付费推理需求,并按照实际生成的Token收入与GPU运营商进行分成。Token收入分成能够为GPU运营商带来高于传统按小时出租的单位GPU经济效益,同时驱动GPU运营商从传统算力出租方升级为AI推理服务方,收入来源与推理需求和Token生成量直接相关,算力价值计量单位由GPU/Hour向Token/Output升级。 上海电信推出Token资费套餐,国内Token计费走向标准化。上海电信于5月16日面向上海电信用户正式推出Token算力服务,成为上海首个发布Token资费套餐的运营商,1元对应25万额度点,支持按需购买和话费账单支付,通过标准API接口即可调用30余款主流大模型,进而将AI能力集成到自己的软件、脚本或自动化流程中。另外,中国电信、中国移动、中国联通三大运营商均已推出Token套餐,将Token以流量包的形式进行售卖。Token逐步成为可计价的标准化产品,将推动算力租赁市场转向按实际Token用量计费的模式。 来源:上观新闻微