行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

计算机行业研究：全球算力服务继续通胀

信息技术 2026-06-19 刘高畅,陈芷婧,鲍淑娴国金证券单字一个翔

研报总结

全球算力服务通胀加剧

英伟达全系算力卡租赁价格持续上涨，B200按需租赁均价较2025年6月上涨约7%，B300上涨超50%，H200、H100亦小幅上涨约3%。
Baseten云服务商计划将B200租赁续约价格上调约94%，每小时单价从2.63美元上涨至5.10美元。
千卡级GPU采购订单交付周期延长至2027年，等待时间长达12-15个月，供给端紧张局面未消解。
算力租赁竞争维度从拿卡能力向系统级效率升级，GB300 NVL72在智能体AI工作负载中表现优异。

算力租赁商业模式升级至Token分成

客户需求从获取算力资源转向获取推理结果，收入模式由按GPU卡时收费向按Token产出分成演进。
FriendliAI推出InferenceSense，通过调度闲置GPU承接付费推理任务，并按Token收入与算力运营商分成。
上海电信推出Token资费套餐，国内Token计费走向标准化，三大运营商均已推出Token套餐。
润建股份、弘信电子、超讯通信等算租企业布局Token工厂，探索以Token为计价锚点的全链条算力服务。
Token产品化趋势下，算力租赁商商业逻辑从单纯的算力资源出租升级为与下游推理用量绑定的Token经济，打开长期盈利天花板。

国内算力供需共振向上，重申黄金年代

国内算力风眼：国产模型能力跃升、调用量持续攀升

中国AI大模型周调用量近13万亿Token，连续八周超过美国居全球首位，DeepSeek-V4-Flash连续五周位居全球榜首。

GPU：需求端芯模适配提速，供给侧改善

国产芯片Day0适配逐步成为头部模型厂商的标配，DeepSeek V4、GLM 5.2均与华为昇腾、寒武纪、海光等多家国产芯片厂商实现Day0适配。
寒武纪拟申请120亿元授信，加速进入规模化供给阶段。
寒武纪一季报预付款项和合同负债双高增，下游AI算力需求呈爆炸式增长。
字节跳动、腾讯等国内大厂加码采购国产AI芯片，新增CapEx有望向国产算力基础设施倾斜。

CPU：推理时代是CPU需求大起点

CPU供给端持续承压，Intel、AMD服务器CPU库存趋紧、交期延长，并上调全系列CPU价格，平均涨幅达10-15%。
CPU/GPU部署比例抬升，TAM显著扩容，ARM架构受益于低功耗、高核心密度特性。

国产机柜：超节点出货带来ODM组装厂商格局/利润率双提升

华为、中科曙光、阿里等厂商推出超节点产品，满足大模型训练与推理需求。
超节点将重塑ODM的利润结构，交付单元从单台服务器跃迁为整机柜乃至Pod级系统，头部ODM在超节点数通业务上的毛利率有望向更高区间迁移。

AIDC：期待算力供给丰富后同步迈入涨价周期

海内外大厂CapEx持续高增，AI军备竞赛加剧。
智算中心持续扩容，国产替代加速。
随芯片卡供应缓解、推理需求释放、国产卡性能提升，IDC招投标有望进一步加速，并在供需挤压下同步迈入涨价周期。

风险提示

行业竞争加剧的风险。
技术研发进度不及预期的风险。
特定行业下游资本开支周期性波动的风险。

本周观点 全球算力服务继续通胀，价格端持续验证算力紧俏。英伟达全系算力卡租赁价格仍处于高位，据GetDeploying数据，截至2026年6月15日，英伟达B200按需租赁均价较2025年6月以来上涨约7%，英伟达B300按需租赁均价较2025年11月上涨超50%，旧款产品H200、H100租赁价格亦小幅上涨约3%。此外，Baseten披露其云服务商计划于2026年10月将B200租赁续约价格上调约94%，每小时单价将由当前的2.63美元上涨至5.10美元。供给端紧张局面亦未消解，千卡级GPU采购订单的交付周期已延长至2027年，等待时间长达12-15个月，租赁价格上涨叠加交付瓶颈未解，算力资产稀缺持续强化。 算力服务的商业模式从卡时租赁向Token分成升级，有望打开长盈利天花板。推理时代客户需求逐步从获取算力资源转向获取推理结果，行业收入模式正由按GPU卡时收费向按Token产出分成演进，算力资产开始与下游模型调用量相关联，算力租赁的商业逻辑更加清晰。产业实践验证这一趋势，1）海外方面，FriendliAI推出InferenceSense，通过调度闲置GPU承接付费推理任务，并按Token收入与算力运营商分成。2）国内方面，三大运营商均已推出Token套餐，推动Token成为标准化、可计价的算力产品；润建股份、弘信电子、超讯通信等算租企业相继布局Token工厂，探索以Token为计价锚点的全链条算力服务。我们认为，算力租赁行业有望从租金经济迈向Token经济，盈利模式由资源收费升级为价值分成，具备更高的盈利弹性。 供需共振向上，重申国内算力黄金年代。1）GPU：需求侧，据OpenRouter，6月15日至19日中国AI大模型周调用量近13万亿Token，持续领跑全球；国产模型与国产芯片加速协同，DDeepSeek V4、GLM 5.2均与华为昇腾、寒武纪、海光等多家国产芯片厂商实现Day0适配。供给侧，寒武纪拟申请120亿元授信、字节跳动洽购数万颗天数智芯芯片，国内互联网大厂上修资本开支，新增AI基建投资有望向国产算力倾斜，产业化放量临界点已至。2）CPU：推理时代到来使CPU需求量提升，Intel、AMD率先提价，国产CPU有望同步受益于量价齐升趋势。3）国产机柜：超节点出货带来ODM格局与利润率双升，交付单元从白盒服务器跃迁至整机柜乃至Pod级系统，头部ODM凭借工程溢价推动毛利率向更高区间迁移。4）AIDC：海内外云厂商资本开支体量显著跃升，期待算力供给丰富后同步迈入涨价周期。相关标的算力租赁：1）持续专注业绩加速型：协创数据、利通电子、盈峰环境、东阳光、润泽科技；2）规划深入有进展型：京基智农、金刚光伏、罗曼股份、亿田智能、先河环保、晶科科技、华策影视、盛视科技、行云科技、奥尼电子、智微智能。海外算力：工业富联、胜宏科技、东山精密、中际旭创、中钨高新、鹏鼎控股、江海股份、东阳光、欧科亿、天孚通信、天岳先进、新易盛、兆易创新、大普微、源杰科技、元力股份、景旺电子、英维克、唯科科技、领益智造等；英特尔、SK海力士、Lumentum、闪迪、铠侠、美光、中微公司、北方华创、拓荆科技、长川科技。国内算力：寒武纪、海光信息、东阳光、禾盛新材、杰华特、利扬芯片、天数智芯、壁仞科技、芯原股份、百度集团、中芯国际、华虹半导体、华勤技术、浪潮信息、中国长城、网宿科技、华丰科技、星环科技、鸿日达、首都在线、神州数码、中科曙光、润泽科技、大位科技、润建股份、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。风险提示行业竞争加剧的风险；技术研发进度不及预期的风险；特定行业下游资本开支周期性波动的风险。内容目录一、全球算力服务继续通胀，价格端持续验证算力紧俏...............................................3二、Token分成模式加速成型，算租厂商商业模式升级...............................................3三、供需共振向上，重申国内算力黄金年代.........................................................43.1国内算力风眼：国产模型能力跃升、调用量持续攀升.........................................43.2 GPU：需求端芯模适配提速，供给侧改善....................................................53.3 CPU：推理时代是CPU需求大起点..........................................................53.4国产机柜：超节点出货带来ODM组装厂商格局/利润率双提升..................................63.5 AIDC：期待算力供给丰富后同步迈入涨价周期...............................................6四、相关标的...................................................................................7风险提示.......................................................................................7 图表目录图表1：NVIDIA B200按需租赁价格维持高位......................................................3图表2：NVIDIA GB300 NVL72每MW并发代理数比上一代NVIDIA H200多达20倍...................3图表3：上海电信在中国电信第六届科技节上发布Token套餐........................................4图表4：五象云谷词元（Token）工厂.............................................................4图表5：五象云谷智算中心总算力规划40000P.....................................................4图表6：寒武纪预付款项大增验证供给端改善......................................................5图表7：寒武纪存货持续高增保障后续订单交付....................................................5图表8：CPU收入增长率将在2028年前超过GPU和XPU的增长....................................6图表9：中科曙光scaleX40具备低门槛部署、高稳定运行和开箱即可用的系统创新优势.................6图表10：阿里磐久超节点ScaleUp互连拓扑图.....................................................6图表11：2020-2028年中国智能算力规模及预测（EFLOPS，基于FP16计算）........................7 一、全球算力服务继续通胀，价格端持续验证算力紧俏英伟达算力租赁价格保持上行，通胀周期仍在延续。据GetDeploying数据，截至2026年6月15日，英伟达B200按需租赁均价较2025年6月以来已上涨约7%，从5.84美元/小时/GPU提升至6.26美元/小时/GPU；英伟达B300按需租赁均价较2025年11月涨幅高达51%，已从5.00美元/小时/GPU上涨至7.55美元/小时/GPU；除高端旗舰算力产品外，英伟达H200与H100按需定价相比2025年6月亦均小幅上涨约3%。从北美主流算租平台定价来看，截至2026年6月，CoreWeave H200、B200单卡租赁价格分别达到6.31、8.60美元/小时/GPU，老款芯片价格稳定维持在较高水平，新一代Blackwell产品持续享受价格溢价，算力紧俏程度未减。 B200租赁价或将翻倍，算力供需差远未弥合。据AI推理基础设施服务商Baseten首席执行官Tuhin Srivastava表示，其云服务商已于今年5月提前通知，英伟达B200 GPU租赁合同在10月续约时，每小时单价将由当前的2.63美元上调至5.10美元，涨幅高达94%；与此同时，当前采购1000块GPU的订单交付周期已普遍延长至2027年第二季度，等待时间长达12—15个月。交付瓶颈与租赁价格上涨叠加，算力资源持续紧俏。来源：GetDeploying，国金证券研究所算力租赁资产属性继续强化，竞争维度从拿卡能力向系统级效率升级。在Artificial Analysis2026年6月12日发布的Agentic AI基础设施基准测试AA-AgentPerf中，英伟达Blackwell Ultra GB300 NVL72在智能体AI工作负载中取得最佳成绩，在DeepSeek V4 Pro测试环境下，其单位功耗可支持的并发Agent数量最高达到Hopper H200平台的20倍，每MW算力最多可承载60,000个并发智能体。GB300 NVL72展现出稳定承载大规模智能体代码类工作负载，并在多路并发智能体会话场景下始终维持GPU高满载利用率，其系统级优化能力已在Agent场景中得到充分验证，算力租赁的竞争焦点将从单纯的采购能力，逐步转向全链条系统集成能力与运营效率。来源：NVIDIA技术博客，国金证券研究所二、Token分成模式加速成型，算租厂商商业模式升级传统GPU租赁逐步向Token经济演进，算租的商业逻辑更加清晰。传统模式下，算力租赁厂商主要以裸算力出租作为收费模式，即客户按GPU卡时、服务器节点或机柜资源进行采购；英伟达CEO黄仁勋在2026年3月的GTC大会上提出Token工厂概念，认为未来的数据中心不再是存储文件的仓库，而是生产Token的工厂，随推理时代到来，客户需求逐步从获取算力资源转向获取推理结果，驱动算力租赁商业模式从收固定租金向Token分成转变。 FriendliAI推出InferenceSense以实现闲置GPU容量变现，Token分成模式雏形初现。2026年3月，推理基础设施公司FriendliAI推出InferenceSense，GPU云服务运营商接入后，InferenceSense能够自动识别基础设施中的闲置GPU资源，并将付费推理任务调度至GPU云服务运营商，由FriendliAI统一承接DeepSeek、Qwen、MiniMax等模型的付费推理需求，并按照实际生成的Token收入与GPU运营商进行分成。Token收入分成能够为GPU运营商带来高于传统按小时出租的单位GPU经济效益，同时驱动GPU运营商从传统算力出租方升级为AI推理服务方，收入来源与推理需求和Token生成量直接相关，算力价值计量单位由GPU/Hour向Token/Output升级。上海电信推出Token资费套餐，国内Token计费走向标准化。上海电信于5月16日面向上海电信用户正式推出Token算力服务，成为上海首个发布Token资费套餐的运营商，1元对应25万额度点，支持按需购买和话费账单支付，通过标准API接口即可调用30余款主流大模型，进而将AI能力集成到自己的软件、脚本或自动化流程中。另外，中国电信、中国移动、中国联通三大运营商均已推出Token套餐，将Token以流量包的形式进行售卖。Token逐步成为可计价的标准化产品，将推动算力租赁市场转向按实际Token用量计费的模式。来源：上观新闻微

点击免费查看完整报告

计算机行业研究：全球算力服务继续通胀

研报总结

全球算力服务通胀加剧

算力租赁商业模式升级至Token分成

国内算力供需共振向上，重申黄金年代

国内算力风眼：国产模型能力跃升、调用量持续攀升

GPU：需求端芯模适配提速，供给侧改善

CPU：推理时代是CPU需求大起点

国产机柜：超节点出货带来ODM组装厂商格局/利润率双提升

AIDC：期待算力供给丰富后同步迈入涨价周期

相关标的

风险提示

你可能感兴趣

计算机行业周报：全球算力景气度继续上行

中信建投计算机Agent需求激增拉动全球算力通胀过去两周

国联民生计算机Token通胀模型端优化有望提振国产算力需求继续看好

计算机 2026 年 5 月研究观点：全球 AI 产业多线共振，从算力到应用全面验证

计算机行业研究周报：微软Ignite全球技术大会举行继续引领AI变革与创新

计算机行业周报：看好算力通胀向下传导，关注国产算力投资机会

计算机行业周报-周观点：AI算力景气度高企，GPU和CPU步入通胀阶段

计算机行业周报20260419：Token“通胀”呼唤国产算力：“一芯二模三云”之“一芯”

计算机行业跟踪报告：AI算力相关产品服务有望延续涨价趋势，Tokens使用有望量价齐升

计算机行业周观点：杭州探索数据要素落地政策，东数西算一体化算力服务平台上线运营

计算机行业研究：全球算力服务继续通胀

你可能感兴趣

计算机行业周报：全球算力景气度继续上行

中信建投计算机Agent需求激增拉动全球算力通胀过去两周

国联民生计算机Token通胀模型端优化有望提振国产算力需求继续看好

计算机 2026 年 5 月研究观点：全球 AI 产业多线共振，从算力到应用全面验证

计算机行业研究周报：微软Ignite全球技术大会举行 继续引领AI变革与创新

计算机行业周报：看好算力通胀向下传导，关注国产算力投资机会

计算机行业周报-周观点：AI算力景气度高企，GPU和CPU步入通胀阶段

计算机行业周报20260419：Token“通胀”呼唤国产算力：“一芯二模三云”之“一芯”

计算机行业跟踪报告：AI算力相关产品服务有望延续涨价趋势，Tokens使用有望量价齐升

计算机行业周观点：杭州探索数据要素落地政策，东数西算一体化算力服务平台上线运营

计算机行业研究周报：微软Ignite全球技术大会举行继续引领AI变革与创新