行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

计算机行业研究：算力供给、需求迎关键信号

信息技术 2026-04-04 李可夫,刘高畅国金证券高杨

行业动态：算力供需两端均迎关键信号

需求端：中国AI大模型日均Token调用量突破140万亿，较2024年初增长超千倍。智谱MaaS平台API ARR提升60倍至17亿元，定价提升83%仍供不应求；Anthropic年化收入达140亿美元，同比增长14倍。
供给端：OpenAI完成1220亿美元融资，投后估值达8520亿美元；CoreWeave完成85亿美元投资级GPU基础设施融资，GPU资产2.5年内可收回成本，客户合同平均期限4年。
价格端：英伟达H100一年期租赁价格涨幅近40%，算力紧缺获印证，部分合约续签至2028年，Blackwell新集群交付周期延长至6-7个月。
国产替代：DeepSeek V4将运行于华为最新芯片，推理端排除美国芯片制造商，国内算力产业链有望受益。

计算需求范式跃迁：从Chatbot到Agent

第一阶段（Chatbot）：一问一答模式，上下文短，单次Token消耗有限。
第二阶段（低阶Agent）：扩展至工具调用（搜索、代码执行等），加载和调用工具导致上下文增长，单Agent Token消耗约为纯Chatbot的4倍。
第三阶段（中阶Agent）：接受模糊高层目标，自主规划、拆解任务、调用工具、自行纠偏，具有更高准确性和泛化能力，类似数字员工。行业共识认为“Chat”范式已终结，AI竞争转向“能办事”的智能体时代。Claude Code和OpenClaw应用印证转变。
Agent驱动算力需求非线性提升的原因：
- 中阶Agent与Prefill：上下文长度持续膨胀，输入与输出Token比例约100:1。
- 长上下文对算力与存储的双重需求：自注意力机制计算成本与上下文长度呈二次方关系，解码阶段受内存带宽限制，KV Cache急剧膨胀加剧瓶颈。Token阶梯定价机制反映此瓶颈。
- 多Agent通信：多Agent协作架构引入通信协调开销，Anthropic实测多Agent系统Token消耗约为对话模式的15倍。
- 杰文斯悖论：AI效率提升带来使用量爆炸式增长，微软CEO纳德拉称AI成为永远无法被充分满足的商品。

投资建议

海外算力/存储：中际旭创、东山精密、胜宏科技、Lumentum、闪迪、美光等。
国内算力：寒武纪、海光信息、星环科技、浪潮信息、百度集团等。
CPU：海光信息、中科曙光、澜起科技等。
AI应用：
- 大模型&自定义Agent：智谱、Minimax、腾讯控股、阿里巴巴等。
- AI INFRA&高景气&高壁垒：星环科技、德才股份、美年健康等。
其他：空天时代、具身智能等。

风险提示

行业竞争加剧的风险。
技术研发进度不及预期的风险。
特定行业下游资本开支周期性波动的风险。

算力供给、需求迎关键信号计算机行业研究买入（维持评级）行业点评证券研究报告计算机组分析师：李可夫（执业S1130525120009）likefu＠gjzq.com.cn分析师：刘高畅（执业S1130525120005）liugaochang＠gjzq.com.cn 算力供给、需求迎关键信号算力供需正在发出关键信号。1）需求端，截至2026年3月，中国AI大模型日均Token调用量已突破140万亿，较2024年初增长超千倍。智谱MaaS平台API的ARR在过去12个月内提升约60倍至17亿元人民币，一季度定价提升83%后市场仍供不应求；海外Anthropic年化收入已达140亿美元，同比增长14倍。2）供给端，CoreWeave完成全球首个投资级GPU基础设施融资（85亿美元），OpenAI也于2026年3月31日完成1220亿美元新一轮融资，投后估值达8520亿美元。CoreWeave测算GPU资产可在2.5年内完全收回成本，客户合同平均期限4年，早期重资本投入正迎来现金流回报拐点。3）价格端，据SemiAnalysis英伟达H100一年期租赁价格从2025年10月至2026年3月涨幅接近40%，算力紧缺获得充分印证。4）国产替代：据TheInformation报道，DeepSeek新一代模型V4将运行于华为最新芯片之上，推理端将美国芯片制造商排除在早期准入之外，国内算力产业链有望直接受益。计算需求范式跃迁：从Chatbot到Agent。大模型应用的发展带来计算需求的跃迁：1）第一阶段：Chatbot，一问一答模式，上下文短、单次Token消耗有限。2）第二阶段：低阶Agent，将能力扩展至工具调用：搜索网页、执行代码、查询数据库等，加载和调用工具带来上下文增长，Anthropic测试单Agent的Token消耗约为纯Chatbot的4倍。3）第三阶段：中阶Agent，能够接受模糊高层目标并自主规划、拆解任务、调用工具、自行纠偏，具有更高的准确性和泛化能力，类似数字员工。清华AGI-Next峰会上行业已形成共识：以对话为核心的"Chat"范式已告终结，AI竞争正式转向"能办事"的智能体时代。Claude Code和OpenClaw两个里程碑应用的爆火印证这一转变。 Agent驱动算力需求非线性提升的原因。1）中阶Agent的Prefill阶段上下文长度在任务执行过程中持续膨胀，需加载大量工具定义、系统提示词与中间结果，以Manus为例，输入与输出Token比例约为100:1。2）长上下文对算力与存储形成双重压力：一方面大模型自注意力机制的计算成本与上下文长度呈二次方关系，一方面解码阶段受制于内存带宽而非计算能力，KV Cache随上下文增长而急剧膨胀进一步加剧瓶颈。谷歌Gemini、阿里云Qwen等均采用按上下文长度分档的阶梯定价机制。3）多Agent协作架构引入通信协调开销，产生不可避免的"协调税"。Anthropic表示多Agent系统的Token消耗约为对话模式的15倍。4）AI领域已出现明显的杰文斯悖论：微软CEO纳德拉明确表示，AI效率提升将带来使用量的爆炸式增长，使其成为永远无法被充分满足的商品。相关标的：海外算力/存储：中际旭创、东山精密、胜宏科技、欧科亿、天孚通信、天岳先进、新易盛、工业富联、兆易创新、大普微、源杰科技、景旺电子、英维克、唯科科技、领益智造等；Lumentum、闪迪、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。国内算力：寒武纪、东阳光、海光信息、利通电子、协创数据、网宿科技、华丰科技、亿田智能、豫能控股、星环科技、首都在线、神州数码、百度集团、中芯国际、华虹半导体、中科曙光、润泽科技、浪潮信息、大位科技、润建股份、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。 CPU：海光信息、中科曙光、澜起科技、禾盛新材、中国长城、龙芯中科、兴森科技、深南电路、宏和科技、广合科技。AI应用：1）大模型&自定义Agent：智谱、Minimax、腾讯控股、阿里巴巴、科大讯飞。2）星环科技、德才股份、美年健康、中控技术等AI INFRA&高景气&高壁垒。其他：空天时代、具身智能等。风险提示行业竞争加剧的风险；技术迭代不及预期的风险；特定行业下游资本开支周期性波动的风险。内容目录行业动态：算力供需两端均迎关键信号.............................................................31.1需求端：大模型调用量爆发，国内受限于算力仍高速增长.....................................31.2供给端：关键融资顺利，回报临近拐点.....................................................31.3价格端：租赁价上涨，算力紧缺已获印证...................................................31.4国产替代：DeepSeek V4推理端或优先适配国产芯片.........................................4计算需求范式跃迁：从Chatbot到Agent...........................................................42.1第一阶段：Chatbot——一问一答，算力消耗有限............................................42.2第二阶段：低阶Agent——开始调用工具...................................................42.3第三阶段：中阶Agent——自主规划，持续运行，更高的准确度和泛化能力......................4Agent驱动算力需求的原因.......................................................................53.1中阶Agent与Prefill：上下文长度的膨胀.................................................53.2长上下文对算力与存储的双重需求.........................................................53.3多Agent通信：计算量指数级扩张的另一原因...............................................73.4能力提升带动调用量持续增加：杰文斯悖论.................................................8投资建议.......................................................................................8风险提示.......................................................................................9 图表目录图表1：Anthropic与智谱历史ARR...............................................................3图表2：H100一年期租赁合约价格指数............................................................4图表3：OpenClaw的GitHub星标增长趋势.........................................................5图表4：KV Cache工作机制示意图................................................................6图表5：Qwen模型阶梯定价......................................................................7图表6：kimi k2.5的Agent集群协作示意图.......................................................8 行业动态：算力供需两端均迎关键信号 1.1需求端：大模型调用量爆发，国内受限于算力仍高速增长截至2026年3月，中国AI大模型日均Token调用量已突破140万亿，较2024年初增长超千倍。这一数字背后，是真实商业化的持续深化：智谱MaaS平台API的ARR（年化经常性收入）约达17亿元人民币，过去12个月提升约60倍；2026年一季度，智谱API调用定价提升了83%，市场依然供不应求，调用量增长400%。海外端，Anthropic商业化同步高速增长。据披露，Anthropic年化收入已达140亿美元，同比增长14倍。 1.2供给端：关键融资顺利，回报临近拐点 OpenAI于2026年3月31日完成完成了最新一轮融资，募集资金达1220亿美元，投后估值达8520亿美元。本轮融资由OpenAI的战略合作伙伴亚马逊、英伟达和软银领投，长期合作伙伴微软也继续参与其中。 3月31日华尔街见闻报道CoreWeave宣布已完成一笔85亿美元的延迟提款定期贷款融资，是全球首个获得投资级评级的高性能计算（HPC）基础设施融资工具，标志着GPU支撑的数据中心资产正式进入主流机构信贷市场。本次融资是CoreWeave近期一系列大规模资本运作的延续。公司披露，过去12个月内，其股权与债务融资承诺总额已累计达到约280亿美元。此次完成史上首个投资级GPU基础设施融资，不仅为公司提供了充足资本以支撑日益增长的客户需求，也将对同类AI基础设施资产的定价和评级体系产生示范效应，为整个行业的融资路径提供新的参照坐标。 Oracle也宣布计划在2026年通过债务和股权融资筹集450亿至500亿美元，以扩大其人工智能数据中心的容量，服务于包括英伟达、Meta、OpenAI、AMD、TikTok和xAI在内的客户。从重资本投入走向现金流拐点：CoreWeave估算GPU资产可在2.5年内完全收回成本，这意味着从第三年开始，GPU将产生纯现金流，目前其客户合同平均期限为4年，形成较强的现金流保护。早期重资本投入的算力租赁正迎来回报拐点。 1.3价格端：租赁价上涨，算力紧缺已获印证据SemiAnalysis数据显示，英伟达H100 GPU的一年期租赁价格从2025年10月的每小时1.7美元飙升至2026年3月的2.35美元，涨幅接近40%，所有按需算力已全线售罄。更值得注意的是，部分H100合约已直接续签至2028年，Blackwell新集群的交付周期也延长到了6-7个月，这也从侧面印证了算力需求的旺盛。 1.4国产替代：DeepSeek V4推理端或优先适配国产芯片据美国科技媒体The Information于2026年4月3日报道，DeepSeek新一代模型V4将运行于华为最新设计的芯片之上，预计在未来数周内正式发布。DeepSeek与华为和寒武纪科技密切合作，对V4基础代码库的大部分内容进行了修改。与行业在重大版本发布前的常规流程不同，DeepSeek将美国芯片制造商排除在V4的早期准入之外。此事件的战略意义在于：若V4能以纯国产芯片在推理端完成大规模商业部署，将标志着中国AI算力自主替代完成关键验证，形成示范效应。国内算力产业链有望直接受益于模型厂商的国产化采购。计算需求范式跃迁：从Chatbot到Agent 2.1第一阶段：Chatbot——一问一答，算力消耗有限大模型应用的第一个阶段本质上是一个对

点击免费查看完整报告

计算机行业研究：算力供给、需求迎关键信号

行业动态：算力供需两端均迎关键信号

计算需求范式跃迁：从Chatbot到Agent

投资建议

风险提示

你可能感兴趣

计算机行业重大事项点评：Token 推理大爆发，国产算力再迎海量需求

【人工智能第一团队|民生计算机】国产AI算力主线再迎强劲政策信号事

计算机行业周报：国产算力迎来供给和需求侧积极变化

计算机：央企加快推动AI发展，算力需求再迎催化

TF计算机阿里千问3引爆算力需求IDC产业链再迎强催化

电力设备行业点评报告：太空光伏：卫星目前关键能源、火箭运力或迎非线性增长，太空算力空间远大

计算机行业周报：两会布局新质生产力，AI、数据要素、算力逐渐成为关键元素

计算机行业：算力行业再迎政策催化，行业景气向上

计算机行业深度研究报告智算时代，国产算力链迎发展新机遇

计算机行业周报：大模型持续迭代，国产算力迎发展良机