算力供给、需求迎关键信号计算机行业研究 买入(维持评级) 行业点评 证券研究报告 计算机组 分析师:李可夫(执业S1130525120009)likefu@gjzq.com.cn分析师:刘高畅(执业S1130525120005)liugaochang@gjzq.com.cn 算力供给、需求迎关键信号 算力供需正在发出关键信号。1)需求端,截至2026年3月,中国AI大模型日均Token调用量已突破140万亿,较2024年初增长超千倍。智谱MaaS平台API的ARR在过去12个月内提升约60倍至17亿元人民币,一季度定价提升83%后市场仍供不应求;海外Anthropic年化收入已达140亿美元,同比增长14倍。2)供给端,CoreWeave完成全球首个投资级GPU基础设施融资(85亿美元),OpenAI也于2026年3月31日完成1220亿美元新一轮融资,投后估值达8520亿美元。CoreWeave测算GPU资产可在2.5年内完全收回成本,客户合同平均期限4年,早期重资本投入正迎来现金流回报拐点。3)价格端,据SemiAnalysis英伟达H100一年期租赁价格从2025年10月至2026年3月涨幅接近40%,算力紧缺获得充分印证。4)国产替代:据TheInformation报道,DeepSeek新一代模型V4将运行于华为最新芯片之上,推理端将美国芯片制造商排除在早期准入之外,国内算力产业链有望直接受益。 计算需求范式跃迁:从Chatbot到Agent。大模型应用的发展带来计算需求的跃迁:1)第一阶段:Chatbot,一问一答模式,上下文短、单次Token消耗有限。2)第二阶段:低阶Agent,将能力扩展至工具调用:搜索网页、执行代码、查询数据库等,加载和调用工具带来上下文增长,Anthropic测试单Agent的Token消耗约为纯Chatbot的4倍。3)第三阶段:中阶Agent,能够接受模糊高层目标并自主规划、拆解任务、调用工具、自行纠偏,具有更高的准确性和泛化能力,类似数字员工。清华AGI-Next峰会上行业已形成共识:以对话为核心的"Chat"范式已告终结,AI竞争正式转向"能办事"的智能体时代。Claude Code和OpenClaw两个里程碑应用的爆火印证这一转变。 Agent驱动算力需求非线性提升的原因。1)中阶Agent的Prefill阶段上下文长度在任务执行过程中持续膨胀,需加载大量工具定义、系统提示词与中间结果,以Manus为例,输入与输出Token比例约为100:1。2)长上下文对算力与存储形成双重压力:一方面大模型自注意力机制的计算成本与上下文长度呈二次方关系,一方面解码阶段受制于内存带宽而非计算能力,KV Cache随上下文增长而急剧膨胀进一步加剧瓶颈。谷歌Gemini、阿里云Qwen等均采用按上下文长度分档的阶梯定价机制。3)多Agent协作架构引入通信协调开销,产生不可避免的"协调税"。Anthropic表示多Agent系统的Token消耗约为对话模式的15倍。4)AI领域已出现明显的杰文斯悖论:微软CEO纳德拉明确表示,AI效率提升将带来使用量的爆炸式增长,使其成为永远无法被充分满足的商品。 相关标的: 海外算力/存储:中际旭创、东山精密、胜宏科技、欧科亿、天孚通信、天岳先进、新易盛、工业富联、兆易创新、大普微、源杰科技、景旺电子、英维克、唯科科技、领益智造等;Lumentum、闪迪、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。 国内算力:寒武纪、东阳光、海光信息、利通电子、协创数据、网宿科技、华丰科技、亿田智能、豫能控股、星环科技、首都在线、神州数码、百度集团、中芯国际、华虹半导体、中科曙光、润泽科技、浪潮信息、大位科技、润建股份、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。 CPU:海光信息、中科曙光、澜起科技、禾盛新材、中国长城、龙芯中科、兴森科技、深南电路、宏和科技、广合科技。AI应用:1)大模型&自定义Agent:智谱、Minimax、腾讯控股、阿里巴巴、科大讯飞。2)星环科技、德才股份、美年健康、中控技术等AI INFRA&高景气&高壁垒。其他:空天时代、具身智能等。 风险提示 行业竞争加剧的风险;技术迭代不及预期的风险;特定行业下游资本开支周期性波动的风险。 内容目录 行业动态:算力供需两端均迎关键信号.............................................................31.1需求端:大模型调用量爆发,国内受限于算力仍高速增长.....................................31.2供给端:关键融资顺利,回报临近拐点.....................................................31.3价格端:租赁价上涨,算力紧缺已获印证...................................................31.4国产替代:DeepSeek V4推理端或优先适配国产芯片.........................................4计算需求范式跃迁:从Chatbot到Agent...........................................................42.1第一阶段:Chatbot——一问一答,算力消耗有限............................................42.2第二阶段:低阶Agent——开始调用工具...................................................42.3第三阶段:中阶Agent——自主规划,持续运行,更高的准确度和泛化能力......................4Agent驱动算力需求的原因.......................................................................53.1中阶Agent与Prefill:上下文长度的膨胀.................................................53.2长上下文对算力与存储的双重需求.........................................................53.3多Agent通信:计算量指数级扩张的另一原因...............................................73.4能力提升带动调用量持续增加:杰文斯悖论.................................................8投资建议.......................................................................................8风险提示.......................................................................................9 图表目录 图表1:Anthropic与智谱历史ARR...............................................................3图表2:H100一年期租赁合约价格指数............................................................4图表3:OpenClaw的GitHub星标增长趋势.........................................................5图表4:KV Cache工作机制示意图................................................................6图表5:Qwen模型阶梯定价......................................................................7图表6:kimi k2.5的Agent集群协作示意图.......................................................8 行业动态:算力供需两端均迎关键信号 1.1需求端:大模型调用量爆发,国内受限于算力仍高速增长 截至2026年3月,中国AI大模型日均Token调用量已突破140万亿,较2024年初增长超千倍。这一数字背后,是真实商业化的持续深化:智谱MaaS平台API的ARR(年化经常性收入)约达17亿元人民币,过去12个月提升约60倍;2026年一季度,智谱API调用定价提升了83%,市场依然供不应求,调用量增长400%。 海外端,Anthropic商业化同步高速增长。据披露,Anthropic年化收入已达140亿美元,同比增长14倍。 1.2供给端:关键融资顺利,回报临近拐点 OpenAI于2026年3月31日完成完成了最新一轮融资,募集资金达1220亿美元,投后估值达8520亿美元。本轮融资由OpenAI的战略合作伙伴亚马逊、英伟达和软银领投,长期合作伙伴微软也继续参与其中。 3月31日华尔街见闻报道CoreWeave宣布已完成一笔85亿美元的延迟提款定期贷款融资,是全球首个获得投资级评级的高性能计算(HPC)基础设施融资工具,标志着GPU支撑的数据中心资产正式进入主流机构信贷市场。本次融资是CoreWeave近期一系列大规模资本运作的延续。公司披露,过去12个月内,其股权与债务融资承诺总额已累计达到约280亿美元。此次完成史上首个投资级GPU基础设施融资,不仅为公司提供了充足资本以支撑日益增长的客户需求,也将对同类AI基础设施资产的定价和评级体系产生示范效应,为整个行业的融资路径提供新的参照坐标。 Oracle也宣布计划在2026年通过债务和股权融资筹集450亿至500亿美元,以扩大其人工智能数据中心的容量,服务于包括英伟达、Meta、OpenAI、AMD、TikTok和xAI在内的客户。 从重资本投入走向现金流拐点:CoreWeave估算GPU资产可在2.5年内完全收回成本,这意味着从第三年开始,GPU将产生纯现金流,目前其客户合同平均期限为4年,形成较强的现金流保护。早期重资本投入的算力租赁正迎来回报拐点。 1.3价格端:租赁价上涨,算力紧缺已获印证 据SemiAnalysis数据显示,英伟达H100 GPU的一年期租赁价格从2025年10月的每小时1.7美元飙升至2026年3月的2.35美元,涨幅接近40%,所有按需算力已全线售罄。更值得注意的是,部分H100合约已直接续签至2028年,Blackwell新集群的交付周期也延长到了6-7个月,这也从侧面印证了算力需求的旺盛。 1.4国产替代:DeepSeek V4推理端或优先适配国产芯片 据美国科技媒体The Information于2026年4月3日报道,DeepSeek新一代模型V4将运行于华为最新设计的芯片之上,预计在未来数周内正式发布。DeepSeek与华为和寒武纪科技密切合作,对V4基础代码库的大部分内容进行了修改。与行业在重大版本发布前的常规流程不同,DeepSeek将美国芯片制造商排除在V4的早期准入之外。 此事件的战略意义在于:若V4能以纯国产芯片在推理端完成大规模商业部署,将标志着中国AI算力自主替代完成关键验证,形成示范效应。国内算力产业链有望直接受益于模型厂商的国产化采购。 计算需求范式跃迁:从Chatbot到Agent 2.1第一阶段:Chatbot——一问一答,算力消耗有限 大模型应用的第一个阶段本质上是一个对