核心观点
- 算力从训练走向推理:大模型训练数据量增长放缓、边际效益递减,训练算力逐步转向“精耕细作”,推理算力需求爆发,算力结构向推理侧倾斜。
- 大模型提质降本:大模型能力全面超越人类基准,应用边界持续拓展,推理成本因技术优化出现断崖式下跌,进一步刺激推理需求。
- 推理算力增长引擎:多模态交互带来推理密度指数级提升,Agent的普及引发推理任务爆发增长,二者将成为推动推理算力非线性爆发的核心引擎。
关键数据
- 全球人工智能市场规模:2026年全球人工智能(AI)总支出将达到2.53万亿美元,同比增长44%;2023年至2030年全球人工智能(AI)市场有望实现超过35%的复合增长率。
- 算力推理端占比:2026年算力推理端工作负载占所有计算量约三分之二,2025年约占一半,2023年约占三分之一。
- 中国企业未来智能体数量:2031年突破3.5亿规模,年复合增长率达到135%以上。
- 大模型推理成本:近年来大幅下降,部分国产旗舰模型较两年前性价比提升近百倍。
- OpenClaw的大模型调用量:阶跃星辰Step 3.5 Flash在OpenClaw上的日调用量增长超20倍,MiniMax的M2系列模型平均单日Token消耗量增长至2025年12月的超过6倍。
研究结论
- Agent时代算力架构重塑:CPU从“幕后调度”到“前台执行”,成为处理高度分支化任务、承载海量KV-Cache的最优载体;GPU性能瓶颈从算力峰值转向显存带宽。
- 云服务模式转型:商业模式从传统的资源租赁模式,加速向“MaaS(模型即服务)与Agent编排”的全新范式跃迁;行业竞争核心从单纯的算力规模比拼,转向工具链生态的综合构建。
- AI存储架构创新:KV缓存对存储架构提出新要求,英伟达推出ICMS AI原生存储平台,新增G3.5闪存层优化KV缓存管理,依托BlueField-4 DPU实现大容量与高速传输。
- 投资建议:关注芯片(GPU&CPU)、云服务、IDC、服务器、数据库等领域标的,如海光信息、寒武纪、首都在线、浪潮信息、达梦数据等。
- 风险提示:AI应用推进不及预期风险、行业竞争加剧风险。