模型商业化落地加速，国产算力硬件持续突破

2025-06-23 财通证券善护念

国产大模型加速迭代，截至2025年5月13日，中国主要大模型公司已发布超过45款基础大模型，约每3.3天就有一款新的模型发布。DeepSeek-R1-0528、Deepseek、豆包1.6、Qwen3等国产模型加速迭代基模能力，多模态同步升级，性能跻身世界第一梯队。

DeepSeek性能比肩世界顶尖：DeepSeek-V3基础模型超越开源模型，与GPT-4o、Claude-3.5-Sonnet等闭源模型性能相当；DeepSeek-R1-0528模型在数学、编程与通用逻辑等多个基准测评中取得国内最优成绩，接近o3、Gemini-2.5-Pro等国际顶尖模型。
豆包大模型升级至1.6版：成为国内首个多模态SOTA模型，性能在多个权威测评集上达到全球第一梯队水平，综合成本仅为2.6元/百万tokens，价格相较1.5版本以及DeepSeek降低约63%。1.6系列由三大模型组成，支持深度思考、多模态理解、256k长上下文、图形界面操作等能力。
阿里通义千问Qwen3性能接近顶级闭源模型：在Artificial Analysis、LiveCodeBench与Aider测评中均斩获全球开源模型第一名；Qwen3-Embedding系列模型专为文本表征、检索与排序任务设计，排序模型在各类文本检索场景中表现出色。

国产大模型应用广泛，用户需求持续增长。DeepSeek、豆包等主流app的MAU持续爬坡。以豆包大模型为例，2025年5月日均tokens使用量超过16.4万亿个，较2024年5月增长超过137倍。

阿里、腾讯资本开支大幅上升：阿里FY2025资本开支859.72亿元，同比上升167.93%；腾讯2024年资本开支767.6亿元，同比上升221.27%，1Q2025资本开支274.76亿元，同比上升91.35%。阿里未来三年将投入超过3800亿元用于建设云和AI硬件基础设施；腾讯亦表示计划在2025年进一步增加资本支出。
算力市场快速增长：根据IDC数据，2028年中国智能算力规模预计将达到2,781.9 EFLOPS，约为2024年的3.84倍；2024年中国人工智能算力市场规模为190亿美元，预计2025年将达到259亿美元，同比增长36.2%，预计2028年将达到552亿美元，2024-2028复合年增长率约为19.15%；预计2028年推理、训练负载占比分别为73%、27%。

海外对华技术封锁加剧，国产算力自主可控尤为关键。

华为CloudMatrix 384规模上线：国内目前唯一正式商用的大规模超节点集群，可提供300PFLOPS的密集BF16计算能力，约为NVL72的1.7倍；总内存容量和内存带宽分别约为NVL72的3.6倍和2.1倍，但能耗约为NVL72的4.1倍。
百度智能云发布昆仑芯超节点：突破传统单机8卡产品形态，在带宽、算力、训练和推理性能上相较已有方案均有大幅提升，并在能耗、兼容性等方面进行优化。