国产AI大模型推陈出新,创新成果持续涌现
国产大模型加速迭代,截至2025年5月13日,中国主要大模型公司已发布超过45款基础大模型,约每3.3天就有一款新的模型发布。DeepSeek-R1-0528、Deepseek、豆包1.6、Qwen3等国产模型加速迭代基模能力,多模态同步升级,性能跻身世界第一梯队。
- DeepSeek性能比肩世界顶尖:DeepSeek-V3基础模型超越开源模型,与GPT-4o、Claude-3.5-Sonnet等闭源模型性能相当;DeepSeek-R1-0528模型在数学、编程与通用逻辑等多个基准测评中取得国内最优成绩,接近o3、Gemini-2.5-Pro等国际顶尖模型。
- 豆包大模型升级至1.6版:成为国内首个多模态SOTA模型,性能在多个权威测评集上达到全球第一梯队水平,综合成本仅为2.6元/百万tokens,价格相较1.5版本以及DeepSeek降低约63%。1.6系列由三大模型组成,支持深度思考、多模态理解、256k长上下文、图形界面操作等能力。
- 阿里通义千问Qwen3性能接近顶级闭源模型:在Artificial Analysis、LiveCodeBench与Aider测评中均斩获全球开源模型第一名;Qwen3-Embedding系列模型专为文本表征、检索与排序任务设计,排序模型在各类文本检索场景中表现出色。
模型需求侧日益旺盛,各大云厂商加码布局
国产大模型应用广泛,用户需求持续增长。DeepSeek、豆包等主流app的MAU持续爬坡。以豆包大模型为例,2025年5月日均tokens使用量超过16.4万亿个,较2024年5月增长超过137倍。
- 阿里、腾讯资本开支大幅上升:阿里FY2025资本开支859.72亿元,同比上升167.93%;腾讯2024年资本开支767.6亿元,同比上升221.27%,1Q2025资本开支274.76亿元,同比上升91.35%。阿里未来三年将投入超过3800亿元用于建设云和AI硬件基础设施;腾讯亦表示计划在2025年进一步增加资本支出。
- 算力市场快速增长:根据IDC数据,2028年中国智能算力规模预计将达到2,781.9 EFLOPS,约为2024年的3.84倍;2024年中国人工智能算力市场规模为190亿美元,预计2025年将达到259亿美元,同比增长36.2%,预计2028年将达到552亿美元,2024-2028复合年增长率约为19.15%;预计2028年推理、训练负载占比分别为73%、27%。
海外制裁加剧,国产算力硬件加速突破
海外对华技术封锁加剧,国产算力自主可控尤为关键。
- 华为CloudMatrix 384规模上线:国内目前唯一正式商用的大规模超节点集群,可提供300PFLOPS的密集BF16计算能力,约为NVL72的1.7倍;总内存容量和内存带宽分别约为NVL72的3.6倍和2.1倍,但能耗约为NVL72的4.1倍。
- 百度智能云发布昆仑芯超节点:突破传统单机8卡产品形态,在带宽、算力、训练和推理性能上相较已有方案均有大幅提升,并在能耗、兼容性等方面进行优化。
建议关注
海光信息、中芯国际、寒武纪、盛科通信、龙芯中科、沪电股份、深南电路、兴森科技、生益科技、方正科技、中材科技、华丰科技、南亚新材、杰华特、兆易创新、澜起科技、华勤技术、江海股份等。
风险提示
- 模型技术迭代不及预期风险
- 国产算力硬件商业化不及预期风险
- 宏观经济波动风险
- 竞争格局恶化风险