行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

DeepSeek永久降价：模型成本曲线重构

信息技术 2026-05-29 钟哲元国新证券娱乐而已

核心观点

DeepSeek将V4-Pro API价格降至原定价1/4并永久执行，成为国产大模型价格战关键转折点，改写了全球大模型API定价基准。其V4-Pro各计费项统一降价75%，标准输入价格仅为GPT-5.5 Pro的约1/72，高缓存命中场景下企业使用成本可降90%以上。降价源于底层技术架构优化（混合注意力架构、多token预测技术），单token推理浮点运算量降为前代的27%，KV缓存大小降至前代的10%。同时，DeepSeek V4已与华为昇腾深度适配，国产算力生态成熟提供支撑。Gartner预测到2030年大模型推理成本将降超90%，本次降价是长期趋势的阶段性体现。

行业影响

DeepSeek降价打破原有竞争平衡，行业进入K型分化时代：

中间层通用模型厂商受冲击最大，既无模型能力护城河，又失性价比优势；
私有化部署能力强厂商（如金融、政务）相对受益；
C端/多模态产品厂商冲击有限；
闭源前沿模型在复杂任务上仍有护城河；
高端模型市场具备独立定价能力，智谱GLM-5.1等厂商涨价后调用量反增。

投资机会

重点把握三大投资方向：

AI应用与Agent赛道，具备场景闭环和变现能力的厂商将率先兑现业绩；
国产推理算力产业链，关注国产AI芯片、算力租赁及基础软件企业；
具备强私有化部署能力的行业模型厂商。

研究结论

DeepSeek降价刺激大模型总调用量爆发式增长，带来产业链系统性价值重分配：

云厂商迎来结构性利好，AI推理需求推高云服务价格中枢；
国产AI软硬件生态加速形成，为国产半导体产业链打开替代窗口；
应用层“Token自由”时代到来，长文档分析、代码生成等场景规模化运行，AI应用进入全面商业化兑现期。

关键数据

DeepSeek V4-Pro标准输入价格仅为GPT-5.5 Pro的约1/72；
5月至今DeepSeek V4 Flash调用量排名第一；
智谱GLM-5.1等高端模型2026年Q1涨价83%后调用量增长400%；
2026年3月中国大模型日均词元调用量突破140万亿，三个月内增长超40%。

风险提示

技术发展不及预期；
市场竞争加剧；
地缘政治影响。

2026年5月29日 DeepSeek永久降价：模型成本曲线重构看好事件 2026年4-5月，DeepSeek将V4-Pro API价格降至原定价1/4并永久执行，成为国产大模型价格战关键转折点。小米随后跟进MiMo-V2.5系列API永久降价。核心观点 DeepSeek本轮降价将临时优惠转为永久价格体系，改写了全球大模型API定价基准。其V4-Pro各计费项统一降价75%，标准输入价格仅为GPT-5.5 Pro的约1/72，高缓存命中场景下企业使用成本可降90%以上。降价未牺牲模型能力，Openrouter数据显示5月至今DeepSeek V4 Flash调用量排名第一。降价核心源于底层技术架构优化，V4系列采用混合注意力架构与多token预测技术，单token推理浮点运算量仅为前代的27%，KV缓存大小降至前代的10%。同时，DeepSeek V4已与华为昇腾完成深度适配，国产算力生态成熟提供了供应链支撑。Gartner预测，到2030年大模型推理成本将较2025年降低超90%，本次降价是这一长期趋势的阶段性体现。数据来源：Wind，国新证券整理相关研究 DeepSeek的永久降价打破了行业原有竞争平衡，基座模型进入K型分化时代。中间层通用模型厂商面临最大压力，既无闭源前沿模型的能力护城河，又失去了性价比优势；私有化部署能力强的厂商相对受益，金融、政务等行业有刚性本地化需求；C端/多模态产品厂商冲击有限，收入不完全依赖API；闭源前沿模型在复杂任务上仍有护城河。高端模型市场具备独立定价能力，智谱GLM-5.1等厂商2026年Q1涨价83%后调用量反而增长400%，验证高价值场景下能力优先于价格。降价将大幅刺激大模型总调用量爆发式增长，带来产业链系统性价值重分配。云厂商迎来结构性利好，AI推理需求持续增长推高云服务价格中枢；国产AI软硬件生态闭环加速形成，为国产半导体产业链打开替代窗口；应用层“Token自由”时代到来，长文档分析、代码生成等场景将实现规模化运行，AI应用从试点阶段进入全面商业化兑现期。分析师：钟哲元登记编码：S1490523030001邮箱：zhongzheyuan@crsec.com.cn 投资线索重点把握三大投资方向：一是优先布局AI应用与Agent赛道，具备清晰场景闭环和变现能力的厂商有望率先实现业绩兑现；二是布局国产推理算力产业链，关注国产AI芯片、算力租赁及基础软件企业；三是关注具备强私有化部署能力的行业模型厂商。同时需警惕缺乏核心技术壁垒的中间层通用模型厂商风险。资本市场估值逻辑已转向认可成本曲线重构能力，长期看好具备成本重构与生态协同优势的产业链核心标的。证券研究报告风险提示 1、技术发展不及预期；2、市场竞争加剧；3、地缘政治影响。目录一、从阶段性补贴到长期价格锚的确立....................................................................................................................................3二、工程效率突破而非短期补贴................................................................................................................................................4三、基座模型进入K型分化时代...............................................................................................................................................4四、需求扩容与价值重分配........................................................................................................................................................5五、投资建议................................................................................................................................................................................6六、风险提示................................................................................................................................................................................6 一、从阶段性补贴到长期价格锚的确立 2026年4-5月，DeepSeek先后推出大模型API阶段性降价与永久降价政策，将V4-Pro API价格降至原定价的1/4，成为国产大模型价格战的关键转折点。本次降价并非短期市场促销行为，而是基于底层工程效率突破的结构性价格调整，将大模型从“高价稀缺服务”推向“可规模化交付的基础设施”。随后小米跟进MiMo-V2.5系列大模型API永久降价，进一步巩固了普惠大模型的价格锚，推动国产基座模型进入清晰的K型分化阶段。行业的估值逻辑正从“模型稀缺性叙事”向“成本效率+真实ROI”切换，产业链上下游迎来价值重分配，AI应用商业化落地进程将显著加速。 DeepSeek本轮降价的标志性意义在于将临时优惠转化为永久价格体系，改写了全球大模型API的定价基准，其降价动作呈现清晰的递进式节奏，逐步确立普惠价格锚。永久降价后，DeepSeek-V4-Pro形成了极具竞争力的定价体系，各计费项降幅统一为75%，打破了此前行业的定价惯性。从价格对比来看，DeepSeek V4系列与全球主流大模型形成了数量级的差距，其中DeepSeek V4-Pro在相同计费项目下仍具有显著价格优势：其标准输入价格（3元/百万Tokens）仅为GPT-5.5 Pro标准输入价格（216元/百万Tokens）的约1/72，形成数十倍的价格差距，在RAG知识库、智能客服、文档分析等高缓存命中场景中，企业使用成本可下降90%以上。5月27日，小米宣布MiMo-V2.5系列API永久降价，最高降幅达99%，其定价完全对标DeepSeek V4系列，而MiMo- V2-Pro旗舰基座与全模态模型则维持原价不变，这一动作进一步印证了行业分层定价的趋势，也让普惠大模型的价格锚更加稳固。特别的，本次降价并未以牺牲模型能力为代价，DeepSeek在维持旗舰级性能的前提下实现了价格的断崖式下降，实现了“接近前沿可用性前提下的价格重构”。Openrouter数据显示，5月至今DeepSeek V4 Flash调用量排名第一。二、工程效率突破而非短期补贴 DeepSeek能够实现可持续的大幅降价，核心源于底层技术架构的大幅优化，而非单纯的资本补贴。V4系列引入压缩稀疏注意力(CSA)与重度压缩注意力(HCA)结合的混合架构，并采用多token预测技术，使得V4-Pro单token推理浮点运算量仅为前代V3的27%，KV缓存大小更是降至前代的10%。从长上下文场景的计算表现来看，随着token位置拉长至1024k，V3.2的单token计算量快速攀升至1.2 TFLOPs，而V4-Pro仅为0.3 TFLOPs，V4-Flash更是低至0.12 TFLOPs，这些技术突破直接让长上下文处理、Agent工作流、自动化编程等原本成本高昂的场景具备了大规模商业化的基础。与此同时，国产算力生态的成熟为降价提供了供应链支撑，DeepSeek V4已与华为昇腾完成深度适配，Ascend Super Node成功实现V4推理部署，CANN承担了类似CUDA的底层适配角色，尽管当前吞吐瓶颈仍需等待2026年下半年昇腾950批量出货后解决，但已充分验证了国产芯片在推理侧的可用性。从行业长期趋势来看，推理成本持续下行是必然规律，Gartner预测，到2030年，生成式AI提供商对1万亿参数的大语言模型的推理成本将较2025年降低超过90%，本次DeepSeek的降价只是这一长期趋势的阶段性体现，其本质是通过重写行业成本曲线，提前打开大模型的市场空间。存储带宽成为推理性能瓶颈，“以存代算”成为降本关键路径，英伟达H200 GPU相比前代H100，其HBM容量提升了76%，同时带宽提升了43%，便实现推理吞吐量的大幅提升，这是DeepSeek实现KV缓存大幅优化的核心产业背景。三、基座模型进入K型分化时代 DeepSeek的永久降价彻底打破了国产大模型原有的竞争平衡，行业呈现出K型分化格局，不同阵营的定价策略与商业模式走向截然不同的方向。本轮降价最直接的冲击对象是处于中间层的通用模型厂商，这类厂商既没有闭源前沿模型在高复杂度、长周期任务上的可靠性护城河，又失去了此前赖以生存的性价比优势，若下一代模型无法在成本或质量任一维度实现突破，将面临严重的双向挤压。不过不同收入结构与业务模式的厂商受影响程度存在显著差异，降价带来的冲击呈现明显的结构性特征。市场对中间层厂商冲击存在结构性分歧，以MiniMax为例，2025年全年面向C端的AI原生产品收入为5307.5万美元，占总营收的67.2%，企业收入多面向国际客户，公有云API依赖度低，叠加多模态与强化学习引擎壁垒，受降价冲击有限，表明价格战仅显著影响公有云调用收入占比高的企业。在此背景下，大模型行业的估值逻辑发生了转变，此前基于“模型稀缺性”的估值叙事被打破，市场开始重新计算真实投资回报率，模型公司的估值逐渐拆分为两部分：公有云API业务看成本效率与规模效应，私有化部署业务看行业渗透率与客户粘性。小米的跟进降价进一步强化了这一分化，行业最终形成了两条并行不悖的发展赛道，不同阵营的商业诉求与核心壁垒存在本质差异。高端模型市场具备独立定价能力，比如智谱GLM-5.1等厂商2026年Q1累计涨价83%，调用量反而增长400%，验证高价值场景下能力优先于价格；大厂与创业模型厂商商业模式存在本质差异，大厂以API为生态入口，可接受长期微亏，创业厂商以API为利润中心，必须靠自身收入覆盖成本，这是K型分化的底层逻辑。四、需求扩容与价值重分配 DeepSeek的降价将通过降低单次调用成本，大幅刺激总调用量的爆发式增长。尤其是Agent、多步推理、长文本处理等任务，其使用频率与token消耗量本身具备极强的价格弹性，成本的断崖式下降将显著提升企业与开发者的采用意愿，2026年3月中国大模型日均词元调用量已突破140万亿，三个月内增长超过40%，降价后这一增速还将进一步加快。对云厂商而言，这种变化带来的是结构性利好，一方面DeepSeek等模型厂商压低了AI使用门槛，推动更多企业接入云服务，另一方面AI推理需求的持续增长正在推高云服务的价格中枢，即使模型API价格下行，云侧的总需求规模仍在不断扩大。同时，DeepSeek与国产芯片的深度适配，正在加速国产AI软硬件生态的闭环形成，当下游推理需求大规模放量时，应用厂商为控制成本与保障供应链稳定，将更倾向于选择性价比更高的国产算力方案，这为国产半导体产业链打开了从能用到好用的替代窗口。算力结构加速重构，Agent时代CPU/GPU配比从1:4向1:2甚至1:1演进，CPU迎来价值重估。阿里云、腾讯云、百度智能云等国内头

点击免费查看完整报告

DeepSeek永久降价：模型成本曲线重构

核心观点

行业影响

投资机会

研究结论

关键数据

风险提示

你可能感兴趣

【九点特供】DeepSeek官宣永久降价，有望利好AI普惠，国产算力或逐渐从政策驱动替代转向真实需求订单兑现；超聚变创业板IPO获受理，服务器市场份额..-20260525

DeepSeek模型优势：算力、成本角度解读

2025年DeepSeek模型优势：算力、成本角度解读报告

2025年DeepSeek模型优势：算力、成本角度解读报告

信息技术行业动态点评：DeepSeek发布第二代MoE架构模型，API调用成本降低

DeepSeek之AI大模型解读：模型成本大幅下降，国产化全方位加速

DeepSeek降低模型成本，Kimi+进一步扩宽应用场景

后疫情时代的投资逻辑之化工行业：成本曲线重构驱动行业向上弹性

基础化工：10月MDI/TDI挂牌价大幅上调，北溪事件或加速行业成本曲线重构

半导体行业深度报告（十二）：AI大模型竞赛方兴未艾，OpenAI与DeepSeek引领行业生态重构