您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国新证券]:DeepSeek永久降价:模型成本曲线重构 - 发现报告

DeepSeek永久降价:模型成本曲线重构

信息技术 2026-05-29 钟哲元 国新证券 娱乐而已
报告封面

2026年5月29日 DeepSeek永久降价:模型成本曲线重构 看好 事件 2026年4-5月,DeepSeek将V4-Pro API价格降至原定价1/4并永久执行,成为国产大模型价格战关键转折点。小米随后跟进MiMo-V2.5系列API永久降价。 核心观点 DeepSeek本轮降价将临时优惠转为永久价格体系,改写了全球大模型API定价基准。其V4-Pro各计费项统一降价75%,标准输入价格仅为GPT-5.5 Pro的约1/72,高缓存命中场景下企业使用成本可降90%以上。降价未牺牲模型能力,Openrouter数据显示5月至今DeepSeek V4 Flash调用量排名第一。降价核心源于底层技术架构优化,V4系列采用混合注意力架构与多token预测技术,单token推理浮点运算量仅为前代的27%,KV缓存大小降至前代的10%。同时,DeepSeek V4已与华为昇腾完成深度适配,国产算力生态成熟提供了供应链支撑。Gartner预测,到2030年大模型推理成本将较2025年降低超90%,本次降价是这一长期趋势的阶段性体现。 数据来源:Wind,国新证券整理 相关研究 DeepSeek的永久降价打破了行业原有竞争平衡,基座模型进入K型分化时代。中间层通用模型厂商面临最大压力,既无闭源前沿模型的能力护城河,又失去了性价比优势;私有化部署能力强的厂商相对受益,金融、政务等行业有刚性本地化需求;C端/多模态产品厂商冲击有限,收入不完全依赖API;闭源前沿模型在复杂任务上仍有护城河。高端模型市场具备独立定价能力,智谱GLM-5.1等厂商2026年Q1涨价83%后调用量反而增长400%,验证高价值场景下能力优先于价格。 降价将大幅刺激大模型总调用量爆发式增长,带来产业链系统性价值重分配。云厂商迎来结构性利好,AI推理需求持续增长推高云服务价格中枢;国产AI软硬件生态闭环加速形成,为国产半导体产业链打开替代窗口;应用层“Token自由”时代到来,长文档分析、代码生成等场景将实现规模化运行,AI应用从试点阶段进入全面商业化兑现期。 分析师:钟哲元登记编码:S1490523030001邮箱:zhongzheyuan@crsec.com.cn 投资线索 重点把握三大投资方向:一是优先布局AI应用与Agent赛道,具备清晰场景闭环和变现能力的厂商有望率先实现业绩兑现;二是布局国产推理算力产业链,关注国产AI芯片、算力租赁及基础软件企业;三是关注具备强私有化部署能力的行业模型厂商。同时需警惕缺乏核心技术壁垒的中间层通用模型厂商风险。资本市场估值逻辑已转向认可成本曲线重构能力,长期看好具备成本重构与生态协同优势的产业链核心标的。 证券研究报告 风险提示 1、 技术发 展不及 预期;2、 市场 竞争加 剧;3、 地缘政 治影响 。 目录 一、从阶段性补贴到长期价格锚的确立....................................................................................................................................3二、工程效率突破而非短期补贴................................................................................................................................................4三、基座模型进入K型分化时代...............................................................................................................................................4四、需求扩容与价值重分配........................................................................................................................................................5五、投资建议................................................................................................................................................................................6六、风险提示................................................................................................................................................................................6 一、从阶段性补贴到长期价格锚的确立 2026年4-5月,DeepSeek先后推出大模型API阶段性降价与永久降价政策,将V4-Pro API价格降至原定价的1/4,成为国产大模型价格战的关键转折点。本次降价并非短期市场促销行为,而是基于底层工程效率突破的结构性价格调整,将大模型从“高价稀缺服务”推向“可规模化交付的基础设施”。随后小米跟进MiMo-V2.5系列大模型API永久降价,进一步巩固了普惠大模型的价格锚,推动国产基座模型进入清晰的K型分化阶段。行业的估值逻辑正从“模型稀缺性叙事”向“成本效率+真实ROI”切换,产业链上下游迎来价值重分配,AI应用商业化落地进程将显著加速。 DeepSeek本轮降价的标志性意义在于将临时优惠转化为永久价格体系,改写了全球大模型API的定价基准,其降价动作呈现清晰的递进式节奏,逐步确立普惠价格锚。 永久降价后,DeepSeek-V4-Pro形成了极具竞争力的定价体系,各计费项降幅统一为75%,打破了此前行业的定价惯性。 从价格对比来看,DeepSeek V4系列与全球主流大模型形成了数量级的差距,其中DeepSeek V4-Pro在相同计费项目下仍具有显著价格优势:其标准输入价格(3元/百万Tokens)仅为GPT-5.5 Pro标准输入价格(216元/百万Tokens)的约1/72,形成数十倍的价格差距,在RAG知识库、智能客服、文档分析等高缓存命中场景中,企业使用成本可下降90%以上。5月27日,小米宣布MiMo-V2.5系列API永久降价,最高降幅达99%,其定价完全对标DeepSeek V4系列,而MiMo- V2-Pro旗舰基座与全模态模型则维持原价不变,这一动作进一步印证了行业分层定价的趋势,也让普惠大模型的价格锚更加稳固。 特别的,本次降价并未以牺牲模型能力为代价,DeepSeek在维持旗舰级性能的前提下实现了价格的断崖式下降,实现了“接近前沿可用性前提下的价格重构”。Openrouter数据显示,5月至今DeepSeek V4 Flash调用量排名第一。 二、工程效率突破而非短期补贴 DeepSeek能够实现可持续的大幅降价,核心源于底层技术架构的大幅优化,而非单纯的资本补贴。V4系列引入压缩稀疏注意力(CSA)与重度压缩注意力(HCA)结合的混合架构,并采用多token预测技术,使得V4-Pro单token推理浮点运算量仅为前代V3的27%,KV缓存大小更是降至前代的10%。从长上下文场景的计算表现来看,随着token位置拉长至1024k,V3.2的单token计算量快速攀升至1.2 TFLOPs,而V4-Pro仅为0.3 TFLOPs,V4-Flash更是低至0.12 TFLOPs,这些技术突破直接让长上下文处理、Agent工作流、自动化编程等原本成本高昂的场景具备了大规模商业化的基础。 与此同时,国产算力生态的成熟为降价提供了供应链支撑,DeepSeek V4已与华为昇腾完成深度适配,Ascend Super Node成功实现V4推理部署,CANN承担了类似CUDA的底层适配角色,尽管当前吞吐瓶颈仍需等待2026年下半年昇腾950批量出货后解决,但已充分验证了国产芯片在推理侧的可用性。从行业长期趋势来看,推理成本持续下行是必然规律,Gartner预测,到2030年,生成式AI提供商对1万亿参数的大语言模型的推理成本将较2025年降低超过90%,本次DeepSeek的降价只是这一长期趋势的阶段性体现,其本质是通过重写行业成本曲线,提前打开大模型的市场空间。存储带宽成为推理性能瓶颈,“以存代算”成为降本关键路径,英伟达H200 GPU相比前代H100,其HBM容量提升了76%,同时带宽提升了43%,便实现推理吞吐量的大幅提升,这是DeepSeek实现KV缓存大幅优化的核心产业背景。 三、基座模型进入K型分化时代 DeepSeek的永久降价彻底打破了国产大模型原有的竞争平衡,行业呈现出K型分化格局,不同阵营的定价策略与商业模式走向截然不同的方向。本轮降价最直接的冲击对象是处于中间层的通用模型厂商,这类厂商既没有闭源前沿模型在高复杂度、长周期任务上的可靠性护城河,又失去了此前赖以生存的性价比优势,若下一代模型无法在成本或质量任一维度实现突破,将面临严重的双向挤压。 不过不同收入结构与业务模式的厂商受影响程度存在显著差异,降价带来的冲 击呈现明显的结构性特征。 市场对中间层厂商冲击存在结构性分歧,以MiniMax为例,2025年全年面向C端的AI原生产品收入为5307.5万美元,占总营收的67.2%,企业收入多面向国际客户,公有云API依赖度低,叠加多模态与强化学习引擎壁垒,受降价冲击有限,表明价格战仅显著影响公有云调用收入占比高的企业。在此背景下,大模型行业的估值逻辑发生了转变,此前基于“模型稀缺性”的估值叙事被打破,市场开始重新计算真实投资回报率,模型公司的估值逐渐拆分为两部分:公有云API业务看成本效率与规模效应,私有化部署业务看行业渗透率与客户粘性。 小米的跟进降价进一步强化了这一分化,行业最终形成了两条并行不悖的发展赛道,不同阵营的商业诉求与核心壁垒存在本质差异。高端模型市场具备独立定价能力,比如智谱GLM-5.1等厂商2026年Q1累计涨价83%,调用量反而增长400%,验证高价值场景下能力优先于价格;大厂与创业模型厂商商业模式存在本质差异,大厂以API为生态入口,可接受长期微亏,创业厂商以API为利润中心,必须靠自身收入覆盖成本,这是K型分化的底层逻辑。 四、需求扩容与价值重分配 DeepSeek的降价将通过降低单次调用成本,大幅刺激总调用量的爆发式增长。尤其是Agent、多步推理、长文本处理等任务,其使用频率与token消耗量本身具备极强的价格弹性,成本的断崖式下降将显著提升企业与开发者的采用意愿,2026年3月中国大模型日均词元调用量已突破140万亿,三个月内增长超过40%,降价后这一增速还将进一步加快。 对云厂商而言,这种变化带来的是结构性利好,一方面DeepSeek等模型厂商压低了AI使用门槛,推动更多企业接入云服务,另一方面AI推理需求的持续增长正在推高云服务的价格中枢,即使模型API价格下行,云侧的总需求规模仍在不断扩大。 同时,DeepSeek与国产芯片的深度适配,正在加速国产AI软硬件生态的闭 环形成,当下游推理需求大规模放量时,应用厂商为控制成本与保障供应链稳定,将更倾向于选择性价比更高的国产算力方案,这为国产半导体产业链打开了从能用到好用的替代窗口。算力结构加速重构,Agent时代CPU/GPU配比从1:4向1:2甚至1:1演进,CPU迎来价值重估。阿里云、腾讯云、百度智能云等国内头