行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

人工智能专题：后R1时代，DeepSeek发展的三大阶段

信息技术 2025-10-14 唐月中原证券 Elise

DeepSeek 在年初发布 R1 模型后，并未立即推出更先进的 R2 模型，而是进行了多版本更新换代，发展历程可分为三个主要阶段：

阶段一：性能提升

2025年3月推出 V3-0324 和5月推出 R1-0528，通过后训练提升模型能力，弥补与头部模型的差距。

阶段二：混合推理架构、Agent 能力提升及国产芯片协同优化

2025年8月推出 V3.1 和 V3.1-Terminus，Agent 能力显著提升，思考效率提高。
V3.1 采用 UE8M0 FP8 缩放格式训练，针对即将发布的国产芯片设计，推动国产大模型与芯片协同优化。
DeepSeek 成为首个在开源超大规模大模型中成功落地 FP8 混合精度训练的公司，推动 FP8 技术规模化应用。

阶段三：提效降价，国产适配加速

2025年9月推出 V3.2-Exp，引入新的注意力机制 DSA，提升训练推理效率，模型价格大幅下降。
V3.2-Exp 输入缓存命中时价格降至 R1 的 20%，输入缓存未命中时降至 50%，输出价格降至 19%。
国产芯片华为昇腾和寒武纪同步完成 V3.2-Exp 的零日适配，推动国产 AI 产业从“单点突破”迈向“系统协同”。
DeepSeek 开源 TileLang 和 CUDA 版本的算子，TileLang 改善国产卡生态壁垒问题，推动国产大模型软硬件生态建设。

核心观点与结论

DeepSeek 通过多版本迭代提升模型性能，顺应海外混合推理架构和 Agent 能力提升趋势。
模型成本大幅下降，提升性价比和可推广性，促进应用端功能落地。
国产适配加速，推动国产 AI 产业系统协同，TileLang 开源进一步改善国产卡生态问题。

风险提示 国际形势变化。

分析师：唐月登记编码：S0730512030001tangyue@ccnew.com 021-50586737 ——人工智能专题证券研究报告-行业分析报告强于大市(维持) 发布日期：2025年10月14日投资要点： ⚫DeepSeek在年初发布了R1以后，受到了各界普遍关注。后续来看，DeepSeek并没有如期发布更先进的模型R2，而是在进行更多小版本的更新换代。结合每个阶段的发展重点，我们将其划分为3个主要的发展阶段。 ⚫阶段一：性能提升。DeepSeek在3月推出的V3-0324和5月推出的R1-0528，通过后训练实现了模型能力的提升，弥补了和头部模型之间的差距。资料来源：中原证券研究所，聚源相关报告《计算机行业月报：国产算力芯片迎来高光时刻，超节点和集群层面双双赶超》2025-09-19《人工智能专题：三大要素齐发力，AI应用步入全面加速期》2025-03-07 ⚫阶段二：实现混合推理架构、Agent能力提升、与国产芯片协同优化。从8月以后，DeepSeek也顺应了海外混合推理架构和Agent能力提升的大趋势，推出了V3.1和V3.1-Terminus，Agent能力有了较大提升，思考效率也有提升。V3.1采用UE8M0 FP8缩放格式训练，针对即将发布的下一代国产芯片设计，实现国产大模型和国产芯片协同设计的优化，对国产化芯片的应用起到积极的推动作用。联系人：李智电话：0371-65585629地址：郑州郑东新区商务外环路10号18楼地址：上海浦东新区世纪大道1788号T1座22楼 ⚫阶段三：提效降价，国产适配加速。9月发布的V3.2-Exp，基于V3.1-Terminus构建，引入了新的注意力机制DSA，在保持模型性能的稳定的同时，在训练推理效率方面有了较大的提升，带来了模型较大幅度的降价。考虑到当前大模型之间能力差距在缩小，成本的下降意味着模型具有更好的性价比和可推广性，也将促进应用端实现更多功能的落地。DeepSeek新兴AI编程语言选用TileLang这个新兴AI编程语言，可以实现对不同硬件平台的支撑，极大地改善了国产卡目前所面对的CUDA带来的生态壁垒问题，为国产大模型软硬件生态建立起到了极大的推动作用。发布的当天，国产芯片华为昇腾和寒武纪同步宣布完成对V3.2-Exp的零日适配，国产AI产业从“单点突破”迈向“系统协同”的又一个标志性事件。风险提示：国际形势变化。内容目录 1.阶段一：性能提升..........................................................................................32.阶段二：实现混合推理架构、Agent能力提升、与国产芯片协同优化...........33.阶段三：提效降价，国产适配加速.................................................................54.风险提示.........................................................................................................7 图表目录图1：DeepSeek模型的代码智能体能力对比........................................................................4图2：DeepSeek模型的搜索智能体能力对比........................................................................4图3：DeepSeek模型的数学能力对比...................................................................................4图4：DeepSeek模型的科学测试成绩对比............................................................................4图5：DeepSeek模型的代码生成能力对比............................................................................4图6：DeepSeek模型的推理与百科知识能力对比.................................................................4图7：计算精度及位数分布示意图..........................................................................................5图8：DeepSeek模型API调用价格（元/百万Tokens）.......................................................6图9：TileLang简介................................................................................................................6 表1：DeepSeek的主要模型发布情况.......................................................................................3表2：华为昇腾系列芯片发布计划及芯片性能.........................................................................5 DeepSeek在年初发布了R1以后，受到了各界普遍关注。后续来看，DeepSeek并没有如期发布更先进的模型R2，而是在进行更多小版本的更新换代。结合每个阶段的发展重点，我们将其划分为3个主要的发展阶段。 1.阶段一：性能提升 DeepSeek在3月推出的V3-0324和5月推出的R1-0528，还是以基础模型DeepSeek-V3-Base为基座，通过后训练实现了模型能力的提升，弥补了和头部模型之间的差距。 2.阶段二：实现混合推理架构、Agent能力提升、与国产芯片协同优化从8月以后，DeepSeek也顺应了海外混合推理架构和Agent能力提升的大趋势，推出了V3.1和V3.1-Terminus。这次升级中，DeepSeek的基座模型DeepSeek-V3.1-Base在DeepSeek-V3-Base基础上做了大规模外扩训练，Agent能力有了较大提升，思考效率也有提升。资料来源：DeepSeek，中原证券研究所资料来源：DeepSeek，中原证券研究所资料来源：DeepSeek，中原证券研究所资料来源：DeepSeek，中原证券研究所 8月21日，Deep在发布V3.1的同时，也宣布了在国产芯片适配方面的新进展。V3.1采用UE8M0 FP8缩放格式训练，为对即将发布的下一代国产芯片设计。此前，国内芯片企业仅有较少支持了FP8数据格式，多数芯片仅能支持FP16格式。FP8虽然可以提升计算速度和降低存储需求，但是由于计算精度不高，容易损失数据信息，所以V3以前的大模型训练中多会选用BF16或FP32/TF32精度进行数据计算和存储。DeepSeek是首个在开源超大规模大模型中成功落地FP8混合精度训练的公司，推动了FP8技术的规模化应用，也极大地提升了市场对H20等支持FP8格式芯片的需求。 UE8M0 FP8是对FP8格式的深度优化。该格式仅表示非负数（U代表Unisigned，无符号），尾数位为0（M0，尾数位为0），8个比特全部用来表示指数（E8，指数位占8位），Scale通过对数据进行分块缩放，保持其能够在FP8表示的范围内。UE8M0 FP8作为FP8格式的变体，通过减少数据存储和传输的损耗，能最大限度利用硬件计算能力，弥补国产芯片在HBM等高速内存带宽方面的不足，从而实现国产大模型和国产芯片协同设计的优化，对于国产化芯片的应用起到积极的推动作用。资料来源：互联网，中原证券研究所 3.阶段三：提效降价，国产适配加速 9月发布的V3.2-Exp，基于V3.1-Terminus构建，引入了新的注意力机制DSA，在保持模型性能的稳定的同时，在训练推理效率方面有了较大的提升，带来了模型较大幅度的降价。对比R1来看，V3.2-Exp的输入缓存命中时价格为R1的20%（0.2元/百万Tokens），输入缓存未命中时价格为R1的50%（2元/百万Tokens），输出价格为R1的19%（3元/百万Tokens），降幅最为明显。考虑到当前大模型之间能力差距在缩小，成本的下降意味着模型具有更好的性价比和可推广性，也将促进应用端实现更多功能的落地。资料来源：DeepSeek，中原证券研究所在国产适配方面进度明显加快。在V3.2-Exp发布的当天，国产芯片华为昇腾和寒武纪同步宣布完成对V3.2-Exp的零日适配。这是继V3.1采用UE8M0 FP8实现国产大模型和芯片协同设计的优化以后，国产AI产业从“单点突破”迈向“系统协同”的又一个标志性事件。同时值得注意的是DeepSeek还同时开源TileLang和CUDA两个版本的算子。TileLang是一种采用类Python语法的领域专用语言（DSL），于2025年1月由北大计算机学院杨智团队开源，旨在实现硬件调度与开发者算法逻辑的解耦，从而降低GPU编程的技术门槛，同时通过分层设计来实现不同技术背景开发者，从简单上手到深度优化的不同需求。由于TileLang可以实现对不同硬件平台的支撑，极大地改善了国产卡目前所面对的CUDA带来的生态壁垒问题。资料来源：北京大学，中原证券研究所 DeepSeek选用TileLang这个新兴AI编程语言，再次体现了其强大的创新精神，同时为国产大模型软硬件生态建立起到了极大的推动作用。 4.风险提示国际形势变化。行业投资评级强于大市：未来6个月内行业指数相对沪深300涨幅10％以上；同步大市：未来6个月内行业指数相对沪深300涨幅－10％至10％之间；弱于大市：未来6个月内行业指数相对沪深300跌幅10％以上。公司投资评级买入：未来6个月内公司相对沪深300涨幅15％以上；增持：未来6个月内公司相对沪深300涨幅5％至15％；谨慎增持：未来6个月内公司相对沪深300涨幅－10％至5％；减持：未来6个月内公司相对沪深300涨幅－15％至－10％；卖出：未来6个月内公司相对沪深300跌幅15％以上。证券分析师承诺本报告署名分析师具有中国证券业协会授予的证券分析师执业资格，本人任职符合监管机构相关合规要求。本人基于认真审慎的职业态度、专业严谨的研究方法与分析逻辑，独立、客观的制作本报告。本报告准确的反映了本人的研究观点，本人对报告内容和观点负责，保证报告信息来源合法合规。重要声明中原证券股份有限公司具备证券投资咨询业务资格。本报告由中原证券股份有限公司（以下简称“本公司”）制作并仅向本公司客户发布，本公司不会因任何机构或个人接收到本报告而视其为本公司的当然客户。本报告中的信息均来源于已公开的资料，本公司对这些信息的准确性及完整性不作任何保证，也不保证所含的信息不会发生任何变更。本报告中的推测、预测、评估、建议均为报告发布日的判断，本报告中的证券或投资标的价格、价值及投资带来的收益可能会波动，过往的业绩表现也不应当作为未来证券或投资标的表现的依据和担保。报告中的信息或所表达的意见并不构成所述证券买卖的出价或征价。本报告所含观点和建议并未

点击免费查看完整报告

人工智能专题：后R1时代，DeepSeek发展的三大阶段

你可能感兴趣

人工智能专题：DeepSeek的稀疏注意力机制给AI产业释放更大的发展潜能

DeepSeek V3/R1架构的深度分析与深度思考

TMT行业月报：三大运营商加大对人工智能投入，DeepSeek引发市场对国内人工智能产业链的关注

电子行业专题研究（普通）：Deepseek R1是AGI的里程碑，中长期利好算力硬件

电子行业周报：微信接入DeepSeek R1，关注“算力短缺”带来的产业链机遇

【九点特供】三大产品齐落地！文远知行进入沙特市场，机构看好Deepseek有望将汽车自动驾驶发展推向新的高潮；新规落地，6月起电子烟生产企业许可证将添核定产能

AI产业系列跟踪专题研究报告：从DeepSeek看国产AI的“后发优势”

公司经营水平处历史最好阶段，后工业化时代看好行业龙头的发展趋势

人工智能时代全面开启后，关于人力资源供需政策未来走向的提案

人工智能对技术并购的影响——后炒作、部署时代