优于大市 百万上下文进入普惠时代,国产算力成功适配需求爆发将至 行业研究·行业快评 投资评级:优于大市(维持) 互联网 证券分析师:张伦可0755-81982651zhanglunke@guosen.com.cn 证券分析师:陈淑媛021-60375431chenshuyuan@guosen.com.cn 事项: 事项:4月24日,DeepseekV4发布。根据DeepSeek的官方介绍,V4系列包含两个MoE模型:DeepSeek-V4-Pro总参数1.6T、激活参数49B,DeepSeek-V4-Flash总参数284B、激活参数13B,两者均原生支持100万token上下文。 国信互联网观点: Agent能力大幅提升,处于国内第一梯队,性能比肩全球顶级闭源模型。根据公司官方,在AgenticCoding评测中,V4Pro已达到当前开源模型最佳水平。目前DeepSeekV4已成为公司内部员工使用的AgenticCoding模型,据评测反馈使用体验优于Sonnet4.5,交付质量接近Opus4.6非思考模式,但仍与Opus4.6思考模式存在一定差距。从第三方评测来看,Arena.ai在X上将V4Pro定性为"相较DeepSeekV3.2的重大飞跃",在代码开源模型榜单中位列第3位、综合第14位。另一家测评方ValsAI表示,V4在其VibeCodeBenchmark中是开源模型榜首。 Deepseek通过注意力层改进,推动百万上下文进入普惠时代。DeepSeekV4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力,实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。在1M上下文设置下,DeepSeekV4Pro的单token推理FLOPs只有V3.2的27%,KVCache只有10%;V4-Flash更极端,分别压到10%和7%。价格方面,Deepseek实现了高性价比。DeepSeek-V4-Pro输入/输出百万Token价格12元/24元;对比国内1T模型,比如小米输入/输出百万Token价格$1/$3(小于256K上下文);$2/$6(1M上下文)。Deepseek-V4-Flash价格更低,为输入/输出百万Token价格1元/2元。 Deepseek与国产芯片进行适配,包括华为、寒武纪等。V4在技术报中表示,在英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度EP(专家并行)方案。根据官网,下半年昇腾950超节点批量上市有望继续推动V4Pro降价。根据华为云官方,昇腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeekV4模型推理部署。昇腾A3超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于昇腾A3超节 点 的 训 练 参 考 实 现 。 寒 武 纪Day 0适 配DeepSeek-V4。寒 武 纪 已 基 于vLLM推 理 框 架 完 成285BDeepSeek-V4-flash和1.6TDeepSeek-V4-pro的Day0适配,适配代码已开源到GitHub社区。这一成果得益于寒武纪长期积累的自研NeuWare软件生态与芯片设计技术,也是寒武纪对芯片与算法联合创新持续投入的延续。 投资建议:密切关注国产模型和国产芯片。Deepseek的进一步在架构设计层面“降本增效”,推动国产模型更普惠实现百万上下文长度,密切关注国产模型厂商进展。寒武纪、华为昇腾的Day0适配表明,表明国产芯片在已达到商业可用的成熟度,密切关注国产算力进展。 风险提示:宏观经济波动风险、下游需求不及预期风险、核心技术水平升级不及预期的风险、AI快速迭代平权化下竞争加剧等。 评论: Agent能力大幅提升,处于国内第一梯队,性能比肩全球顶级闭源模型 Agent能力大幅提高,交付质量接近Opus4.6非思考模式。根据官网,在AgenticCoding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。目前DeepSeek-V4已成为公司内部员工使用的AgenticCoding模型,据评测反馈使用体验优于Sonnet4.5,交付质量接近Opus4.6非思考模式,但仍与Opus4.6思考模式存在一定差距。 模型能力处于国内第一梯队。从第三方评测来看,Arena.ai在X上将V4Pro(思考模式)定性为"相较DeepSeekV3.2的重大飞跃",在代码开源模型榜单中位列第3位、综合第14位。另一家测评方ValsAI表示,V4在其VibeCodeBenchmark中是开源模型榜首。 资料来源:ArenaAI,国信证券经济研究所整理 资料来源:ValsAI,国信证券经济研究所整理 资料来源:Artificial Analysis,国信证券经济研究所整理 Deepseek通过注意力层改进,推动百万上下文进入普惠时代 DeepSeekV4通过结构创新,实现了超高上下文效率。DeepSeekV4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeekSparseAttention),实现了全球领先的长上下文能力,并且相 比于传统方法大幅降低了对计算和显存的需求。根据腾讯科技,V4的做法是把注意力拆成两种,交替叠用。 CSA(压缩稀疏注意力):把每4个token的KV缓存合并成一条摘要,再让每个query只在这些摘要里挑出最相关的top-k条去算注意力。相当于既压缩了“要看的内容”,又只挑“值得看的”去算。另一种叫HCA(重压缩注意力):压缩率更激进,把每128个token合并成一条,但对剩下的摘要做稠密注意力,不做稀疏挑选。 资料来源:Deepseek论文,国信证券经济研究所整理 在1M上下文设置下,DeepSeekV4-Pro的单token推理FLOPs只有V3.2的27%,KV Cache只有10%;V4-Flash更极端,分别压到10%和7%。换句话说,上下文从V3.2的128K扩到V4的1M,理论上放大了近8倍,但单token算力需求反而下降。 资料来源:Deepseek,国信证券经济研究所整理 价格方面,Deepseek实现了高性价比。DeepSeek-V4-Pro输入/输出百万Token价格12元/24元;对比国内1T模 型 ,比 如 小 米 输入/输 出 百万Token价 格$1/$3( 小 于256K上 下 文) ;$2/$6(1M上 下 文范 围 ) 。Deepseek-V4-Flash价格更低,为输入/输出百万Token价格1元/2元。 图7:Deepseek的Token定价 资料来源:Deepseek,国信证券经济研究所整理 Deepseek与国产芯片进行适配,包括华为、寒武纪等 DeepseekV4将华为昇腾写入硬件清单,下半年昇腾950超节点批量上市有望继续推动V4Pro降价。V4在技术报中表示,在英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度EP(专家并行)方案。这是DeepSeek官方第一次在正式文档中把华为昇腾和英伟达并列写进硬件验证清单。根据华为云官方,昇腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeekV4系列模型。昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeekV4模型推理部署。昇腾A3超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于昇腾A3超节点的训练参考实现。 寒 武 纪Day 0适 配DeepSeek-V4。寒 武纪 已基 于vLLM推 理框 架完 成对285B DeepSeek-V4-flash和1.6TDeepSeek-V4-pro的Day 0适 配, 适 配 代码 已 开 源到GitHub社 区。 这 一 成果 得 益 于寒 武 纪 长期 积 累 的自研NeuWare软件生态与芯片设计技术,也是寒武纪对芯片与算法联合创新持续投入的延续。 投资建议 密切关注国产模型和国产芯片。Deepseek进一步在架构设计层面“降本增效”,推动国产模型更普惠实现百万上下文长度,密切关注国产模型厂商进展等。寒武纪、华为昇腾的Day0适配表明,表明国产芯片在已达到商业可用的成熟度,密切关注国产算力进展。 风险提示 宏观经济波动风险、下游需求不及预期风险、核心技术水平升级不及预期的风险、AI快速迭代平权化下竞争加剧等。 免责声明 分析师声明 作者保证报告所采用的数据均来自合规渠道;分析逻辑基于作者的职业理解,通过合理判断并得出结论,力求独立、客观、公正,结论不受任何第三方的授意或影响;作者在过去、现在或未来未就其研究报告所提供的具体建议或所表述的意见直接或间接收取任何报酬,特此声明。 重要声明 本报告由国信证券股份有限公司(已具备中国证监会许可的证券投资咨询业务资格)制作;报告版权归国信证券股份有限公司 关本报告的摘要或节选都不代表本报告正式完整的观点,一切须以我公司向客户发布的本报告完整版本为准。 本报告基于已公开的资料或信息撰写,但我公司不保证该资料及信息的完整性、准确性。本报告所载的信息、资料、建议及推测仅反映我公司于本报告公开发布当日的判断,在不同时期,我公司可能撰写并发布与本报告所载资料、建议及推测不一致的报告。我公司不保证本报告所含信息及资料处于最新状态;我公司可能随时补充、更新和修订有关信息及资料,投资者应当自行关注相关更新和修订内容。我公司或关联机构可能会持有本报告中所提到的公司所发行的证券并进行交易,还可能为这些公司提供或争取提供投资银行、财务顾问或金融产品等相关服务。本公司的资产管理部门、自营部门以及其他投资业务部门可能独立做出与本报告中意见或建议不一致的投资决策。 本报告仅供参考之用,不构成出售或购买证券或其他投资标的要约或邀请。在任何情况下,本报告中的信息和意见均不构成对任何个人的投资建议。任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。投资者应结合自己的投资目标和财务状况自行判断是否采用本报告所载内容和信息并自行承担风险,我公司及雇员对投资者使用本报告及其内容而造成的一切后果不承担任何法律责任。 证券投资咨询业务的说明 本公司具备中国证监会核准的证券投资咨询业务资格。证券投资咨询,是指从事证券投资咨询业务的机构及其投资咨询人员以下列形式为证券投资人或者客户提供证券投资分析、预测或者建议等直接或者间接有偿咨询服务的活动:接受投资人或者客户委托,提供证券投资咨询服务;举办有关证券投资咨询的讲座、报告会、分析会等;在报刊上发表证券投资咨询的文章、评论、报告,以及通过电台、电视台等公众传播媒体提供证券投资咨询服务;通过电话、传真、电脑网络等电信设备系统,提供证券投资咨询服务;中国证监会认定的其他形式。 发布证券研究报告是证券投资咨询业务的一种基本形式,指证券公司、证券投资咨询机构对证券及证券相关产品的价值、市场走势或者相关影响因素进行分析,形成证券估值、投资评级等投资分析意见,制作证券研究报告,并向客户发布的行为。 国信证券经济研究所 深圳深圳市福田区福华一路125号国信金融大厦36层邮编:518046总机:0755-82130833 上海上海浦东民生路1199弄证大五道口广场1号楼12层邮编:200135 北京北京西城区金融大街兴盛街6号国信证券9层邮编:100032