您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国联民生证券]:深度解析DeepSeek V4:“模算协同”全国产闭环+Coding - 发现报告

深度解析DeepSeek V4:“模算协同”全国产闭环+Coding

报告封面

深度解析DeepSeek V4:“模算协同”全国产闭环+Coding 2026年04月25日 推荐 维持评级 市场回顾 本周(04.20-04.24)沪深300指数上涨0.86%,中小板指数上涨1.90%,创业板指数下跌0.29%,计算机(中信)板块上涨0.12%。板块个股涨幅前五名分别为:皖通科技、品高股份、宏景科技、佳华科技、杰创智能;跌幅前五名分别为:实达集团、*ST国华、品茗科技、信安世纪、真视通。 行业要闻 DeepSeek-V4预览版:迈入百万上下文普惠时代。腾讯混元Hy3 preview语言模型发布开源。字节跳动推出高精度3D生成大模型Seed3D 2.0。 分析师吕伟执业证书:S0590525110033邮箱:lvwei_yj@glms.com.cn 公司动态 分析师郭新宇执业证书:S0590525110034邮箱:guoxinyu@glms.com.cn 软通动力:4月24日,软通动力发布2025年年度报告及2026年一季报。报告显示,公司全年实现营业收入350.90亿元,同比增长12.05%;归母净利润2.06亿元,同比增长14.27%,财务结构稳健。2026年一季度延续高增态势,营收81.17亿元,同比增长15.79%,其中AI相关业务营收45.14亿元,同比大增39%。在全球迈向智能经济的产业拐点,软通动力全面落地“软硬一体、全栈智能”战略,向全栈智能化产品与服务提供商升级。2025年公司AI相关业务收入达184.66亿元,占总营收比重52.6%,成为核心增长引擎。 达梦数据:4月22日,2026中国数据库技术与产业大会在北京举行。会上,达梦数据集中发布四款重磅新品,并披露最新市场数据及AI战略。达梦数据发布的四款战略新品,全面覆盖集中式、分布式、云原生等核心应用场景。其中,达梦数据库管理系统DM9作为AI时代旗舰产品,实现450余项新特性升级,采用集中式与分布式一体化架构,支持多租户、自治容灾及AI智能体,大幅降低企业数字化转型门槛。 相关研究 1.计算机行业周报20260419:Token“通胀”呼唤国产算力:“一芯二模三云”之“一芯”-2026/04/192.计算机行业周报20260411:Token“通胀”呼唤超节点-2026/04/123.计算机行业动态报告:“龙虾”深度:Token“通胀”谁受益?一“芯”二“模”三“云”-2026/04/094.计算机行业周报20260405:Claude事件是否是国产大模型又一个“DeepSeek”时刻?-2026/04/065.计算机行业周报20260329:AI存算加速成为大模型竞争升级的关键-2026/03/29 投资建议 DeepSeek V4发布,“模算协同”新范式开国产算力全新发展空间。同时,AIAgent时代Token需求的非线性增长,或直接带来超预期的AI算力需求,国产算力自身价值有望持续提升。建议重点关注:1)国产AI芯片/CPU:寒武纪、海光信息、云天励飞、中国长城、龙芯中科、禾盛新材等;2)国产超节点龙头:浪潮信息、中科曙光、软通动力、神州数码、慧博云通、拓维信息、工业富联、彩讯股份、高新发展等;3)云计算:金山云、网宿科技、优刻得、青云科技等。4)AI编程:卓易信息、普元信息、金现代等。 风险提示:人工智能政策落地不及预期,行业竞争加剧。 目录 1本周观点.................................................................................................................................................................31.1 DeepSeek V4发布:重视技术革新下Coding等领域能力提升.............................................................................................31.2“模算协同”实现全国产闭环,国产算力迎来全新发展机遇..................................................................................................61.3投资建议............................................................................................................................................................................................102行业新闻..............................................................................................................................................................113公司新闻..............................................................................................................................................................124本周市场回顾........................................................................................................................................................135风险提示..............................................................................................................................................................15插图目录..................................................................................................................................................................16表格目录..................................................................................................................................................................16 1本周观点 1.1DeepSeek V4发布:重视技术革新下Coding等领域能力提升 DeepSeek近期推出V4系列大模型,覆盖专业版(V4-Pro)与高性价比版(V4-Flash)两大产品线,核心能力实现全面升级,在Agent能力、知识储备、推理性能等维度均达到开源模型第一梯队水平,部分指标比肩全球顶级闭源模型。 DeepSeek-V4-Pro:1)Agent能力显著提升:为当前已公开开源模型中Agentic Coding评 测 最 佳 水 平 , 其 余Agent相 关 评 测 表 现 同 样 优 异 。 据DeepSeek内部反馈,该模型目前已成为公司内部员工使用的Agentic Coding工具,实测使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式,仅与Opus 4.6思考模式存在一定差距。2)知识储备领先开源阵营:世界知识类测评成绩大幅领先其他开源模型,仅略低于顶尖闭源模型Gemini-Pro-3.1。3)推理性能比肩闭源顶级水平:在数学、STEM学科、竞赛级代码类测评中,超越当前所有已公开评测结果的开源模型,取得比肩全球顶级闭源模型的成绩。同时,相比Pro版本,V4-Flash的世界知识储备稍弱,但推理能力与Pro版本接近;由于模型参数和激活值更小,API调用速度更快、成本更低,为高性价比选择。Agent任务表现上,简单任务与V4-Pro表现相当,高复杂度任务仍存在一定差距。 资料来源:DeepSeek官方公众号,国联民生证券研究所 编程能力的进步成为重点。从上图中可以看出,DeepSeek-V4在多个权威编码基准测试中表现突出:1)SWE-bench-Verified:DeepSeek-V4-Pro-Max得分为80.6,在与图中其他大模型比较中处于相对领先地位。2)LiveCodeBench:DeepSeek-V4-Pro-Max得分达到93.5,超过图中其他大模型。3)TerminalBench 2.0以及Toolathlon:得分处于相对领先地位。 1M(一百万)上下文将是DeepSeek所有官方服务的标配。DeepSeek-V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。 资料来源:DeepSeek官方公众号,国联民生证券研究所 在解决相关问题时,DeepSeek V4提出了CSA与HCA的关键创新。当上下文长度达到较大规模时,注意力机制会成为模型的主要计算瓶颈。DeepSeek-V4设计了两种高效的注意力架构——压缩稀疏注意力(CSA)与高压缩注意力(HCA),并采用两者交错的混合配置,大幅降低了长文本场景下注意力机制的计算成本。 CSA的核心架构:首先将KV缓存条目数压缩至原来m分之一,再通过DeepSeek稀疏注意力实现进一步加速。此外,CSA还会保留一小部分滑动窗口内的KV条目,与压缩后的KV条目结合,以增强对局部细粒度依赖关系的建模能力。 资料来源:Anyi Xu等《DeepSeek-V4:Towards Highly Efficient Million-Token Context Intelligence》,国联民生证券研究所 HCA的核心架构:它采用更高程度的压缩:将每m′(≫m)个token的KV缓存条目合并为1个。同时,它额外保留了一小部分滑动窗口内的KV条目,以增强对局部细粒度依赖关系的建模能力。 资料来源:Anyi Xu等《DeepSeek-V4:Towards Highly EfficientMillion-Token Context Intelligence》,国联民生证券研究所 Agent能力专项优化。DeepSeek-V4针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流的Agent产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。 资料来源:DeepSeek官方公众号,国联民生证券研究所 1.2“模算协同”实现全国产闭环,国产算力迎来全新发展机遇 根据DeepSeek官方文档介绍,DeepSeek V4将细粒度专家并行(EP)方案同时在英伟达GPU和华为昇腾NPU上完成验证。与非融合的强基线方案相比,该方案在通用推理任务上实现了1.50 ~ 1.73倍的加速;在强化学习(RL)rollout、高速智能体服务等对延迟敏感的场景中,最高加速比可达1.96倍。 资料来源:Anyi Xu等《DeepSeek-V4:Towards Highly