AI智能总结
DeepSeek最快下周发布大模型V4。 2025年1月R1发布后,DeepSeek进入一年多的静默期,未推出新旗舰模型,仅通过渐进式更新持续打磨技术为V4铺路。 从2025年3月到12月,公司先后完成V3、R1的多轮升级,实现了模型能力融合 国产算力(7):静默打磨终破局,DeepSeek V4引领国产AI算力新生态【东北计算机】 DeepSeek最快下周发布大模型V4。 2025年1月R1发布后,DeepSeek进入一年多的静默期,未推出新旗舰模型,仅通过渐进式更新持续打磨技术为V4铺路。 从2025年3月到12月,公司先后完成V3、R1的多轮升级,实现了模型能力融合、稀疏注意力机制引入、数学竞赛金牌级表现等多项突破,还首次将思考能力整合到工具调用中。 年1月发布的流形约束超连接、Engram条件记忆技术相关论文,为V4的核心架构基石,其中Engram技术更实现了超100万token的上下文处理能力。 #V4多模态与性能实现质的突破:DeepSeek V4完成了模型能力的核心升级,彻底补齐了此前图像、视频处理的短板,成为支持图片、视频和文本同步理解与生成的原生多模态大模型。 其轻量版本V4 Lite已进入内测阶段,拥有100万token的上下文窗口,模型表现显著优于网页版和应用版,在未开启思考模式的情况下,该版本生成的SVG图像质量已超越DeepSeek V3.2思考模型;同时据接近发布的人士透露,V4的编码性能表现更优于当前的GPT和Claude模型。 此外,V4还具备极高的成本优势,有未经证实的泄露信息显示,其API每百万个token输入成本仅0.27美元,较竞争对手便宜超50倍,#我们认为其高性价比的特性将对全球头部AI模型形形成较大影响力。 #国产芯片适配重塑AI算力产业格局:DeepSeek V4最具战略意义的突破,在于放弃与英伟达的优化适配,选择与国产芯片厂商合作并完成对国产AI芯片的深度调优,尽管NV在计算密集型的预训练环节仍占据主导地位,但V4已实现推理阶段国产芯片的全面适配,而推理环节正是大模型商业化落地的核心环节,#我们认为这一战略转向提升了国产算力的重要性,向市场释放了国内AI坚定走国产算力适配路线的明确信号,加速构建国产模型与国产芯片协同发展的自主AI产业生态。 其他相关标的:算力&CPU:海光信息、禾盛新材、寒武纪等; IDC&算租:金开新能、宏景科技、利通电子、协创数据等;存储:海力士、三星、香农芯创、闪迪、美光;上游:华正新材、呈和科技、宏和科技、延江股份、德福科技等;服务器:中科曙光、浪潮信息;云计算:首都在线、优刻得、青云科技。 风险提示:政策进展不及预期;下游需求不及预期;人工智能风险等。