行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

DeepSeek惊艳世界，算力与应用将迎来结构性变化

信息技术 2025-02-04 浦俊懿东方证券程思齐Sophie

DeepSeek AI 近期发布的 DeepSeek-V3 和 R1 模型在性能和成本上取得了显著突破，对 AI 算力与应用行业产生深远影响。

核心观点：

DeepSeek-V3 性能领先：在大模型主流榜单中，DeepSeek-V3 在开源模型中位列榜首，并与最先进的闭源模型 GPT-4o 和 Claude-3.5-Sonnet 不分伯仲。它在知识类任务、长文本评测、算法类代码场景和数学竞赛等任务上表现卓越。
DeepSeek-R1 推理能力强劲： R1 模型在数学、代码和自然语言推理等任务上实现了比肩 OpenAI o1 模型的能力，并通过开源和 API 服务的方式降低成本，推动 AI 应用普及。
技术创新降低成本： DeepSeek-V3 通过 FP8 精度训练、DualPipe 双向流水线等技术降低训练成本，通过优化 MoE 负载均衡、MLA 等技术降低推理成本，并通过 MTP 和模型蒸馏提升性能。
算力需求结构变化： DeepSeek 模型的低成本特性将推动 AI 应用繁荣，进而带动推理算力需求增长，改变算力需求结构。训练算力长期仍有前景，而美国对 AI 芯片的限制可能利好国产芯片。
AI 应用迎来发展机遇： DeepSeek 模型的强推理能力、低算力成本和开源属性将推动 AI 应用普及，为国内 AI 应用发展打下良好基础。

关键数据：

DeepSeek-V3 仅使用 2048 块 H800 GPU 训练 2 个月，消耗 278.8 万 GPU 小时，而 Llama3-405B 则消耗 3080 万 GPU 小时。
DeepSeek-V3 模型 API 服务价格大幅低于市面上所有模型，每百万输入 tokens 0.5 元（缓存命中）/ 2 元（缓存未命中），每百万输出 tokens 8 元。
DeepSeek-R1 模型 API 服务定价也大幅低于 OpenAI o1，每百万输入 tokens 1 元（缓存命中）/ 4 元（缓存未命中），每百万输出 tokens 16 元。

研究结论：

AI 应用正逐步进入落地期，建议投资者关注行业整体性机会，以及国产算力及推理算力服务企业。
建议关注 B 端企业级应用、垂直行业应用、AI 工具类应用和国产算力及算力服务企业。
需关注技术落地不及预期、政策落地不及预期、美国进一步制裁风险和竞争激烈导致变现能力下降等风险。

投资建议与投资标的：

B 端企业级应用：金山办公、鼎捷数智、泛微网络、汉得信息、软通动力、上海钢联、合合信息、新致软件、每日互动。
垂直行业应用：科大讯飞、焦点科技、润达医疗、同花顺、卫宁健康。
AI 工具类应用：彩讯股份、虹软科技、万兴科技、福昕软件。
国产算力及算力服务企业：海光信息、寒武纪-U、中科曙光、云赛智联、安博通、首都在线、优刻得-W。

核心观点 ⚫DeepSeek近期成为科技圈最炙手可热的明星企业：DeepSeek近期分别发布大模型DeepSeek-v3和推理模型R1，前者在大模型主流榜单的开源模型中位列榜首，并与世界上最先进的闭源模型不分伯仲；后者性能对标OpenAI的o1正式版，在数学、代码和自然语言推理等任务上表现卓越。以上两个模型均通过算法和架构的创新，大幅降低了训练成本和推理成本，为AI技术的普及与创新作出了卓越的贡献。DeepSeek相关模型自从推出后，立刻占据全球科技头条并引发巨大关注，我们认为，DeepSeek呈现出的算法创新、性能表现、开源属性等多重因素，将对AI应用与算力行业产生深远的影响。浦俊懿021-63325888*6106pujunyi@orientsec.com.cn执业证书编号：S0860514050004 ⚫DeepSeek在模型训练与推理中采用了多项技术创新：DeepSeek-V3实现了多项工程技术上的创新，包括通过FP8精度训练、DualPipe双向流水线等技术降低训练成本，通过优化MoE负载均衡、多头潜在注意力机制（MLA）来降低推理成本，并通过多Token预测（MTP）以及模型蒸馏来进一步提升模型性能，最终用极低的成本完成了训练过程，与此同时推理的成本也较其他模型有大幅下降。而R1-Zero的目标是验证纯RL能否激发模型的自主推理能力，探索无监督强化学习的潜力，而R1则通过数据引导+多阶段优化，平衡推理性能和实用价值，目标是打造更符合人类偏好的通用推理模型，两个模型均实现了较为理想的效果。字节加速AI落地、小米、理想"All in AI"2024-12-29AI应用前景广阔、自主可控已是大趋势：计算机行业2025年度投资策略2024-12-27AI应用落地曙光已现2024-11-18 ⚫DeepSeek将对AI算力与应用产生结构性影响：由于DeepSeek-V3、R1等模型通过算法与架构层面的多重创新大幅降低了训练端算力消耗，不过我们认为，在各模型公司仍致力于训练出性能更强大模型的目标指引下，庞大的训练集群将仍然被产业所追逐，训练算力长期看仍有前景和空间。而推理算力的需求空间则更为乐观，我们认为推理成本的大幅下降将带来需求更大幅度的增长，而在这样的过程中，算力需求结构可能将会改变，而美国如果进一步收紧AI芯片供应，则可能对国产芯片形成利好。而另一方面，此前AI应用的普及及其商业化还存在一定的困难，一方面在于模型性能仍然没法满足众多场景的需求，尤其是在推理能力和多模态环节，另一方面则是闭源模型性能领先但API调用的成本过高，影响了AI应用的大范围普及，我们认为，DeepSeek的强推理能力、低算力成本、开源属性，使得其对AI应用的普及有望发挥重要的作用。投资建议与投资标的我们认为AI应用正逐步进入落地期，有望呈现较多的投资机遇，建议投资者关注行业整体性机会，而国产算力及推理算力服务企业，也将从AI应用繁荣中受益。 ⚫B端企业级应用，建议关注金山办公、鼎捷数智、泛微网络、汉得信息、软通动力、上海钢联、合合信息、新致软件、每日互动。⚫垂直行业应用领域有较强优势的企业，建议关注科大讯飞、焦点科技、润达医疗、同花顺、卫宁健康。⚫AI工具类应用，建议关注彩讯股份、虹软科技、万兴科技、福昕软件。⚫国产算力及算力服务企业，建议关注海光信息、寒武纪-U、中科曙光、云赛智联、安博通、首都在线、优刻得-W。风险提示技术落地不及预期；政策落地不及预期；美国进一步制裁风险；竞争激烈导致变现能力下降。目录引言...............................................................................................................4 一、DeepSeek-V3、R1模型推出后“火”遍全球..............................................4 1.1DeepSeek-V3性能表现不输全球顶尖模型...................................................................41.2 R1模型实现了比肩OpenAI o1的推理能力..................................................................51.3 DeepSeek-V3、R1模型在产业中引发巨大反响...........................................................7 二、DeepSeek模型训练与推理技术创新解析................................................8 2.1 DeepSeek-V3模型采用了多项创新技术......................................................................82.2 R1-Zero与R1模型尝试强化学习边界.......................................................................10 三、DeepSeek将对AI算力与应用产生结构性影响.....................................11 3.1 DeepSeek模型有望引发算力需求与市场结构变化.....................................................113.2 AI应用有望在高性能、低成本模型支撑下繁荣...........................................................13 四、投资建议与投资标的.............................................................................15 五、风险提示...............................................................................................16 图表目录图1：DeepSeek-V3在多项评测中成绩领先................................................................................4图2：DeepSeek-V3在各类测试集上的表现................................................................................5图3：DeepSeek-V3 API服务价格具备很强的吸引力.................................................................5图4：DeepSeek-R1在推理能力上比肩OpenAI o1.....................................................................6图5：基于R1蒸馏的小模型性能超越OpenAI o1-mini................................................................6图6：DeepSeek-R1 API服务定价继续大幅低于OpenAI o1.......................................................7图7：DeepSeek-V3模型训练仅需要278.8万GPU小时训练资源..............................................7图8：DeepSeek成为全球增速最快的AI应用.............................................................................8图9：DeepSeek发布后下载量增长迅猛.....................................................................................8图10：DeepSeek-V3模型基本架构.............................................................................................8图11：DeepSeek-V3采用FP8为主的混合精度训练方法............................................................9图12：多Token预测（MTP）模块结构示意............................................................................10图13：R1-Zero由基础模型直接进行强化学习训练而产生.........................................................10图14：DeepSeek-R1-Zero训练期间AIME准确率....................................................................11图15：DeepSeek-R1-Zero在RL过程中的平均响应长度（输出长度不断增加）......................11图17：“杰文斯悖论”指出成本下降将刺激资源需求更大增长......................................................12图18：硅基流动x华为云联合推出基于昇腾云的DeepSeek R1 & V3推理服务.......................13图19：AI产品榜全球Web端访问前15情况（24年12月）....................................................14图20：AI产品榜全球APP端访问前15情况（24年12月）....................................................14图21：2024年全球AI产品付费用户规模..................................................................................14图22：short-CoT模式下，k1.5模型多方面能力领先...............................................................15图23：long-CoT模式下，k1.5模型多方面能力比肩o1............................................................15图24：Qwen2.5-Max测试结果领先各类指令模型.....................................................................15图25：Qwen2.5-Max表现优于各类开源模型............................................................................15 引言 DeepSeek近期分别发布大模型DeepSeek-v3和推理模型R1，前者在大模型主流榜单的开源模型中位列榜

点击免费查看完整报告

你可能感兴趣

DeepSeek重大突破，重视AI应用与算力的再平衡

信息技术财信证券2025-02-11

计算机行业周报：Kimi惊艳，继续重视AI应用和算力机会

信息技术开源证券2024-03-24

国常会部署加快场景培育和开放推动新场景大规模应用，机构称AI应用迎来业绩兑现拐点，国内AI企业第一梯队公司构建算力到AI应用全链条布局；6G英伟达联手三星等推进6G与AI-RAN建设，机构称2025年为6G标准元年，公司前瞻布局6G通讯高端PCB领域

财联社2025-11-02

DeepSeek惊艳世界，算力与应用将迎来结构性变化

你可能感兴趣

DeepSeek重大突破，重视AI应用与算力的再平衡

计算机行业周报：Kimi惊艳，继续重视AI应用和算力机会

TMT行业周报（6月第1周）：海外算力与应用迎来新催化

德邦医药】减肥口服药物效果惊艳，GLP1减肥将迎来口服药时代！

中泰科技孙行臻团队DeepSeek开启盈利新时代关注应用云厂及国产算力

人工智能行业周报：DeepSeek V3.1提振国产算力和应用

传媒行业周报：DeepSeek引领AI启新篇，继续布局AI应用/算力/游戏

DeepSeek行业大模型算力网加速应用生态白皮书

电子行业点评报告：国产算力周跟踪：DeepSeek降价推动AI应用，行业龙头继续明确Agent时代CPU核心地位