行业研究公司研究宏观策略财报招股书会议纪要海南封关低空经济 DeepSeek AIGC 大模型

电子行业专题研究（普通）：Deepseek R1是AGI的里程碑，中长期利好算力硬件

电子设备2025-02-04莫文宇信达证券王***

AI智能总结

DeepSeek V3 是基于 Transformer 架构的 671B 参数专家混合（MoE）语言模型，采用创新的负载均衡策略和多标记预测训练目标，并通过 FP8 混合训练精度训练框架大幅提高训练效率，仅以 2.664M H800 GPU 小时完成预训练。
DeepSeek-R1 是基于 DeepSeek V3 的集大成之作，性能对标 OpenAI-o1，其 Zero 版本通过大规模强化学习（RL）训练，无需监督微调（SFT），展示了自我验证、反射和生成长 CoT 等功能，是首个验证的纯粹通过 RL 激励 LLM 推理能力的开放研究。
DeepSeek 团队开源了 DeepSeek-R1-Zero、DeepSeek-R1 及六个基于 Qwen 和 Llama 提炼的密集模型（1.5B-70B），部分测试性能超越 OpenAI o1-mini。
OpenAI 发布 o3-mini 和 Deep Research 作出回应，o3-mini 在物理模拟和编程能力上大幅提升，能生成四维空间内小球的弹射程序，并能快速克隆应用、生成游戏；Deep Research 是一个仅需提示即可创建研究分析师级别报告的代理。
AI 发展尚处于早期阶段，从通用人工智能层面看，如 ChatGPT 仅属于 Level 1-Emerging 级别，但专业领域已有 AI 模型达到超人级别，如 AlphaFold、AlphaZero 等。
AI 产业化将加速算力投入，推理市场有望快速放量，推动自动驾驶、人形机器人等领域发展，大模型厂商淘汰加速，无法超越开源模型的闭源厂商将快速出清。
投资建议关注 AI 产业链相关标的，包括工业富联、沪电股份、寒武纪、海光信息等 AI 云侧，以及蓝思科技、领益智造、鹏鼎控股等 AI 端侧公司。

电子行业专题研究（普通）：Deepseek R1是AGI的里程碑，中长期利好算力硬件

证券研究报告行业研究 2025年2月4日本期内容提要: ➢OpenAI掀起反攻号角，o3-mini和Deep Research相继发布。为了应对DeepSeek的挑战，OpenAI发布了O3-mini，理解物理世界能力、编程能力大幅提升。o3-mini在物理模拟高难度挑战中展现出惊人的实力，在模拟小球的转动时，o3-mini具备更强的物理推理能力，而DeepSeek R1则出现了反重力现象。此外，o3-mini能生成四维空间内小球的弹射程序，展现出很高的潜力。此外，OpanAI还发布了DeepResearch，这是OpenAI新发布代理——仅需一个提示，ChatGPT将查找、分析和综合数百个在线资源，以创建研究分析师级别的综合报告。它由即将推出的OpenAI o3模型版本提供支持，该版本针对Web浏览和数据分析进行了优化，它利用推理来搜索、解释和分析互联网上的大量文本、图像和PDF，并根据遇到的信息根据需要进行调整。 ➢AI未来尚有星辰大海有待探索，AGI商业化奇点临近。谷歌DeepMind团队曾将AI划分为6大发展阶段，从狭义的层面看，在专业领域已经有AI模型能达到超人级别。如AlphaFold、AlphaZero、StockFish等AI模型可以在特定的领域完全超越人类，但是从通用人工智能的层面看，AI的发展还处于较低水平，如ChatGPT仅可以划分为Level 1-Emerging级别。FIGURE是人形机器人领域的领导者之一，在其视角中，我们也能窥探AI的历史机遇。在如今全球GDP中，50%的劳动力均为人类劳动，大约42T美金空间，仅此一项，AI就有广阔的前景。 ➢投资建议：算法创新和算力投入相辅相成，建议关注AI产业链标的。AI领域的发展速度超过传统制造业，2023年来，Scaling Laws开始发力，全球领域内开启了算力资源的“军备竞赛”。而在地缘政治等因素的激励下，算法层面的追赶终于由算力相对匮乏的的中国团队唱响号角。我们认为，在通向AGI的道路上，算法创新和算力资源都是不可或缺的。早在2024年，我们就明确了推理市场要想实现繁荣必须降低推理成本的结论。如今，豆包、DeepSeek研究团队的相关工作成功信达证券股份有限公司CINDA SECURITIES CO.,LTD北京市西城区宣武门西大街甲127号金隅大厦B座邮编：100031 地大幅度降低了推理成本，推进了AI的产业化。DeepSeek的成功，是开源模型相对闭源模型的一次飞跃。诚然，在十分有限的时间区间内，北美的科技大厂或把有限的精力放在算法层面，以充分挖掘自身算力资源的潜力。但是，这并不意味着对算力的投入将会停止。相反，AI的产业化有望在中长期加速算力的投入，避免了以往的AI热潮最终因无法落地而走向失败的困局。从推理市场看：推理有望快速放量，文生文、文生视频、图生视频的各类功能或快速迭代，并使得AI真正的理解物理世界，自动驾驶、人形机器人、AI在各行各业掀起产业革命的奇点临近。从训练市场看：一方面，训练模型的前沿探索仍需大量算力投入，且推理市场的放量，有望衍生新的模型探索方向。另一方面，如世界模型等方向的研究进展有望加速。但是，我们也看到大模型厂商的淘汰也将加速，无法超越开源模型的闭源大模型厂商或快速出清。扎克伯格曾在Meta法说会上表示，“随着时间的推移，就像每个企业都有一个网站、一个社交形象和一个电子邮件地址一样，在未来，每个企业也将拥有一个客户可以与之交互的AI代理。我们的目标是让每个小企业，最终每个企业，都可以轻松地将其所有内容和目录提取到一个AI代理中，从而推动销售并节省资金。”这一时点正在逐步临近，从历史看，当计算机从实验室走向千家万户，并没有导致相关的企业没落，而是孕育了许多伟大的企业。目前看，AI也有望经历这一过程，建议关注产业链相关标的。 ➢相关个股：【AI云侧】工业富联/沪电股份/生益科技/深南电路/胜宏科技/寒武纪/海光信息；【AI端侧】蓝思科技/领益智造/鹏鼎控股/东山精密/乐鑫科技/瑞芯微/恒玄科技/全志科技/兆易创新/晶晨股份等。 ➢风险因素：宏观经济下行风险；下游需求不及预期风险；中美贸易摩擦加剧风险。目录 DeepSeek算法创新众多，性能表现较好..........................................................................................5OpenAI掀起反攻号角，o3-mini和Deep Research相继发布..........................................................9AI未来尚有星辰大海有待探索，AGI商业化奇点临近................................................................13风险因素............................................................................................................................................15 表1：建议关注个股................................................................................................................................................15 图目录图1：Deepseek V3基本架构.................................................................................................................................6图2：DeepSeek-R1-Zero的“啊哈时刻”......................................................................................................7图3：deepseek性能对标OpenAI o1.................................................................................................................8图4：deepseek蒸馏小模型在部分测试上性能超越OpenAI o1-mini..................................................8图5：o3-mini具备更强的反重力推理能力......................................................................................................9图6：o3-mini生成了小球在四维空间弹射的代码........................................................................................9图7：o3-mini理解物理世界的demo................................................................................................................9图8：o3-mini仅用8秒时间就可克隆一个应用.........................................................................................10图9：o3-mini生成的贪吃蛇游戏......................................................................................................................10图10：o3-mini生成的射击游戏........................................................................................................................10图11：o3-mini生成的漂浮城市........................................................................................................................10图12：o3-mini定价对比......................................................................................................................................11图13：deep research在人类终极考试中的成绩.........................................................................................12图14：deep research专家级别任务通过率..................................................................................................12图15：谷歌提出的AGI等级...............................................................................................................................13图16：FIGURE看到的长期机会.........................................................................................................................14 DeepSeek树立里程碑，挖掘算法创新的价值潜力 Deepseek V3仍是基于Transformer架构的模型，是一个强大的专家混合（MoE）语言模型，总共有671B个参数，每个令牌激活了37B参数。实现高效的推理和具有成本效益的训练，DeepSeek-V3采用了多头潜在注意力（MLA）和DeepSeekMoE架构，此外，DeepSeek-V3开创了一种用于负载均衡的辅助无损策略，并设定了多标记预测训练目标以获得更强的性能。尽管性能出色，但DeepSeek-V3只需要2.788M H800 GPU小时即可进行完整训练。总结看，DeepSeek-V3主要贡献包括：架构层面：创新的负载均衡策略和训练目标。 ⚫除了DeepSeek-V2的高效架构之外，DeepSeekV3还开创了一种用于负载均衡的辅助无损策略，该策略可以最大限度地减少因鼓励负载而引起的性能下降。⚫团队研究了多标记预测（MTP）目标，并证明对模型性能有益，还可用于推理加速的推测解码。预训练：迈向终极训练效率。 ⚫Deepseek设计了FP8混合训练精度训练框架，并且首次在超大规模模型上验证了FP8训练的可行性和有效性。⚫通过算法、框架和硬件的协同设计，DeepSeek克服了跨节点MoE训练中的

点击免费查看完整报告

你可能感兴趣

电子行业专题研究（普通）：Deepseek R1是AGI的里程碑，中长期利好算力硬件

你可能感兴趣

电子行业周报：微信接入DeepSeek R1，关注“算力短缺”带来的产业链机遇

电子行业研究：Deepseek发布V3.1模型，继续重点看好AI算力硬件

通信行业周报：DeepSeek R1模型升级，GB300季度末有望出货，继续看好AIDC算力产业链

计算机行业专题研究：AGI里程碑时刻，Sora打造全球新标杆

电子行业先进科技主题周报-周观点：DeepSeek官方发布R1模型推荐设置，多款产品接入DeepSeek R1