您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[信达证券]:电子行业专题研究(普通):Deepseek R1是AGI的里程碑,中长期利好算力硬件 - 发现报告

电子行业专题研究(普通):Deepseek R1是AGI的里程碑,中长期利好算力硬件

电子设备2025-02-04莫文宇信达证券王***
AI智能总结
查看更多
电子行业专题研究(普通):Deepseek R1是AGI的里程碑,中长期利好算力硬件

证券研究报告 行业研究 2025年2月4日 本期内容提要: ➢OpenAI掀起反攻号角,o3-mini和Deep Research相继发布。为了应对DeepSeek的挑战,OpenAI发布了O3-mini,理解物理世界能力、编程能力大幅提升。o3-mini在物理模拟高难度挑战中展现出惊人的实力,在模拟小球的转动时,o3-mini具备更强的物理推理能力,而DeepSeek R1则出现了反重力现象。此外,o3-mini能生成四维空间内小球的弹射程序,展现出很高的潜力。此外,OpanAI还发布了DeepResearch,这是OpenAI新发布代理——仅需一个提示,ChatGPT将查找、分析和综合数百个在线资源,以创建研究分析师级别的综合报告。它由即将推出的OpenAI o3模型版本提供支持,该版本针对Web浏览和数据分析进行了优化,它利用推理来搜索、解释和分析互联网上的大量文本、图像和PDF,并根据遇到的信息根据需要进行调整。 ➢AI未来尚有星辰大海有待探索,AGI商业化奇点临近。谷歌DeepMind团队曾将AI划分为6大发展阶段,从狭义的层面看,在专业领域已经有AI模型能达到超人级别。如AlphaFold、AlphaZero、StockFish等AI模型可以在特定的领域完全超越人类,但是从通用人工智能的层面看,AI的发展还处于较低水平,如ChatGPT仅可以划分为Level 1-Emerging级别。FIGURE是人形机器人领域的领导者之一,在其视角中,我们也能窥探AI的历史机遇。在如今全球GDP中,50%的劳动力均为人类劳动,大约42T美金空间,仅此一项,AI就有广阔的前景。 ➢投资建议:算法创新和算力投入相辅相成,建议关注AI产业链标的。AI领域的发展速度超过传统制造业,2023年来,Scaling Laws开始发力,全球领域内开启了算力资源的“军备竞赛”。而在地缘政治等因素的激励下,算法层面的追赶终于由算力相对匮乏的的中国团队唱响号角。我们认为,在通向AGI的道路上,算法创新和算力资源都是不可或缺的。早在2024年,我们就明确了推理市场要想实现繁荣必须降低推理成本的结论。如今,豆包、DeepSeek研究团队的相关工作成功 信达证券股份有限公司CINDA SECURITIES CO.,LTD北京市西城区宣武门西大街甲127号金隅大厦B座邮编:100031 地大幅度降低了推理成本,推进了AI的产业化。DeepSeek的成功,是开源模型相对闭源模型的一次飞跃。诚然,在十分有限的时间区间内,北美的科技大厂或把有限的精力放在算法层面,以充分挖掘自身算力资源的潜力。但是,这并不意味着对算力的投入将会停止。相反,AI的产业化有望在中长期加速算力的投入,避免了以往的AI热潮最终因无法落地而走向失败的困局。从推理市场看:推理有望快速放量,文生文、文生视频、图生视频的各类功能或快速迭代,并使得AI真正的理解物理世界,自动驾驶、人形机器人、AI在各行各业掀起产业革命的奇点临近。从训练市场看:一方面,训练模型的前沿探索仍需大量算力投入,且推理市场的放量,有望衍生新的模型探索方向。另一方面,如世界模型等方向的研究进展有望加速。但是,我们也看到大模型厂商的淘汰也将加速,无法超越开源模型的闭源大模型厂商或快速出清。扎克伯格曾在Meta法说会上表示,“随着时间的推移,就像每个企业都有一个网站、一个社交形象和一个电子邮件地址一样,在未来,每个企业也将拥有一个客户可以与之交互的AI代理。我们的目标是让每个小企业,最终每个企业,都可以轻松地将其所有内容和目录提取到一个AI代理中,从而推动销售并节省资金。”这一时点正在逐步临近,从历史看,当计算机从实验室走向千家万户,并没有导致相关的企业没落,而是孕育了许多伟大的企业。目前看,AI也有望经历这一过程,建议关注产业链相关标的。 ➢相关个股:【AI云侧】工业富联/沪电股份/生益科技/深南电路/胜宏科技/寒武纪/海光信息;【AI端侧】蓝思科技/领益智造/鹏鼎控股/东山精密/乐鑫科技/瑞芯微/恒玄科技/全志科技/兆易创新/晶晨股份等。 ➢风险因素:宏观经济下行风险;下游需求不及预期风险;中美贸易摩擦加剧风险。 目录 DeepSeek算法创新众多,性能表现较好..........................................................................................5OpenAI掀起反攻号角,o3-mini和Deep Research相继发布..........................................................9AI未来尚有星辰大海有待探索,AGI商业化奇点临近................................................................13风险因素............................................................................................................................................15 表1:建议关注个股................................................................................................................................................15 图目录 图1:Deepseek V3基本架构.................................................................................................................................6图2:DeepSeek-R1-Zero的“啊哈时刻”......................................................................................................7图3:deepseek性能对标OpenAI o1.................................................................................................................8图4:deepseek蒸馏小模型在部分测试上性能超越OpenAI o1-mini..................................................8图5:o3-mini具备更强的反重力推理能力......................................................................................................9图6:o3-mini生成了小球在四维空间弹射的代码........................................................................................9图7:o3-mini理解物理世界的demo................................................................................................................9图8:o3-mini仅用8秒时间就可克隆一个应用.........................................................................................10图9:o3-mini生成的贪吃蛇游戏......................................................................................................................10图10:o3-mini生成的射击游戏........................................................................................................................10图11:o3-mini生成的漂浮城市........................................................................................................................10图12:o3-mini定价对比......................................................................................................................................11图13:deep research在人类终极考试中的成绩.........................................................................................12图14:deep research专家级别任务通过率..................................................................................................12图15:谷歌提出的AGI等级...............................................................................................................................13图16:FIGURE看到的长期机会.........................................................................................................................14 DeepSeek树立里程碑,挖掘算法创新的价值潜力 Deepseek V3仍是基于Transformer架构的模型,是一个强大的专家混合(MoE)语言模型,总共有671B个参数,每个令牌激活了37B参数。实现高效的推理和具有成本效益的训练,DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构,此外,DeepSeek-V3开创了一种用于负载均衡的辅助无损策略,并设定了多标记预测训练目标以获得更强的性能。尽管性能出色,但DeepSeek-V3只需要2.788M H800 GPU小时即可进行完整训练。总结看,DeepSeek-V3主要贡献包括: 架构层面:创新的负载均衡策略和训练目标。 ⚫除了DeepSeek-V2的高效架构之外,DeepSeekV3还开创了一种用于负载均衡的辅助无损策略,该策略可以最大限度地减少因鼓励负载而引起的性能下降。⚫团队研究了多标记预测(MTP)目标,并证明对模型性能有益,还可用于推理加速的推测解码。 预训练:迈向终极训练效率。 ⚫Deepseek设计了FP8混合训练精度训练框架,并且首次在超大规模模型上验证了FP8训练的可行性和有效性。⚫通过算法、框架和硬件的协同设计,DeepSeek克服了跨节点MoE训练中的