您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [中原证券]:计算机行业深度分析:三大要素齐发力,AI应用步入全面加速期 - 发现报告

计算机行业深度分析:三大要素齐发力,AI应用步入全面加速期

信息技术 2025-03-07 唐月 中原证券 张东旭
报告封面

分析师:唐月登记编码:S0730512030001tangyue@ccnew.com 021-50586737 ——计算机行业深度分析 证券研究报告-行业深度分析 强于大市(上调) 发布日期:2025年03月07日 投资要点: 我们在2024年11月30日外发的《计算机行业年度策略:国产化形势持续向好,重点关注推理、AI应用和液冷需求》中提出了“o1的问世”“让Agent也步入了发展的快车道,AI在应用软件层的发展潜力亟待释放”。DeepSeek-R1发布后,大模型成本显著下降,开源阵营在性能上实现超越。至此,AI应用集齐全面落地的三大关键要素,这一阶段具有里程碑式意义。 资料来源:中原证券,聚源 相关报告 要素一:逻辑推理能力提升。OpenAI的o1开启了大模型逻辑推理能力的提升路径,DeepSeek首次公开验证了强化学习对于大模型推理能力提升的有效性。 《计算机行业月报:DeepSeek-R1带来AI技术突破,持续关注GPT-5的推出进程》2025-02-13《计算机行业深度分析:美国制裁密集出台,全面围堵对我国的AI算力供应能力》2025-01-24《计算机行业月报:AI模型成果密集发布,制裁或将全面升级》2025-01-10 要素二:推理成本下降。DeepSeek作为大模型领域的“拼多多”,开启了大模型的低成本训练路径。DeepSeek通过MLA和DeepSeek MoE架构减少了模型架构方面的算力消耗,同时在训练架构上展现出了强大的软硬协同优化能力,实现了FP8混合精度训练框架、DualPipe算法、跨节点All-to-All通信内核等一系列创新。在API调用成本仅为o11/30的基础上,DeepSeek推理服务理论毛利率水平高达到84.5%。在带宽和显存落后的H800上,较英伟达H200实现了151%的性能超越 联系人:李智电话:0371-65585629地址:郑州郑东新区商务外环路10号18楼邮编:上海浦东新区世纪大道1788号T1座22楼 要素三:开源阵营的性能超越。DeepSeek的R1和V3模型不光追平了最先进的闭源模型的能力,同时在成本上形成了明显的优势,代表了更先进的模型发展方向,让开源大模型在先进性上首次超越了闭源大模型。DeepSeek的开源条款更加开放,同时将核心代码悉数开源,极大地促进了应用的落地和技术的推广。开源生态的发展,弥补了中国企业上云(特别是公有云)比例偏低的劣势,国内B端大模型应用的也可以通过私有化部署加速展开。 随着AI应用进入爆发期,企业级部署需求呼之欲出,医疗、政务、Manus等应用落地都成为了市场关注的焦点,腾讯、阿里、字节、小米等科技大厂也在加速AI投入,实现向下个时代的布局。虽然大模型推理成本在下降,但是由此带来的应用爆发有望带来更多的应用需求,成为下一阶段拉动算力增长的主要驱动力。考虑到中国有互联网应用的领先优势、在数据端的长期积累和庞大的工程师团队,在底层模型能力实现突破以后,我们在AI应用的发展有望实现全球领先。 风险提示:国际局势的不确定性;下游企业削减开支。 内容目录 1.要素一:逻辑推理能力提升..........................................................................4 1.1. o1开启逻辑推理能力提升的新路径...............................................................................41.2. DeepSeek首次公开验证了强化学习对于大模型推理能力提升的有效性......................5 2.要素二:推理成本下降.................................................................................7 2.1. DeepSeek开启低成本路线...........................................................................................72.2. DeepSeek算力节省的关键点........................................................................................82.3.两大模型训练路径.......................................................................................................102.4. DeepSeek运营成本及相关数据测算...........................................................................12 3.要素三:开源阵营的性能超越.....................................................................15 3.1.开源大模型阵营首次在先进性上超越了闭源阵营........................................................153.2. DeepSeek开源条款更加开放,有利推动模型的推广和应用.......................................173.3. DeepSeek将核心代码悉数开源,极大地促进了AI技术的发展.................................20 6.风险提示.....................................................................................................24 图表目录 图1:人脑中负责语言和逻辑推理的神经网络.....................................................................4图2:推理模型与语言模型在数学、科学、编码方面的能力对比........................................5图3:DeepSeek-R1的训练流程............................................................................................6图4:DeepSeek-R1-Zero在训练中AIME精度提升情况.......................................................7图5:DeepSeek-R1-Zero在训练中的平均响应时长.............................................................7图6:DeepSeek-R1与o1在调用成本差距(美元/百万token).......................................8图7:DeepSeek-V2中MLA对于降低KV Cache和训练成本的作用.......................................8图8:DeepSeek-V3整体架构...............................................................................................9图9:FP8混合精度训练框架示意图.................................................................................10图10:DualPipe算法示意图.............................................................................................10图11:DeepSeek-V3与Grok-3训练小时数对比(万GPU小时)..................................11图12:头部大模型的Chatbot Arena成绩........................................................................11图13:DeepSeek在不同时段用于推理服务的节点数.........................................................13图14:2024年OpenAI支出预测.....................................................................................14图15:DeepSeek成本与理论收入测算...............................................................................14图16:常见开源协议对比..................................................................................................18图17:2024年全球智能手机出货量市场份额...................................................................19图18:英伟达DeepSeek-R1推理输出能力.....................................................................22图19:各地算力规划中关于总算力的相关目标(EFLOPS)...........................................23图20:各地算力规划中关于智能算力的相关目标(EFLOPS)........................................23图21:各地算力规划中关于智能比例的相关目标.............................................................24 表1:OpenAI大模型产品...................................................................................................5表2:硅基流动上DeepSeek主要模型情况及调用价格......................................................6表3:DeepSeek的主要模型发布情况................................................................................7表4:OpenAI大模型产品竞品推出情况............................................................................12表5:DeepSeek运营数据及测算.....................................................................................12 表6:主流开源大模型..................