AI智能总结
Deepseek影响深远,中国AI市场有望重构 报告摘要 DeepSeek成为全球增速最快AI应用。2025年1月20日,DeepSeek发布开源推理模型DeepSeek-R1,在网页端、APP和API全面上线。根据AI产品榜数据,DeepSeek上线20天全球日活DAU突破2000万,成为全球增速最快的AI应用。DeepSeek在1月份累计获得1.25亿用户(含网站(Web)、应用(App)累加不去重)。其中80%以上用户来自最后一周,即在7天内完成了1亿用户的增长。 DeepSeek以算法创新实现高性能低成本的推理模型。DeepSeek V3通过MLA算法、流水线策略、MoE调度等方式,使训练成本低至560万美元。DeepSeek R1摒弃了传统的监督微调(SFT)路径,转而通过强化学习(RL)来优化推理路径,验证了通过纯强化学习实现模型推理能力的可行性。DeepSeek R1性能比肩OpenAI o1,但API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,远低于OpenAI o1。 ◼推荐公司及评级 海光信息买入科大讯飞买入用友网络买入道通科技买入虹软科技买入智微智能买入熵基科技买入 DeepSeek有望加速AI应用落地。目前已有多家上市公司宣布接入DeepSeek。例如,用友BIP全面上线以DeepSeek-V3和DeepSeek-R1作为基座大模型的智能服务,企业客户可以通过用友BIP3 R6智能平台的公有云、专属云模式使用相关服务。道通科技已完成DeepSeek的全面接入和本地化部署,并应用DeepSeek训练流程,加速推进道通以“巡检垂域大模型”为核心的“空地一体解决方案”在能源、交通等领域的广泛推广。金蝶国际宣布成功将DeepSeek全面融入金蝶云全线SaaS应用及金蝶云苍穹平台,为客户提供更高效、更安全、更低成本的智能解决方案。我们认为DeepSeek作为高性能低价的开源推理模型极大的降低了AI的使用门槛,有望促进AI应用生态的繁荣发展。 相关研究报告 <<AI应用 和自 主可控 有望 持续 演绎>>--2025-01-21<<智慧教育业务高速增长AIGC业务逐步落地>>--2024-12-10<<业绩略超预期,各项业务快速增长>>--2024-11-18 国产AI芯片积极适配DeepSeek。2025年2月1日,华为云联合硅基流动首发并上线基于昇腾云服务的DeepSeek R1/V3推理服务。华为云表示,其自研推理加速引擎性能卓越,可与全球顶级GPU部署效果相抗衡。2月4日,DeepSeek R1、V3、V2、Janus-Pro模型正式上线昇腾社区。此后,国产AI芯片纷纷宣布支持DeepSeek系列模型。根据智东西,目前10家国产AI芯片企业(华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯)均已宣布适配或上架DeepSeek模型服务。 证券分析师:曹佩电话:E-MAIL:caopeisz@tpyzq.com分析师登记编号:S1190520080001 证券分析师:王景宜电话:E-MAIL:wangjy@tpyzq.com分析师登记编号:S1190523090002 投资建议:Deepseek对中国AI产业影响深远,我们看好2025年AI应用以及国产算力的发展,我们建议重点关注海光信息、科大讯飞、用友网络、道通科技、虹软科技、智微智能、熵基科技等。 风险提示:AI技术发展不及预期,行业竞争加剧。 目录 一、DeepSeek:对标OpenAI o1,开源+低成本推动AI普惠...............................4(一) DeepSeek使用量快速增长.........................................................4(二) DeepSeek技术创新分析...........................................................5(三) DeepSeek推动模型平价,AI应用有望加速落地.......................................6(四) DeepSeek有望促进国产算力生态发展...............................................8二、投资建议.....................................................................11三、风险提示.....................................................................11 图表目录 图表1:DeepSeek成为全球增速最快AI应用..............................................4图表2:Deepseek-R1性能对齐OpenAI-o1正式版..........................................5图表3:DeepSeek V3训练成本测算.....................................................5图表4:DeepSeek R1训练过程.........................................................6图表5:DeepSeek-R1 API定价大幅低于同类模型..........................................7图表6:DeepSeek-R1 API定价大幅低于同类模型..........................错误!未定义书签。图表7:与DeepSeek合作的计算机上市公司(截至20250209)..............................9 一、DeepSeek:对标OpenAI o1,开源+低成本推动AI普惠(一)DeepSeek使用量快速增长 DeepSeek成为全球增速最快AI应用。2025年1月20日,DeepSeek发布开源推理模型DeepSeek-R1,在网页端、APP和API全面上线。根据AI产品榜数据,DeepSeek上线20天全球日活DAU突破2000万,成为全球增速最快的AI应用。DeepSeek在1月份累计获得1.25亿用户(含网站(Web)、应用(App)累加不去重)。其中80%以上用户来自最后一周,即在7天内完成了1亿用户的增长。 资料来源:AI产品榜微信公众号,太平洋证券整理 DeepSeek性能比肩OpenAI o1。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。 (二)DeepSeek技术创新分析 1、DeepSeek V3:算法创新和工程优化实现大幅降本 DeepSeekV3训练成本仅为557.6万美元。根据DeepSeek V3技术报告,其完整训练过程共计278.8万个GPU小时,按照每个H800每小时2美元的成本计算,总成本仅为557.6万美元。尽管上述成本仅包括DeepSeek-V3的正式训练,不包括在架构、算法或数据方面进行的前期研究和消融实验的成本,但仍然大幅低于业界平均水平。 低成本来源于DeepSeek长久以来的算法创新。DeepSeek-V3是一个MoE(Mixture-of-Experts)语言模型,总参数量671B,每个Token激活的参数量为37B。为实现高效训练与推理,DeepSeek-V3延续了DeepSeek-V2的多头潜注意力(MLA,对传统多头注意力机制的改进)架构及DeepSeekMoE架构(对传统MoE架构的改进)。此外,DeepSeek-V3在全球首创双向流水线策略,并且在全球主流大模型中率先采用FP8低精度数据进行大规模训练,并首创了无 需辅助损失的负载均衡策略,均对模型降本起到了重要作用。 2、DeepSeek R1:通过强化学习得出的强推理模型 自OpenAI发布o1系列模型以来,AI大模型进入推理模型时代。然而OpenAI并未公布o1实现的技术细节,对于推理过程中的思维过程也并未完全展示。而DeepSeek R1的出现复现了OpenAI o1的深度推理能力,通过开源并发布详细技术报告,为AI技术普惠做出了重要贡献。 DeepSeekR1的训练证明了直接强化学习训练方法的有效性。传统训练AI推理能力时,通常会以大量具有人类思维过程的数据,让模型学会思考。而DeepSeek-R1-Zero通过大规模强化学习训练,不依赖于监督微调(SFT)作为初步步骤,仅依靠奖惩训练让模型自行涌现出推理能力。DeepSeek-R1-Zero在训练中产生了自我验证、反思以及生成长思维链等能力,另外它也产生了一些“aha moment”(顿悟时刻),模型训练过程中能够自我发现并尝试修复一些以前的推理错误(Reflection)。 (三)DeepSeek推动模型平价,AI应用有望加速落地 DeepSeek-R1API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。作为对比,OpenAI o1模型API定价为每百万输入tokens为7.5美金(缓存命中)/15美金(缓存未命中),每百万输出tokens为60美金。 DeepSeek引发鲶鱼效应,全球大模型竞争激烈。1月30日,阿里云发布百炼qwen-max系列模型调整通知,qwen-max、qwen-max-2025-01-25、qwen-max-latest三款模型输入输出价格调整,qwen-maxbatch和cache同步降价。2月1日,OpenAI发布o3-mini,这是OpenAI首个开放给免费用户的推理模型。o3-mini的定价是1.10美元/百万输入token,4.40美元/每百万输出token。这个价格比OpenAI o1-mini低63%,比完全体o1低93%,但仍然大幅高于DeepSeek R1。 (四)DeepSeek有望促进国产算力生态发展 DeepSeek暂停API充值凸显推理算力紧张。2月6日,DeepSeek官方称:“当前服务器资源紧张,为避免对您造成业务影响,我们已暂停API服务充值。存量充值金额可继续调用,敬请谅解!”。 推理算力有望重现“杰文斯悖论”。微软CEO纳德拉在社交媒体上表示:“杰文斯悖论再次出现!随着人工智能变得更高效和更容易获取,我们将看到它的使用激增,变成难以满足需求的商品。”杰文斯悖论(Jevons paradox)是一个经济学概念,指的是技术进步提高了使用资源的效率,但因为成本下降导致需求增加,结果导致资源消耗的速度上升,而非减少。我们认为,以DeepSeek为代表的技术创新大幅降低了训练与推理门槛,随着推理成本的不断下降,有望加速AI应用渗透,带来推理算力需求的持续增长。 目前Deepseek的合作公司众多,对行业影响重大。1)算力层面:国产AI芯片积极适配DeepSeek,主流云厂商均已上线DeepSeek服务。2025年2月1日,华为云联合硅基流动首发并上线基于昇腾云服务的DeepSeek R1/V3推理服务。华为云表示,其自研推理加速引擎性能卓越,可与全球顶级GPU部署效果相抗衡。2月4日,DeepSeek R1、V3、V2、Janus-Pro模型正式上线昇腾社区。此后,国产AI芯片纷纷宣布支持DeepSeek系列模型。根据智东西,目前10家国产AI芯片企业(华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯)均已宣布适配或上架DeepSeek模型服务。云厂商方面,根据智东