行业研究/行业点评 2025年02月19日 适合投资人的DeepSeek分析报告 行业及产业电子/ ——人工智能专题报告(1) 本期投资提示: 强于大市 2025年1月20日,DeepSeek发布自研模型R1在全球科技行业引起的震动,被西方媒体称为“DeepSeekShock”。DeepSeek不仅在媒体圈迅速爆火,同样也成为了资本市场的宠儿,其概念指数仅仅诞生10日后板块成交金额就超过了全部A股成交额的20%。这一切现象究其原因,是因为DeepSeek通过技术微创新,以更低的硬件成本和更短的时间实现了可以与市场领先产品竞争的能力。更重要的是,DeepSeek打破了行业“限制中国企业对于最先进GPU获取,将能够阻止中国AI技术发展”的一贯认知。 本文有别于市场上大部分研究报告冗长的技术细节描述,我们针对投资人短时间内客观理解DeepSeek的需求,加入了不同于市场的思考和量化的分析比较。以下是报告的核心观点: 资料来源:爱建证券研究所、聚源数据 DeepSeek的技术创新在哪里?1)首创DeepSeekMoE架构,专门设计用于实现终极专家专业化。DeepSeekMoE通过降低激活参数比例,实现了训练效率3.6X的提升和训练吞吐量3.6X的提升。2)通过引入MLA机制,DeepSeek-V2实现了显著增强的性能,节省了42.5%的训练成本、减少了93.3%的KV缓存、并将最大生成吞吐量提升至5.76倍。 相关研究 DeepSeek-V3实际开发成本几何?公司官宣正式训练成本为580万美元,但是并没有披露隐性成本。DeepSeek-V3是建立在前期模型基础上开发的,前期研发投入约为2000-3000万美元。其他数据获取成本和硬件折旧成本未披露,实验试错成本约为500万美元,因此预计实际总成本超过4000万美元。实际成本虽然高达公开口径成本的7倍左右,但是仍然相对Llama3-405B降低了约69%;相对于GPT-4o降低了95%。 未来GPU算力需求会大幅下降吗?短期内云服务大厂资本开支持续处于上升通道,这是由于ScalingLaw导致行业对于算力军备竞赛的恐慌性投资仍然存在。但是ScalingLaw中,数据资源同样限制着模型性能的提升。根据EPOCHAI预测,到2028年人类生成的公共文本数据总有效库存量约为300Ttoken将被全部耗尽。换句话说,在现有模型框架和数据资源供给下,2028年之后单纯算力提升将难以继续推动模型性能的升级。 核心结论: 给予行业“强于大市”评级。随着DeepSeek的横空出世,低成本高性能的模型训练部署成为可能。我们预计接入DeepSeekAPI的细分领域推理服务商将会快速涌现,同时终端设备将会能够实现蒸馏小模型的本地部署能力,包括服务器,智能手机和智能驾驶系统都将会迎来新一轮的升级浪潮。我们看好以下细分板块在DeepSeek推动下的未来发展: 先进算力芯片制造产业链:算力芯片设计,先进制程晶圆代工,先进封测等等。专业咨询服务:包括AI+医疗,法律,金融,会计,教育,政务等咨询服务领域。2C智能终端:AI+智能手机,智驾汽车等终端产业链。2B本地部署设备:服务器OEM及产业链。 证券分析师 许亮S08205250100020755-83562506xuliang@ajzq.com 联系人 风险提示:大模型开发进度缓慢,模型升级不及预期。AI行业应用落地迟缓,商业模式难以实现良性循环。贸易摩擦加剧,先进芯片及半导体技术受限。 目录 1.DeepSeek从何而来.....................................................................4 1.1DeepSeek公司诞生...............................................................................................................................41.2DeepSeek里程碑事件...........................................................................................................................41.3DeepSeek的爆火...................................................................................................................................5 2.深入剖析DeepSeek....................................................................8 2.1DeepSeek为什么被称为shock?......................................................................................................82.2DeepSeek的技术创新在哪里?........................................................................................................112.3技术细节之外的信心提升...................................................................................................................12 3.市场对于DeepSeek最关心的问题.............................................15 3.1DeepSeek-V3的模型实际成本几何?.............................................................................................153.2GPU为代表的算力需求是否会大幅下降?......................................................................................16 4.DeepSeek对产业发展的影响.....................................................19 5.风险提示.....................................................................................20 图表目录 图1:DeepSeek里程碑事件............................................................................................4图2:DeepSeek-R1发布后话题爆火...............................................................................5图3:DeepSeek概念占A股成交额比例超过20%........................................................5图4:DeepSeek通用模型V3性能达到行业领先水平..................................................8图5:DeepSeek通用模型V3成本优势明显..................................................................9图6:DeepSeek推理模型R1性能达到行业领先水平..................................................9图7:DeepSeek-R1价格优势明显.................................................................................10图8:DeepSeekMOE架构可以用更少的训练参数实现更好的性能表现..................11图9:DeepSeek-V2通过MLA机制实现了性能优势和成本降低...............................12图10:ScalingLaw中算力与AI能力的关系................................................................13图11:DeepSeek带动中国资本市场信心提升............................................................14图12:美国主要互联网企业资本支出金额(亿美元).............................................16图13:人类生成的公共文本数据将在2028年耗尽...................................................17图14:OpenAI模型参数规模快速靠近公共文本数据上限........................................18 表1:DeepSeek-V3和DeepSeek-R1比较.......................................................................8表2:DeepSeek-R1蒸馏小模型本地化部署.................................................................10表3:DeepSeekMoE的效率创新...................................................................................11表4:国内外高端GPU芯片性能比较..........................................................................13表5:DeepSeek开发具备成本优势..............................................................................14表6:DeepSeek-V3正式训练阶段成本拆分.................................................................15表7:DeepSeek-V3隐性成本拆分.................................................................................15表8:DeepSeek-V3实际成本对比.................................................................................16表9:主要细分行业模型参数规模...............................................................................18 1.DeepS