行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

互联网行业：以DeepSeek视角，解读DeepSeek逆袭

文化传媒 2025-02-05 赵丹,杨子超浦银国际一抹朝阳

DeepSeek逆袭核心观点与影响

最大亮点：成本创新

DeepSeek在整体表现上与OpenAI等海外大模型第一梯队相当，但在成本控制方面具有显著优势。
训练成本：DeepSeek-V3训练成本仅为558万美元，为OpenAI的5%-10%。
推理成本：DeepSeek输入费用0.14美元/百万tokens（缓存未命中），输出费用0.28美元/百万tokens，远低于OpenAI。
商业化定价：DeepSeek每百万tokens价格0.48美元，仅为OpenAI的2%-5%。

成本创新实现策略

稀疏激活的MoE架构：仅激活任务相关参数，降低90%算力消耗。
本地化部署：支持消费级硬件（如RTX 4090），无需依赖昂贵的云服务。
规则奖励系统：替代昂贵的“AI监工”模型，减少额外训练开销。
开源生态：利用社区贡献降低研发成本，迭代速度提升3倍。

技术异同对比

相同点：均基于Transformer架构，强调推理能力，采用多阶段训练。
不同点：
- 训练方式：DeepSeek依赖强化学习（GRPO算法），OpenAI依赖监督微调（SFT）。
- 架构设计：DeepSeek采用MoE架构，OpenAI优化Transformer层结构和注意力机制。
- 推理与生成能力：DeepSeek在数学、代码生成领域表现优异，OpenAI在NLP和文本生成方面更突出。
- 成本与效率：DeepSeek成本更低，OpenAI依赖大规模资源。
- 应用场景：DeepSeek适合垂直领域，OpenAI适合通用任务。

对AI产业链的影响

云计算：
- 推理需求爆发（2026年推理算力占比超70%），硬件厂商转型至专用AI芯片。
- 边缘计算与混合云崛起，云服务商需优化推理集群架构。
大模型：
- 开源生态推动技术民主化，R1模型开源6天下载量达110万次。
- 垂直领域模型爆发，如金融、医疗领域应用。
应用层：
- 中小开发者与长尾市场激活，DeepSeekAPI定价低廉。
- 商业模式创新，传统云厂商转向“AI+行业解决方案”。

研究结论

DeepSeek推动AI产业链从“算力竞赛”转向“算法优化”。
未来AI产业更依赖算法密度与生态协同，而非资源垄断。
中国企业需抓住开源化、设备端化趋势，但需警惕技术跃进风险。

投资建议

DeepSeek打破美国垄断格局，或带动国产AI行业价值重估。
“成本创新”加速AI普惠，推动应用层爆发。
长期来看，DeepSeek将推动云服务需求上升。

投资风险

地缘政治风险，场景落地不及预期。

以DeepSeek视角，解读DeepSeek逆袭赵丹首席互联网分析师dan_zhao@spdbi.com(852) 2808 6436 春节期间，DeepSeek成为全球AI行业关注焦点，从“无名之辈”化身“绝世高手”。我们围绕三个核心话题，包括最大亮点、技术创新和潜在影响等，借助DeepSeek视角，让DeepSeek来解读DeepSeek，一起探讨这次“逆袭奇迹”。杨子超，CFA互联网分析师charles_yang@spdbi.com(852) 2808 6409 2025年2月5日 DeepSeek最大亮点是什么？“成本创新”。DeepSeek整体表现与OpenAI等海外大模型第一梯队处于同一水平，不相上下，而成本控制方面具有显著优势，包括在训练、推理和商业化定价方面。整体成本仅为OpenAI的5%-10%，商业化定价仅为OpenAI的2%-5%。 DeepSeek如何实现“成本创新”？DeepSeek优化策略主要包括：1）稀疏激活的混合专家（MoE）架构，仅激活任务相关参数，降低90%算力消耗；2）本地化部署：支持消费级硬件，无需依赖昂贵的云服务等；3）规则奖励系统：替代昂贵的“AI监工”模型，减少额外训练；4）开源生态：利用社区贡献降低研发成本，迭代速度提升3倍。 “成本创新”对AI产业链有何影响？DeepSeek的低成本优势正在推动AI产业链从“算力竞赛”转向“算法优化”，其影响包括：1）云计算：推理需求爆发倒逼硬件与架构创新，混合云与边缘计算成主流；2）大模型：开源生态崛起加速技术民主化，垂直领域模型与Agent化应用成为新战场；3）应用层：普惠化释放长尾市场潜力，端侧硬件与行业解决方案重塑商业逻辑。未来，AI产业将更依赖算法密度与生态协同，而非单纯资源垄断。投资建议：1）DeepSeek打破了美国在大模型层面的垄断格局，或带动市场重新审视国产AI行业，带来价值重估；2）DeepSeek的“成本创新”将使得大模型价格进一步平民化，AI普惠将加速应用层的爆发；3）虽然DeepSeek降低了单次算力成本，但随着未来大规模应用的指数级增长，长期来看将有助于推动云服务需求的上升。投资风险：地缘政治风险，场景落地不及预期。附录：DeepSeek问答文字版 2025年2月4日，通过DeepSeek网页版提问。 Question1：DeepSeek和OpenAI相比，成本方面有何优势？ DeepSeek在成本控制方面相较于OpenAI具有显著优势，具体体现在训练成本、推理成本和商业化定价等多个维度。以下是详细对比分析： 1.训练成本对比 •DeepSeek： oDeepSeek-V3的训练成本仅为558万美元，采用高效的混合专家（MoE）架构和稀疏激活策略，显著降低了算力消耗。 o其训练时间仅需55天，使用2,048块NVIDIA H800 GPU，计算资源消耗远低于行业平均水平。 •OpenAI： oOpenAI的GPT-4训练成本高达10亿美元，依赖大规模全参数激活和复杂的监督微调（SFT）流程。 o训练时间更长，且需要数百万GPU小时的支持，导致整体成本居高不下。成本节省：DeepSeek的训练成本仅为OpenAI的5%-10%，实现了显著的效率提升。 2.推理成本对比 •DeepSeek：o输入费用：0.14美元/百万tokens（缓存未命中），缓存命中时低至0.014美元/百万tokens。o输出费用：0.28美元/百万tokens，显著低于OpenAI和Claude系列模型。o采用稀疏激活策略，每次任务仅激活部分参数，进一步降低了推理成本。 •OpenAI： oGPT-4o的输入费用为2.5美元/百万tokens（缓存未命中），输出费用高达10美元/百万tokens。 o全参数激活模式导致算力消耗巨大，推理成本居高不下。成本节省：DeepSeek的推理成本仅为OpenAI的1/10至1/20，性价比优势显著。 3.商业化定价对比 •DeepSeek： o提供开源模型和低成本API，每百万tokens的价格仅为0.48美元，远低于OpenAI的18美元。 o本地化部署支持消费级硬件（如RTX 4090），进一步降低企业使用门槛。 •OpenAI： oGPT-4的API定价较高，每百万tokens的价格为18美元，且依赖昂贵的云服务资源。 o企业级部署需要大规模GPU集群，硬件成本高昂。成本节省：DeepSeek的商业化定价仅为OpenAI的2%-5%，尤其适合预算敏感的中小企业和开发者。总结 DeepSeek在训练、推理和商业化定价方面的成本优势显著，整体成本仅为OpenAI的5%-10%。这种高效的成本控制不仅降低了企业使用门槛，还推动了AI技术的普惠化发展。 Question2：DeepSeek如何实现成本创新？底层技术与OpenAI 有何异同？ DeepSeek通过以下创新策略实现成本优势： 稀疏激活的MoE架构：仅激活任务相关参数，降低90%的算力开销。本地化部署：支持消费级硬件，无需依赖昂贵的云服务。规则奖励系统：替代昂贵的“AI监工”模型，减少额外训练开销。开源生态：利用社区贡献降低研发成本，迭代速度提升3倍。从技术层面来看，DeepSeek和OpenAI在底层技术上既有相似之处，也存在显著差异。以下是两者的主要异同点分析：一、相同点 1.基础架构：Transformer架构o两者都基于Transformer架构，利用自注意力机制处理输入序列，能够高效处理长文本和复杂语言任务。oTransformer架构的并行计算能力使得模型在处理大规模数据时表现出色。 2.推理能力o两者都强调推理能力的提升，通过不同的方式实现复杂问题的逐步分解和逻辑推理。o例如，DeepSeek和OpenAI都采用了多步骤推理技术（如思维链推理，Chain-of-Thought）来增强模型的逻辑处理能力。 3.多阶段训练o两者都采用了多阶段训练流程，通过不同阶段的优化提升模型的性能。例如，DeepSeek的冷启动和多阶段强化学习，以及OpenAI的监督微调（SFT）和思维链推理。二、不同点 1.训练方式 oDeepSeek：主要依赖强化学习（RL），尤其是其创新的Group RelativePolicy Optimization（GRPO）算法。这种训练方式不依赖大量监督微调数据，而是通过组内奖励对比优化策略，实现推理能力的自主进化。oOpenAI：高度依赖监督微调（SFT），通过大量人工标注的数据提升模型在特定任务上的表现。这种方式虽然能提高任务准确性，但对数据质量和数量的依赖较大。 2.架构设计 oDeepSeek：采用模块化框架和Mixture-of-Experts（MoE）架构。MoE将模型划分为多个专家子模型，每个子模型负责处理不同的输入任务，从而提高模型的泛化能力和鲁棒性。 oOpenAI：基于Transformer架构，通过优化层结构和注意力机制提升模型性能，更注重通用性和多功能性。 3.推理与生成能力 oDeepSeek：在需要深度推理的领域（如数学、代码生成）表现出色，适合复杂任务的处理。例如，DeepSeek在数学推理任务（如AIME 2024）中表现优于OpenAI。 oOpenAI：在自然语言处理（NLP）和文本生成方面表现更为突出，适合广泛的应用场景，如文本摘要、创意写作等。 4.成本与效率oDeepSeek：通过算法优化和模块化设计，显著降低了训练和推理成本。例如，DeepSeek的训练成本仅为558万美元，远低于OpenAI的投入。oOpenAI：虽然性能强大，但其训练和推理成本较高，主要依赖于大规模计算资源和高质量标注数据。 5.应用场景oDeepSeek：更适合需要深度推理和专业领域知识的场景，如医疗数据分析、金融模式检测等。oOpenAI：在通用任务（如文本生成、客户服务）中表现更为出色，适合广泛的企业和个人用户。 Question3：DeepSeek低成本优势对全球AI产业链有何影响？比如云计算、大模型和应用层等？ DeepSeek的低成本优势正在深刻重塑全球AI产业链，其影响从底层算力到应用生态呈现出多维度的连锁反应。以下从云计算、大模型和应用层三个维度展开分析：一、云计算：需求结构变革与降本压力传导 1.算力需求从训练向推理倾斜 DeepSeek的高效模型架构（如MoE动态激活、FP8混合精度）显著降低训练成本（557.6万美元，仅为GPT-4的5%），导致训练端算力需求增速放缓。而推理端因模型普及化需求激增，预计2026年推理算力占GenAI总需求比例将突破70%。 o硬件厂商转型：传统GPU厂商（如英伟达）面临算力过剩风险，加速向专用AI芯片（如ASIC）及液冷技术研发转型。 o云服务商策略调整：阿里云、AWS等需优化推理集群架构（如铜连接方案、CPO光通信技术），并探索“按需付费”定价模式以应对成本压力。 2.边缘计算与混合云崛起 DeepSeek支持消费级硬件（如RTX 4090）和端侧部署，推动算力从集中式云向边缘侧迁移。例如，硅基流动已基于华为昇腾算力支持DeepSeekAPI，海光DCU适配其模型，预示混合云架构将成为主流。二、大模型：开源生态与技术路径重构 1.打破“算力垄断”，推动技术民主化 DeepSeek通过算法优化（如动态注意力、多令牌预测）和工程创新（如MoE负载均衡），以1/20的训练成本实现与GPT-4o相当的推理性能，验证了“轻量级颠覆”路径的可行性。 o开源生态繁荣：R1模型开源后6天下载量达110万次，吸引Meta等巨头加码开源社区，形成“技术共享-生态繁荣-反哺创新”的正循环。 oScaling Law转向：模型开发重心从预训练转向强化学习与推理优化，催生新ScalingLaw（如GRPO算法），加速复杂任务（数学、代码）的Agent化落地。 2.垂直领域模型爆发低成本模型降低企业私有化部署门槛，推动LLM向金融、医疗、教育等垂直领域渗透。例如，某券商使用DeepSeek生成合规研报，效率提升60%。三、应用层：普惠化与场景革命 1.中小开发者与长尾市场激活 DeepSeek的API定价仅为OpenAI的1/10（输入0.5元/百万tokens），且支持设备端运行，使中小开发者能够低成本开发AI应用。例如，教育机构通过AI教师方案覆盖三四线城市，潜在市场规模超千亿。 2.商业模式创新传统云计算厂商（如腾讯云）转向“AI+行业解决方案”高毛利模式，衍生数据服务（如金融舆情API）成为新增长点。总结：价值分配重构与长期趋势 DeepSeek的低成本优势正在推动AI产业链从“算力竞赛”转向“算法优化”，其核心影响包括： •云计算：推理需求爆发倒逼硬件与架构创新，混合云与边缘计算成主流。 •大模型：开源生态崛起加速技术民主化，垂直领域模型与Agent化应用成为新战场。 •应用层：普惠化释放长尾市场潜力，端侧硬件与行业解决方案重塑商业逻辑。未来，AI产业将更依赖算法密度与生态协同，而非单纯资源垄断。中国企业若能抓住开源化、设备端化趋势，有望在AI 2.0时代占据先机，但需警惕技术跃进伴随的伦理与战略风险。免责声明本报告之收取者透过接受本报告（包括任何有关的附件），表示及保证其根据下述的条件下有权获得本报告，且同意受此中包含的限制条件所约束。任何没有遵循这些限制的情况可能构成法律之违反。本报告是由从事证券及期货条例(香港法例第571章)中第一类(证券交易)及第四类(就证券提供意见)受规管活动之持牌法团–浦银国际证券有限公司（统称“浦银国际证券”）利用集团信息及其他公开信息编制而成。所有资料均搜集自被认为是可靠的来源，但并不保证数据之准确性、可信性及完整性，亦不会因资料引致的任何损失承担任何责任。报告中的资料来源除非另有说明，

点击免费查看完整报告

互联网行业：以DeepSeek视角，解读DeepSeek逆袭

DeepSeek逆袭核心观点与影响

最大亮点：成本创新

成本创新实现策略

技术异同对比

对AI产业链的影响

研究结论

投资建议

投资风险

你可能感兴趣

互联网传媒行业2017年第6周周报：星爷江郎才尽，《功夫瑜伽》票房逆袭

批零贸易行业：改革+互联网重塑助零售逆袭

全球视角下主动权益逆袭案例分析：份额之争：先发优势与逆袭经验

“互联网+”商业模式再认识系列研究之四：能源触网，看分布式发电完美逆袭

广电逆袭互联网，打造电视互联网平台

纺服双周报数据谈2019第1期：美妆18年阿里数据解读，电商是本土品牌的逆袭利器

互联网与传媒行业动态跟踪：立足传统文化，原创综艺逆袭之路-源远千年犹未老，阳春白雪进万家

互联网零售行业2016年周报第24期6/26~7/03：以产业的视角，寻求有机会的标的

传媒互联网行业专题研究：以Soul的视角，看开放式社交的机遇与挑战

传媒行业周报：《流浪地球》口碑逆袭，春节档票价大幅提升