以DeepSeek视角,解读DeepSeek逆袭 赵丹首席互联网分析师dan_zhao@spdbi.com(852) 2808 6436 春节期间,DeepSeek成为全球AI行业关注焦点,从“无名之辈”化身“绝世高手”。我们围绕三个核心话题,包括最大亮点、技术创新和潜在影响等,借助DeepSeek视角,让DeepSeek来解读DeepSeek,一起探讨这次“逆袭奇迹”。 杨子超,CFA互联网分析师charles_yang@spdbi.com(852) 2808 6409 2025年2月5日 DeepSeek最大亮点是什么?“成本创新”。DeepSeek整体表现与OpenAI等海外大模型第一梯队处于同一水平,不相上下,而成本控制方面具有显著优势,包括在训练、推理和商业化定价方面。整体成本仅为OpenAI的5%-10%,商业化定价仅为OpenAI的2%-5%。 DeepSeek如何实现“成本创新”?DeepSeek优化策略主要包括:1)稀疏激活的混合专家(MoE)架构,仅激活任务相关参数,降低90%算力消耗;2)本地化部署:支持消费级硬件,无需依赖昂贵的云服务等;3)规则奖励系统:替代昂贵的“AI监工”模型,减少额外训练;4)开源生态:利用社区贡献降低研发成本,迭代速度提升3倍。 “成本创新”对AI产业链有何影响?DeepSeek的低成本优势正在推动AI产业链从“算力竞赛”转向“算法优化”,其影响包括:1)云计算:推理需求爆发倒逼硬件与架构创新,混合云与边缘计算成主流;2)大模型:开源生态崛起加速技术民主化,垂直领域模型与Agent化应用成为新战场;3)应用层:普惠化释放长尾市场潜力,端侧硬件与行业解决方案重塑商业逻辑。未来,AI产业将更依赖算法密度与生态协同,而非单纯资源垄断。 投资建议:1)DeepSeek打破了美国在大模型层面的垄断格局,或带动市场重新审视国产AI行业,带来价值重估;2)DeepSeek的“成本创新”将使得大模型价格进一步平民化,AI普惠将加速应用层的爆发;3)虽然DeepSeek降低了单次算力成本,但随着未来大规模应用的指数级增长,长期来看将有助于推动云服务需求的上升。 投资风险:地缘政治风险,场景落地不及预期。 附录:DeepSeek问答文字版 2025年2月4日,通过DeepSeek网页版提问。 Question1:DeepSeek和OpenAI相比,成本方面有何优势? DeepSeek在成本控制方面相较于OpenAI具有显著优势,具体体现在训练成本、推理成本和商业化定价等多个维度。以下是详细对比分析: 1.训练成本对比 •DeepSeek: oDeepSeek-V3的训练成本仅为558万美元,采用高效的混合专家(MoE)架构和稀疏激活策略,显著降低了算力消耗。 o其训练时间仅需55天,使用2,048块NVIDIA H800 GPU,计算资源消耗远低于行业平均水平。 •OpenAI: oOpenAI的GPT-4训练成本高达10亿美元,依赖大规模全参数激活和复杂的监督微调(SFT)流程。 o训练时间更长,且需要数百万GPU小时的支持,导致整体成本居高不下。 成本节省:DeepSeek的训练成本仅为OpenAI的5%-10%,实现了显著的效率提升。 2.推理成本对比 •DeepSeek:o输入费用:0.14美元/百万tokens(缓存未命中),缓存命中时低至0.014美元/百万tokens。o输出费用:0.28美元/百万tokens,显著低于OpenAI和Claude系列模型。o采用稀疏激活策略,每次任务仅激活部分参数,进一步降低了推理成本。 •OpenAI: oGPT-4o的输入费用为2.5美元/百万tokens(缓存未命中),输出费用高达10美元/百万tokens。 o全参数激活模式导致算力消耗巨大,推理成本居高不下。 成本节省:DeepSeek的推理成本仅为OpenAI的1/10至1/20,性价比优势显著。 3.商业化定价对比 •DeepSeek: o提供开源模型和低成本API,每百万tokens的价格仅为0.48美元,远低于OpenAI的18美元。 o本地化部署支持消费级硬件(如RTX 4090),进一步降低企业使用门槛。 •OpenAI: oGPT-4的API定价较高,每百万tokens的价格为18美元,且依赖昂贵的云服务资源。 o企业级部署需要大规模GPU集群,硬件成本高昂。 成本节省:DeepSeek的商业化定价仅为OpenAI的2%-5%,尤其适合预算敏感的中小企业和开发者。 总结 DeepSeek在训练、推理和商业化定价方面的成本优势显著,整体成本仅为OpenAI的5%-10%。这种高效的成本控制不仅降低了企业使用门槛,还推动了AI技术的普惠化发展。 Question2:DeepSeek如何实现成本创新?底层技术与OpenAI 有何异同? DeepSeek通过以下创新策略实现成本优势: 稀疏激活的MoE架构:仅激活任务相关参数,降低90%的算力开销。本地化部署:支持消费级硬件,无需依赖昂贵的云服务。规则奖励系统:替代昂贵的“AI监工”模型,减少额外训练开销。开源生态:利用社区贡献降低研发成本,迭代速度提升3倍。 从技术层面来看,DeepSeek和OpenAI在底层技术上既有相似之处,也存在显著差异。以下是两者的主要异同点分析: 一、相同点 1.基础架构:Transformer架构o两者都基于Transformer架构,利用自注意力机制处理输入序列,能够高效处理长文本和复杂语言任务。oTransformer架构的并行计算能力使得模型在处理大规模数据时表现出色。 2.推理能力o两者都强调推理能力的提升,通过不同的方式实现复杂问题的逐步分解和逻辑推理。o例如,DeepSeek和OpenAI都采用了多步骤推理技术(如思维链推理,Chain-of-Thought)来增强模型的逻辑处理能力。 3.多阶段训练o两者都采用了多阶段训练流程,通过不同阶段的优化提升模型的性能。例如,DeepSeek的冷启动和多阶段强化学习,以及OpenAI的监督微调(SFT)和思维链推理。 二、不同点 1.训练方式 oDeepSeek:主要依赖强化学习(RL),尤其是其创新的Group RelativePolicy Optimization(GRPO)算法。这种训练方式不依赖大量监督微调数据,而是通过组内奖励对比优化策略,实现推理能力的自主进化。oOpenAI:高度依赖监督微调(SFT),通过大量人工标注的数据提升模型在特定任务上的表现。这种方式虽然能提高任务准确性,但对数据质量和数量的依赖较大。 2.架构设计 oDeepSeek:采用模块化框架和Mixture-of-Experts(MoE)架构。MoE将模型划分为多个专家子模型,每个子模型负责处理不同的输入任务,从而提高模型的泛化能力和鲁棒性。 oOpenAI:基于Transformer架构,通过优化层结构和注意力机制提升模型性能,更注重通用性和多功能性。 3.推理与生成能力 oDeepSeek:在需要深度推理的领域(如数学、代码生成)表现出色,适合复杂任务的处理。例如,DeepSeek在数学推理任务(如AIME 2024)中表现优于OpenAI。 oOpenAI:在自然语言处理(NLP)和文本生成方面表现更为突出,适合广泛的应用场景,如文本摘要、创意写作等。 4.成本与效率oDeepSeek:通过算法优化和模块化设计,显著降低了训练和推理成本。例如,DeepSeek的训练成本仅为558万美元,远低于OpenAI的投入。oOpenAI:虽然性能强大,但其训练和推理成本较高,主要依赖于大规模计算资源和高质量标注数据。 5.应用场景oDeepSeek:更适合需要深度推理和专业领域知识的场景,如医疗数据分析、金融模式检测等。oOpenAI:在通用任务(如文本生成、客户服务)中表现更为出色,适合广泛的企业和个人用户。 Question3:DeepSeek低成本优势对全球AI产业链有何影响? 比如云计算、大模型和应用层等? DeepSeek的低成本优势正在深刻重塑全球AI产业链,其影响从底层算力到应用生态呈现出多维度的连锁反应。以下从云计算、大模型和应用层三个维度展开分析: 一、云计算:需求结构变革与降本压力传导 1.算力需求从训练向推理倾斜 DeepSeek的高效模型架构(如MoE动态激活、FP8混合精度)显著降低训练成本(557.6万美元,仅为GPT-4的5%),导致训练端算力需求增速放缓。而推理端因模型普及化需求激增,预计2026年推理算力占GenAI总需求比例将突破70%。 o硬件厂商转型:传统GPU厂商(如英伟达)面临算力过剩风险,加速向专用AI芯片(如ASIC)及液冷技术研发转型。 o云服务商策略调整:阿里云、AWS等需优化推理集群架构(如铜连接方案、CPO光通信技术),并探索“按需付费”定价模式以应对成本压力。 2.边缘计算与混合云崛起 DeepSeek支持消费级硬件(如RTX 4090)和端侧部署,推动算力从集中式云向边缘侧迁移。例如,硅基流动已基于华为昇腾算力支持DeepSeekAPI,海光DCU适配其模型,预示混合云架构将成为主流。 二、大模型:开源生态与技术路径重构 1.打破“算力垄断”,推动技术民主化 DeepSeek通过算法优化(如动态注意力、多令牌预测)和工程创新(如MoE负载均衡),以1/20的训练成本实现与GPT-4o相当的推理性能,验证了“轻量级颠覆”路径的可行性。 o开源生态繁荣:R1模型开源后6天下载量达110万次,吸引Meta等巨头加码开源社区,形成“技术共享-生态繁荣-反哺创新”的正循环。 oScaling Law转向:模型开发重心从预训练转向强化学习与推理优化,催生新ScalingLaw(如GRPO算法),加速复杂任务(数学、代码)的Agent化落地。 2.垂直领域模型爆发 低成本模型降低企业私有化部署门槛,推动LLM向金融、医疗、教育等垂直领域渗透。例如,某券商使用DeepSeek生成合规研报,效率提升60%。 三、应用层:普惠化与场景革命 1.中小开发者与长尾市场激活 DeepSeek的API定价仅为OpenAI的1/10(输入0.5元/百万tokens),且支持设备端运行,使中小开发者能够低成本开发AI应用。例如,教育机构通过AI教师方案覆盖三四线城市,潜在市场规模超千亿。 2.商业模式创新 传统云计算厂商(如腾讯云)转向“AI+行业解决方案”高毛利模式,衍生数据服务(如金融舆情API)成为新增长点。 总结:价值分配重构与长期趋势 DeepSeek的低成本优势正在推动AI产业链从“算力竞赛”转向“算法优化”,其核心影响包括: •云计算:推理需求爆发倒逼硬件与架构创新,混合云与边缘计算成主流。 •大模型:开源生态崛起加速技术民主化,垂直领域模型与Agent化应用成为新战场。 •应用层:普惠化释放长尾市场潜力,端侧硬件与行业解决方案重塑商业逻辑。 未来,AI产业将更依赖算法密度与生态协同,而非单纯资源垄断。中国企业若能抓住开源化、设备端化趋势,有望在AI 2.0时代占据先机,但需警惕技术跃进伴随的伦理与战略风险。 免责声明 本报告之收取者透过接受本报告(包括任何有关的附件),表示及保证其根据下述的条件下有权获得本报告,且同意受此中包含的限制条件所约束。任何没有遵循这些限制的情况可能构成法律之违反。 本报告是由从事证券及期货条例(香港法例第571章)中第一类(证券交易)及第四类(就证券提供意见)受规管活动之持牌法团–浦银国际证券有限公司(统称“浦银国际证券”)利用集团信息及其他公开信息编制而成。所有资料均搜集自被认为是可靠的来源,但并不保证数据之准确性、可信性及完整性,亦不会因资料引致的任何损失承担任何责任。报告中的资料来源除非另有说明,