您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华龙证券]:AI产业系列跟踪专题研究报告:DeepSeek重塑AI产业格局,助力AI端侧落地 - 发现报告

AI产业系列跟踪专题研究报告:DeepSeek重塑AI产业格局,助力AI端侧落地

信息技术2025-02-10孙伯文华龙证券灰***
AI智能总结
查看更多
AI产业系列跟踪专题研究报告:DeepSeek重塑AI产业格局,助力AI端侧落地

报告日期:2025年02月10日 传媒 DeepSeek重塑AI产业格局,助力AI端侧落地 ——AI产业系列跟踪专题研究报告 华龙证券研究所 摘要: DeepSeek-V3和R1模型凭借卓越的性能和创新的技术,迅速在全球AI领域崭露头角。2024年12月26日,公司发布全新系列模型DeepSeek-V3并同步开源,DeepSeek-V3为自研MoE模型,多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模 型 , 并 在 性 能 上 和 世 界 顶 尖 的 闭 源 模 型GPT-4o以及Claude-3.5-Sonnet不分伯仲。2025年1月20日,DeepSeek发布了推理模型DeepSeek-R1,该模型在后训练阶段大规模使用了强化学习技术,在仅仅使用极少标注数据的情况下,极大提升了模型推理能力,在数据、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。 投资评级:推荐(维持) DeepSeek-V3技术创新:架构优化与训练效率提升。DeepSeek-V3在继承DeepSeek-V2高效架构的基础上,通过创新的负载均衡策略和多标记预测(MTP)目标,进一步优化了模型性能。该模型率先采用无需辅助损失的负载均衡策略,有效降低了因负载均衡导致的性能下降。同时,MTP目标不仅提升了模型性能,还支持推理加速中的推测性解码。在预训练阶段,DeepSeek-V3通过FP8混合精度训练框架和算法、框架、硬件的协同设计,克服了跨节点MoE训练中的通信瓶颈,实现了计算与通信的高效重叠,显著提升了训练效率并降低了成本。最终,以仅266.4万H800GPU小时的经济成本完成了在14.8万亿标记上的预训练,成为目前最强的开源基础模型。在后训练阶段,DeepSeek-V3通过知识蒸馏技术,将长链推理(CoT)模型的推理能力融入其中,显著提升了推理性能,同时保持了输出风格和长度的可控性。 分析师:孙伯文执业证书编号:S0230523080004邮箱:sunbw@hlzq.com 相关阅读 《智谱发布Realtime、4V、Air新模型,商业化应用场景持续拓宽—传媒行业周报》2025.01.20《CES2025盛大开幕,“AR+AI”应用改变移动办公范式—传媒行业周报》2025.01.14《AI+文化出海+IP衍生,打开传媒成长新空间—---传媒行业2025年年度投资策略报告》2024.12.06 科技巨头纷纷接入DeepSeek,推动全球AI生态发展。2025年1月30日,英伟达宣布DeepSeek-R1模型作为NVIDIANIM微服务预览版上线,为企业提供了高效推理服务。紧接着,1月29日,微软将DeepSeek-R1纳入AzureAIFoundry平台,支持企业通过无服务器端点访问该模型。此外,DeepSeek-R1还上线了GitHubModels,开发者可免费试用。2月1日,硅基流动与华为云联合发布了基于昇腾云服务的DeepSeekR1/V3推理服务,凭借自研推理加速引擎,该服务在性能上与全球高端GPU部署模型相当,同时提供稳定、生产级的服务能力,满足大规模商用需求,并依托华为云昇腾云服务的强大算力支持。 投资建议:DeepSeek-V3/R1的推出代表中国在全球AI领域的技 请认真阅读文后免责条款 术引领,极大地提振了全球AI产业的信心,为AI产业的长期增长提供了强大动力。借助AI算法,公司可以精准分析用户偏好,实现个性化内容推荐,进而提高用户参与度和留存率,增强其市场竞争力。同时,AI能够根据企业的需求生成创意内容,如剧本创作、角色设计、故事背景等,为影视、动漫、游戏等领域提供丰富的创意灵感,推动行业内容的多元化发展。因此,维持传媒行业“推荐”评级。建议重点关注:三七互娱、姚记科技、昆仑万维、世纪天鸿、上海电影、博纳影业、光线传媒、万达电影、视觉中国、汤姆猫、实丰文化。 风险提示:市场需求增长不及预期、技术研发进展不及预期、竞争加剧导致盈利空间受限风险、外部环境风险、政策支持风险。 内容目录 1DeepSeek-V3、R1模型性能强劲“火出圈”.......................................................................................11.1DeepSeek-V3性能卓越,比肩全球顶尖模型..................................................................................11.2R1模型性能对标OpenAIo1正式版................................................................................................32DeepSeek模型技术创新..........................................................................................................................53科技巨头纷纷接入DeepSeek,推动全球AI生态发展.......................................................................64投资建议...................................................................................................................................................75风险提示...................................................................................................................................................7 图目录 图1:DeepSeek-V3实现多项评测成绩领先.......................................................................................1图2:DeepSeek-V3在四类测试集的评分...........................................................................................2图3:DeepSeek-V3的API服务价格...................................................................................................3图4:DeepSeek-R1性能比肩OpenAIo1正式版...............................................................................4图5:蒸馏小模型超越OpenAIo1-mini..............................................................................................4图6:DeepSeek-V3的基本架构...........................................................................................................5图7:Multi-TokenPrediction(MTP)示意图.........................................................................................6 1DeepSeek-V3、R1模型性能强劲“火出圈” 1.1DeepSeek-V3性能卓越,比肩全球顶尖模型 2024年12月26日,公司发布全新系列模型DeepSeek-V3并同步开源,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8Ttoken上进 行 了 预 训 练 。DeepSeek-V3多 项 评 测 成 绩 超 越 了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。DeepSeek-V3通过算法和工程上的创新,将生成吐字速度从20TPS大幅提高至60TPS,相比V2.5模型实现了3倍的提升,带来更加流畅的用户使用体验。 数据来源:DeepSeek官网,华龙证券研究所 DeepSeek-V3的百科知识、长文本分析处理、代码、数学和中文能力都遥遥领先。分项来看,DeepSeek-V3在知识类任务(MMLU,MMLU-Pro,GPQA,SimpleQA)上的水平相比前代DeepSeek-V2.5显著提升,接近当前表现最好的模型Claude-3.5-Sonnet-1022。在长文本测评中,DeepSeek-V3平均表现超越其他模型。在算法类代码场景(Codeforces),DeepSeek-V3远 远 领 先 于 市 面 上 已 有 的 全 部 非o1类 模 型 ; 并 在 工 程 类 代 码 场 景(SWE-BenchVerified)逼 近Claude-3.5-Sonnet-1022。在 美国 数学竞 赛(AIME2024,MATH)和全国高中数学联赛(CNMO2024)上,DeepSeek-V3大幅超过了所有开源闭源模型。DeepSeek-V3与Qwen2.5-72B在教育类测评C-Eval和代词消歧等评测集上表现相近,但在事实知识C-SimpleQA上更为领先。 DeepSeek-V3模型性价比极为突出。在性能上实现显著领先的同时,定价远低于市场上其他同类产品,其API服务定价调整为每百万输入tokens0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens8元。 数据来源:DeepSeek官网,华龙证券研究所 1.2R1模型性能对标OpenAIo1正式版 2025年1月20日,DeepSeek发布了推理模型DeepSeek-R1,该模型在后训练阶段大规模使用了强化学习技术,在仅仅使用极少标注数据的情况下,极大提升了模型推理能力,在数据、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。DeepSeek-R1API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元。 数据来源:DeepSeek官网,华龙证券研究所 公司在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,通过DeepSeek-R1的输出,蒸馏了6个小模型开源给社区,其中32B和70B模型在多项能力上实现了对标OpenAIo1-mini的效果。 2DeepSeek模型技术创新 DeepSeek-V3在DeepSeek-V2高效架构的基础上,率先采用了一种无需辅助损失的负载均衡策略,该策略将因鼓励负载均衡而导致的性能下降降至最低。同时,公司研究了一种多标记预测(Multi-TokenPrediction,MTP)目标,证明其对模型性能有益,并可用于推理加速中的推测性解码。 在预训练阶段,公司追求极致的训练效率。DeepSeek设计了一个FP8混合精度训练框架,并首次在超大规模模型上验证了FP8训练的可行性和有效性。通过算法、框架和硬件的协同设