您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[德邦证券]:DeepSeek系列开源模型有望加速AI端侧+应用产业趋势 - 发现报告
当前位置:首页/行业研究/报告详情/

DeepSeek系列开源模型有望加速AI端侧+应用产业趋势

信息技术2025-02-04陈涵泊、李佩京、王思德邦证券见***
AI智能总结
查看更多
DeepSeek系列开源模型有望加速AI端侧+应用产业趋势

DeepSeek-V3、R1、Janus-Pro是在算力受限的情况下,国人通过算法的系统性创新实现算力高效利用的典范。 1)成本:V3显著降低了对硬件资源的需求,模型训练成本约为o1的二十分之一。根据开发方深度求索的技术报告,DeepSeek-V3合计正式训练成本仅为557万美元(假设H800 GPU的租金为每GPU小时2美元),不包括与架构、算法或数据相关的先前的研究或精简实验的成本,在2048个H800 GPU的集群上需要3.7天;Anthropic的CEO达里奥·阿莫迪曾表示,GPT-4o模型训练成本约为1亿美元,而目前正在开发的AI大模型训练成本可能高达10亿美元,未来三年内,AI大模型的训练成本将上升至100亿美元甚至1000亿美元。 2)原理:V3针对分布式推理做了创新的优化,进而显著提升了分布式MoE模型的负载分配效率,不只是从算法上,而是从整个系统上为未来更大规模的模型提供了新的可扩展性框架的可能。此外,基于RL方式,还使用了辅助损失自由负载均衡策略、多Token预测目标(MTP)、FP8+BF16+FP32混合等方式大幅降低了算力消耗。 3)性能:V3是目前可用的较强的开源基础模型,性能媲美闭源的GPT-4o以及Claude-3.5-Sonnet。该MoE模型671B参数,激活37B,在多项评测成绩上,超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。例如代码方面 ,DeepSeek-V3在算法类代码场景(Codeforces),远远领先于市面上已有的全部非o1类模型;并在工程类代码场景(SWE-Bench Verified)逼近Claude-3.5-Sonnet-1022。 4)开源API收费是o1的1/100。DeepSeek-R1性能上比肩OpenAI的o1,并完全开源,调用成本极低:允许用户通过蒸馏技术借助R1训练其他模型,API服务定价为每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),每百万输出tokens 16元;与此对比,GPT-o1-2024-12-17模型API定价为每百万输入tokens 15美元(约为109人民币,按1月27日美元兑人民币汇率7.25,下同),每百万输出tokens 60元(约为435人民币)。 5)最新模型支持统一的多模态,部分测试优于Stable Diffusion。新发布的开源多模态统一模型Janus-Pro,既能让AI读图(基于SigLIP-L),又能让AI生图(借鉴LlamaGen),分1.5B和7B两个大小,与此对比GPT-4o的图片生成多模态模型至今没开放;在训练成本上,仅为128颗英伟达A100训练1周;在算法设计上,把用来训练R1的类似的思维链(CoT)推理用在了图像生成上,具备很强的普适性;在实际效果上,Janus-Pro-7B在多模态理解基准MMBench上取得了79.2的分数,超越了TokenFlow(68.9)、Meta Morph(75.2)等最先进的统一多模态模型,在文本到图像指令跟踪排行榜GenEval中,Janus-Pro-7B得分为0.80,优于DALL-E 3(0.67)和Stable Diffusion 3 Medium(0.74)。 我们认为,DeepSeek系列开源模型将给世界带来如下变化: 1)加速AI应用和Agent爆发。模型是应用的上游成本,更低的调用成本是必然趋势,DeepSeek加速了调用成本下降的速度,使得以Agent为代表的AI应用能够更快实现ROI的平衡,从而带来应用的井喷,建议关注美股-CRM、Snow、PLTR、Applovin等,A股-泛微网络、致远互联、博睿数据、中科星图、金山办公、金蝶国际、福昕软件、彩讯股份、万兴科技、易点天下、航天宏图等。 2)加速AI终端升级进程。DeepSeek-R1允许用户蒸馏实现端侧模型的训练,将带来端侧模型能力的批量升级,进而带来用户体验的大幅提升,AI终端的灵魂就是端侧模型,AI终端预计将更快到达用户付费的奇点,“IPhone 4时刻”更快到来,建议关注美股-APPL、Tsla等,A股-世运电路、乐鑫科技、中科蓝讯、科大讯飞等。 3)加速推理算力需求的释放。推理算力成本下降速度加速,而参照Jevons悖论,技术进步提高了使用资源的效率(减少任何一种使用所需的数量),但成本降低导致需求增加,令资源消耗的速度是上升而非减少,我们认为tokens成本的降低反而会使得总体tokens消耗量激增,未来tokens或更为普惠,并且加速到来,推理算力长逻辑强化,建议关注美股-NVDA、AVGO、Marvell等,A股-华丰科技、海光信息、中科曙光、神州数码、寒武纪、润泽科技、润建股份等。 风险提示:上游供应不及预期、下游AI产业落地速度不及预期、中游竞争格局加剧、国际局势风险、国内外宏观利率风险等。