DeepSeek-R1的推出体现了开源范式下技术进步的速度,以及在AI训练、推理上成本大幅度压缩的可能,AI的广泛落地有望加速,可从几个重点方向布局:1)具备优秀大模型能力的公司有望逐步开始变现和改造现有业务,受益标的腾讯控股、阿里巴巴。2)关注有望快速商业化落地的教育、娱乐应用、电商场景,推荐恺英网络、值得买、美登科技,受益标的南方传媒、世纪天鸿、盛天网络、顺网科技、汤姆猫、焦点科技、昆仑万维、金山软件。3)AI视频生成技术同样有巨大应用前景,内容制作、IP开发、营销宣传将得到更好发展,推荐上海电影、博纳影业、百纳千成,受益标的易点天下、蓝色光标、华策影视、捷成股份、因赛集团、浙文互联。4)AI娱乐方向将受益于生成式内容质量的提升,如AI游戏、AI音乐、AI陪伴等,推荐恺英网络、姚记科技、三七互娱、吉比特,受益标的巨人网络、完美世界、掌趣科技。5)关注AI硬件落地发展,如AI眼镜、AI手机、AI PC、AI音箱等,受益标的小米集团、联想集团。 DeepSeek-R1高性能、低成本、开放性。海内外迅速破圈,海外多个服务商和应用已经接入。DeepSeek-R1性能堪比OpenAI o1,而调用API的成本最低仅为后者的1.8%,且模型使用标准化、宽松的MIT License,完全开源,不限制商用,产品协议明确可“模型蒸馏”,体现了极高的开放性。自从R1模型推出后,DeepSeek网页端访问量飙升16倍,且其中来自非中国大陆地区,海外的服务商和应用也积极接入,包括微软、亚马逊、英伟达、AI代码工具Cursor和AI搜索引擎Perplexity,R1能力得到了充分认可。 开源模型技术思路“滚雪球”,增长曲线或超预期,与闭源差距快速拉近。DeepSeek-R1-Zero在训练过程中没有依赖监督微调,而是直接在基础模型上做强化学习,这样免除大量标注过程数据,让模型自己探索,就能实现自发的长序列思考链,在训练过程中还出现了“Aha Moment”,即模型对自我思考路径的反思,类似人类的顿悟行为,体现为某种RL能力的涌现。 DeepSeek为代表的开源发展可降低成本,从而推动应用繁荣。对于B端应用,优质开源模型可更好用于垂类场景,开源模型允许使用者针对自身需求进行蒸馏,或用自有数据进行垂类模型训练,从而更加适合其具体的应用场景,如值得买的“小值”助手、巨人网络的GiantGPT;成本的压低将带来使用场景的普及,从而带动新的供给和需求,类似此前的PC互联网、移动互联网浪潮,如今的AIGC创作也已经呈现类似的趋势,若推理成本进一步降低、对于AI内容的发展将有显著推动。 风险提示:AI技术交流隔离加剧,AI应用落地不及预期。 1.投资建议 DeepSeek-R1的推出体现了开源范式下技术进步的速度,以及在AI训练、推理上成本大幅度压缩的可能,AI的广泛落地有望加速,可从几个重点方向布局: 1)具备优秀大模型能力的公司有望逐步开始变现和改造现有业务,受益标的腾讯控股、阿里巴巴。 2)关注有望快速商业化落地的教育、娱乐应用、电商场景,推荐恺英网络、值得买、美登科技,受益标的南方传媒、世纪天鸿、盛天网络、顺网科技、汤姆猫、焦点科技、昆仑万维、金山软件。 3)AI视频生成技术同样有巨大应用前景,内容制作、IP开发、营销宣传将得到更好发展,推荐上海电影、博纳影业、百纳千成,受益标的易点天下、蓝色光标、华策影视、捷成股份、因赛集团、浙文互联。 4)AI娱乐方向将受益于生成式内容质量的提升,如AI游戏、AI音乐、AI陪伴等,推荐恺英网络、姚记科技、三七互娱、吉比特,受益标的巨人网络、完美世界、掌趣科技。 5)关注AI硬件落地发展,如AI眼镜、AI手机、AI PC、AI音箱等,受益标的小米集团、联想集团。 表1:推荐公司盈利预测与估值情况表 2.DeepSeek-R1:高性价比开源产品,海内外迅速破圈 2.1.R1模型性能对标OpenAI o1,开放程度与性价比极高 高性能:DeepSeek-R1发布,在数学、代码等方面得分可比OpenAIo1。2025年1月20日,DeepSeek发布R1模型,根据公司官方透露,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版,如AIME 2024、MATH-500、SWE-bench Vrified都实现了对OpenAI o1得分的超越,Codeforces、GPQA Diamond、MMLU测试也与OpenAI o1差距不大。 图1:DeepSeek-R1在多项指标得分与OpenAI o1接近 开放性:DeepSeek-R1充分开源,或促进开源模型的加速迭代。1)DeepSeek-R1同步上线API,对用户开放思维链输出;2)模型的开源仓库(包括模型权重)统一采用标准化、宽松的MIT License,完全开源,不限制商用,无需申请;3)产品协议明确可“模型蒸馏”,允许用户通过蒸馏技术借助R1训练其他模型,如官方提供开源的6个蒸馏小模型中,32B和70B的版本在多项能力上对标OpenAI o1-mini。截止2025年1月28日,其在GitHub已获得5.12万颗星,而llama和llama3分别获得5.74和2.81万颗星,体现了开源社区对R1的充分认可。 图2:官方提供的6个蒸馏小模型中,32B与70B版本可对标o1-mini 图3:DeepSeek-R1在GitHub获得的星数已经接近llama(单位:万) 性价比:推理成本低廉,应用前景可极大拓展。DeepSeek-R1的输入API成本为1元(缓存命中)或4元(缓存未命中)每百万tokens,输出API价格为16元每百万tokens,相比o1-mini仅后者价格的9.1%到18.2%,若与o1对比则只有1.8%到3.7%,该模型极高的性价比将显著有利于API的推广使用,从而扩大AI的应用场景。 图4:DeepSeek-R1在多项指标得分与OpenAI o1接近 2.2.国内外关注度快速提升,海外多个服务商或应用已接入 DeepSeek网页端访问量飙升16倍。DeepSeek官网日访问量长期维持在300万上下水平,2025年1月20日开始第一波加速增长至1月22日的524.6万,之后自1月25日起各海外大模型厂商开始关注,讨论热度上升,网页访问量开始加速增长,截止1月28日,网站单日访问量已经达到4900万,为R1发布前的16倍,作为对比,ChatGPT网站在2025年1月1日至28日的日均访问量约为1.23亿次。 图5:DeepSeek网页访问量自1月26日开始加速增长 用户涌入官方APP,国内外iOS免费榜登顶。DeepSeek于1月15日上线其官方APP,当时关注度并不算高,但是自从1月20日R1模型公开并上线后,APP在应用免费榜排名快速攀升,在美国地区,其自1月25日便进入前十,27日登顶后连续霸榜,在中国地区则是26日位列第2,27日同样开始登顶霸榜。 图6:DeepSeek APP在中国和美国的iOS应用免费榜登顶 APP增长势头甚至强过ChatGPT与豆包。在R1的高讨论热度下,DeepSeek官方APP在上线11天后DAU达到84万,超过ChatGPT上线11天的78万,之后DeepSeek用户进一步增加,上线第18天DAU超过1493万,而ChatGPT同期仅155万。国内方面,DeepSeek的免费榜排名在1月24日超过KimiChat,1月26日超过豆包。 图7:DeepSeek APP上线后逐日DAU增长超过ChatGPT APP上线 图8:DeepSeek自1月26日在iOS效率应用免费榜超过豆包(数据截至2025年1月31日) 国际关注度提升,非中国大陆地区访问量占比高。根据Similarweb的统计,2025年1月1日-28日,DeepSeek网页的访问中,22.2%来自中国大陆,其后是美国的9.01%和印度的6.42%,而2024年12月,DeepSeek有36.72%的访问来自中国大陆,13.67%来自俄罗斯,6.37%来自美国,两个月对比来看来自中国大陆以外的访问量增长显著快于国内,其中美国和印度的提升幅度显著。横向对比来看,ChatGPT的访问地区高度分散,前三名分别为美国13.8%、印度9.93%和英国4.48%,而Kimi主要在国内提供服务,中国大陆、中国香港、中国台湾的访问量占比分别达到92.53%、2.23%、1.08%,美国只占0.81%。 图9:2025年1月DeepSeek来自中国大陆以外的访问占比提升显著 图10:ChatGPT的访问中美国和印度占比高 图11:Kimi的访问中,来自中国大陆的为绝大多数 海外服务商与应用积极接入DeepSeek。在引起广泛关注后,海外的服务商和应用也积极接入,如微软率先在其Azure AI Foundry平台和GitHub上集成了DeepSeek-R1模型,并表示经过了“严格的红队测试和安全评估”,亚马逊AWS也通过Bedrock和SageMaker AI两个平台提供DeepSeek部署方案,英伟达也将R1上线了其NIM平台;应用方面,AI代码工具Cursor和AI搜索引擎Perplexity也都接入了DeepSeek-R1,体现了其能力得到了充分认可。 表2:海外多个云服务商和应用方积极接入DeepSeek 2.3.R1暂未开启图像理解,新发布Janus-Pro探索多模态 截至1月31日,DeepSeek-R1模型暂不支持图像理解,若询问其是否可以理解图片,AI将会回应无法直接产看或分析图片、视频。 图12:DeepSeek回应暂不支持图片理解 多模态模型Janus-Pro发布,“读图”“生图”能力突出。1月28日凌晨,DeepSeek在人工智能社区Hugging Face发布了开源多模态模型Janus-Pro,包括1B和7B两个版本,此模型具备读图和生图的能力。其中在图像理解测试中,Janus-Pro系列模型得分高于上代的Janus模型,也好于如LLaVA-v1.5的同参数版本;而在生图能力上,其相比前代Janus改进显著,在GenEval和DPG-Bench测试中,7B版本准确度为80%和84.2%,高于包括DALL-E 3、SD3-Medium等一众可比模型。 图13:在图像理解测试中Janus-Pro优于同参数模型 图14:在文生图的测试中Janus-Pro-7B表现突出 图15:对比Janus,Janus-Pro-7B生图质量提升显著 图16:Janus-Pro的图像理解能力优秀 3.团队坚持开源路线,长期耕耘高性价比模型 成立两年多次产品迭代,保持开源追求。DeepSeek成立于2023年7月,自成立以来逐步推出了代码大模型DeepSeek Coder、通用大模型DeepSeek LLM,2024年5月推出了第二代MoE模型DeepSeek-V2,9月在V2和Coder的基础上更新了V2.5,并于11月推出媲美o1-preview的R1-Lite。 2024年12月26日,团队推出DeepSeek-V3引发一波重点关注,因为其性能超过了头部开源Llama-3.1-405B,且接近了顶尖闭源GPT-4o等,而API价格大幅降低。2025年之后,公司发布DeepSeek-R1,实现了和OpenAI o1正式版性能的对标。 表3:DeepSeek成立以来的重点产品 团队一直追求性价比,此前DeepSeek-V3在训练成本和API价格均有显著优势。训练成本上,DeepSeek-V3模型采用H800 GPU训练了278.8万个小时,假设每小时2美元,总训练成本557.6万美元,对比之下,Llama 3的405B版本使用更好的GPU训练时长达到了3080万个小时;从API价格来看,DeepSeek-V3的API价格在0.07美元/百万t