行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

DeepSeek+R1：高性价比开源，可加速AI应用落地

文化传媒 2025-02-04 - 国泰君安证券周振

核心观点与关键数据

DeepSeek-R1的推出体现了开源范式下技术进步的速度，以及在AI训练、推理上成本大幅度压缩的可能，AI的广泛落地有望加速。DeepSeek-R1性能堪比OpenAI o1，而调用API的成本仅为后者的1.8%，且模型使用标准化、宽松的MIT License，完全开源，不限制商用。

DeepSeek-R1模型性能与开放性

高性能：DeepSeek-R1在数学、代码等方面得分可比OpenAI o1，如AIME 2024、MATH-500、SWE-bench Vrified等任务上实现了对OpenAI o1得分的超越。
开放性：模型同步上线API，采用标准化、宽松的MIT License，完全开源，不限制商用，且产品协议明确可“模型蒸馏”。
性价比：输入API成本为1元（缓存命中）或4元（缓存未命中）每百万tokens，输出API价格为16元每百万tokens，相比o1-mini仅后者价格的9.1%到18.2%。

国内外关注度与接入情况

网页端访问量：DeepSeek网页端访问量在R1发布后飙升16倍，截止1月28日达到4900万。
APP增长：DeepSeek官方APP在上线11天后DAU达到84万，超过ChatGPT上线11天的78万，上线第18天DAU超过1493万。
国际关注度：非中国大陆地区访问量占比高，其中美国和印度的提升幅度显著。
海外服务商与应用接入：微软、亚马逊AWS、英伟达等海外服务商已接入DeepSeek-R1，AI代码工具Cursor和AI搜索引擎Perplexity也接入了该模型。

开源模型技术思路与团队发展

技术思路：DeepSeek-R1-Zero在训练过程中没有依赖监督微调，而是直接在基础模型上做强化学习，实现了自发的长序列思考链，并在训练过程中出现了“Aha Moment”。
团队发展：DeepSeek成立于2023年7月，自成立以来逐步推出了多个模型，如DeepSeek Coder、DeepSeek LLM、DeepSeek-V2、DeepSeek-V3等，始终追求性价比，DeepSeek-V3在训练成本和API价格上均有显著优势。

开源模型与闭源模型的差距

开源模型加速发展：自GPT-4发布后，开源与闭源差距持续缩小，DeepSeek-V3在MMLU-Redux得分上反超顶尖闭源模型Claude-3.5-Sonnet。
开源模型互相促进：开源模型可以实现互相吸收学习，成长曲线陡峭，DeepSeek-R1更是提升到了92.9分，与OpenAI o1的差距显著缩小。

应用布局与风险提示

投资建议：
1. 具备优秀大模型能力的公司（腾讯控股、阿里巴巴）。
2. 快速商业化落地的教育、娱乐应用、电商场景（恺英网络、值得买、美登科技等）。
3. AI视频生成技术（上海电影、博纳影业、百纳千成等）。
4. AI娱乐方向（恺英网络、姚记科技、三七互娱、吉比特等）。
5. AI硬件落地发展（小米集团、联想集团）。
风险提示：AI技术交流隔离加剧，AI应用落地不及预期。

DeepSeek-R1的推出体现了开源范式下技术进步的速度，以及在AI训练、推理上成本大幅度压缩的可能，AI的广泛落地有望加速，可从几个重点方向布局：1）具备优秀大模型能力的公司有望逐步开始变现和改造现有业务，受益标的腾讯控股、阿里巴巴。2）关注有望快速商业化落地的教育、娱乐应用、电商场景，推荐恺英网络、值得买、美登科技，受益标的南方传媒、世纪天鸿、盛天网络、顺网科技、汤姆猫、焦点科技、昆仑万维、金山软件。3）AI视频生成技术同样有巨大应用前景，内容制作、IP开发、营销宣传将得到更好发展，推荐上海电影、博纳影业、百纳千成，受益标的易点天下、蓝色光标、华策影视、捷成股份、因赛集团、浙文互联。4）AI娱乐方向将受益于生成式内容质量的提升，如AI游戏、AI音乐、AI陪伴等，推荐恺英网络、姚记科技、三七互娱、吉比特，受益标的巨人网络、完美世界、掌趣科技。5）关注AI硬件落地发展，如AI眼镜、AI手机、AI PC、AI音箱等，受益标的小米集团、联想集团。 DeepSeek-R1高性能、低成本、开放性。海内外迅速破圈，海外多个服务商和应用已经接入。DeepSeek-R1性能堪比OpenAI o1，而调用API的成本最低仅为后者的1.8%，且模型使用标准化、宽松的MIT License，完全开源，不限制商用，产品协议明确可“模型蒸馏”，体现了极高的开放性。自从R1模型推出后，DeepSeek网页端访问量飙升16倍，且其中来自非中国大陆地区，海外的服务商和应用也积极接入，包括微软、亚马逊、英伟达、AI代码工具Cursor和AI搜索引擎Perplexity，R1能力得到了充分认可。开源模型技术思路“滚雪球”，增长曲线或超预期，与闭源差距快速拉近。DeepSeek-R1-Zero在训练过程中没有依赖监督微调，而是直接在基础模型上做强化学习，这样免除大量标注过程数据，让模型自己探索，就能实现自发的长序列思考链，在训练过程中还出现了“Aha Moment”，即模型对自我思考路径的反思，类似人类的顿悟行为，体现为某种RL能力的涌现。 DeepSeek为代表的开源发展可降低成本，从而推动应用繁荣。对于B端应用，优质开源模型可更好用于垂类场景，开源模型允许使用者针对自身需求进行蒸馏，或用自有数据进行垂类模型训练，从而更加适合其具体的应用场景，如值得买的“小值”助手、巨人网络的GiantGPT；成本的压低将带来使用场景的普及，从而带动新的供给和需求，类似此前的PC互联网、移动互联网浪潮，如今的AIGC创作也已经呈现类似的趋势，若推理成本进一步降低、对于AI内容的发展将有显著推动。风险提示：AI技术交流隔离加剧，AI应用落地不及预期。 1.投资建议 DeepSeek-R1的推出体现了开源范式下技术进步的速度，以及在AI训练、推理上成本大幅度压缩的可能，AI的广泛落地有望加速，可从几个重点方向布局： 1）具备优秀大模型能力的公司有望逐步开始变现和改造现有业务，受益标的腾讯控股、阿里巴巴。 2）关注有望快速商业化落地的教育、娱乐应用、电商场景，推荐恺英网络、值得买、美登科技，受益标的南方传媒、世纪天鸿、盛天网络、顺网科技、汤姆猫、焦点科技、昆仑万维、金山软件。 3）AI视频生成技术同样有巨大应用前景，内容制作、IP开发、营销宣传将得到更好发展，推荐上海电影、博纳影业、百纳千成，受益标的易点天下、蓝色光标、华策影视、捷成股份、因赛集团、浙文互联。 4）AI娱乐方向将受益于生成式内容质量的提升，如AI游戏、AI音乐、AI陪伴等，推荐恺英网络、姚记科技、三七互娱、吉比特，受益标的巨人网络、完美世界、掌趣科技。 5）关注AI硬件落地发展，如AI眼镜、AI手机、AI PC、AI音箱等，受益标的小米集团、联想集团。表1：推荐公司盈利预测与估值情况表 2.DeepSeek-R1：高性价比开源产品，海内外迅速破圈 2.1.R1模型性能对标OpenAI o1，开放程度与性价比极高高性能：DeepSeek-R1发布，在数学、代码等方面得分可比OpenAIo1。2025年1月20日，DeepSeek发布R1模型，根据公司官方透露，DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力，在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版，如AIME 2024、MATH-500、SWE-bench Vrified都实现了对OpenAI o1得分的超越，Codeforces、GPQA Diamond、MMLU测试也与OpenAI o1差距不大。图1：DeepSeek-R1在多项指标得分与OpenAI o1接近开放性：DeepSeek-R1充分开源，或促进开源模型的加速迭代。1）DeepSeek-R1同步上线API，对用户开放思维链输出；2）模型的开源仓库（包括模型权重）统一采用标准化、宽松的MIT License，完全开源，不限制商用，无需申请；3）产品协议明确可“模型蒸馏”，允许用户通过蒸馏技术借助R1训练其他模型，如官方提供开源的6个蒸馏小模型中，32B和70B的版本在多项能力上对标OpenAI o1-mini。截止2025年1月28日，其在GitHub已获得5.12万颗星，而llama和llama3分别获得5.74和2.81万颗星，体现了开源社区对R1的充分认可。图2：官方提供的6个蒸馏小模型中，32B与70B版本可对标o1-mini 图3：DeepSeek-R1在GitHub获得的星数已经接近llama（单位：万）性价比：推理成本低廉，应用前景可极大拓展。DeepSeek-R1的输入API成本为1元（缓存命中）或4元（缓存未命中）每百万tokens，输出API价格为16元每百万tokens，相比o1-mini仅后者价格的9.1%到18.2%，若与o1对比则只有1.8%到3.7%，该模型极高的性价比将显著有利于API的推广使用，从而扩大AI的应用场景。图4：DeepSeek-R1在多项指标得分与OpenAI o1接近 2.2.国内外关注度快速提升，海外多个服务商或应用已接入 DeepSeek网页端访问量飙升16倍。DeepSeek官网日访问量长期维持在300万上下水平，2025年1月20日开始第一波加速增长至1月22日的524.6万，之后自1月25日起各海外大模型厂商开始关注，讨论热度上升，网页访问量开始加速增长，截止1月28日，网站单日访问量已经达到4900万，为R1发布前的16倍，作为对比，ChatGPT网站在2025年1月1日至28日的日均访问量约为1.23亿次。图5：DeepSeek网页访问量自1月26日开始加速增长用户涌入官方APP，国内外iOS免费榜登顶。DeepSeek于1月15日上线其官方APP，当时关注度并不算高，但是自从1月20日R1模型公开并上线后，APP在应用免费榜排名快速攀升，在美国地区，其自1月25日便进入前十，27日登顶后连续霸榜，在中国地区则是26日位列第2，27日同样开始登顶霸榜。图6：DeepSeek APP在中国和美国的iOS应用免费榜登顶 APP增长势头甚至强过ChatGPT与豆包。在R1的高讨论热度下，DeepSeek官方APP在上线11天后DAU达到84万，超过ChatGPT上线11天的78万，之后DeepSeek用户进一步增加，上线第18天DAU超过1493万，而ChatGPT同期仅155万。国内方面，DeepSeek的免费榜排名在1月24日超过KimiChat，1月26日超过豆包。图7：DeepSeek APP上线后逐日DAU增长超过ChatGPT APP上线图8：DeepSeek自1月26日在iOS效率应用免费榜超过豆包（数据截至2025年1月31日）国际关注度提升，非中国大陆地区访问量占比高。根据Similarweb的统计，2025年1月1日-28日，DeepSeek网页的访问中，22.2%来自中国大陆，其后是美国的9.01%和印度的6.42%，而2024年12月，DeepSeek有36.72%的访问来自中国大陆，13.67%来自俄罗斯，6.37%来自美国，两个月对比来看来自中国大陆以外的访问量增长显著快于国内，其中美国和印度的提升幅度显著。横向对比来看，ChatGPT的访问地区高度分散，前三名分别为美国13.8%、印度9.93%和英国4.48%，而Kimi主要在国内提供服务，中国大陆、中国香港、中国台湾的访问量占比分别达到92.53%、2.23%、1.08%，美国只占0.81%。图9：2025年1月DeepSeek来自中国大陆以外的访问占比提升显著图10：ChatGPT的访问中美国和印度占比高图11：Kimi的访问中，来自中国大陆的为绝大多数海外服务商与应用积极接入DeepSeek。在引起广泛关注后，海外的服务商和应用也积极接入，如微软率先在其Azure AI Foundry平台和GitHub上集成了DeepSeek-R1模型，并表示经过了“严格的红队测试和安全评估”，亚马逊AWS也通过Bedrock和SageMaker AI两个平台提供DeepSeek部署方案，英伟达也将R1上线了其NIM平台；应用方面，AI代码工具Cursor和AI搜索引擎Perplexity也都接入了DeepSeek-R1，体现了其能力得到了充分认可。表2：海外多个云服务商和应用方积极接入DeepSeek 2.3.R1暂未开启图像理解，新发布Janus-Pro探索多模态截至1月31日，DeepSeek-R1模型暂不支持图像理解，若询问其是否可以理解图片，AI将会回应无法直接产看或分析图片、视频。图12：DeepSeek回应暂不支持图片理解多模态模型Janus-Pro发布，“读图”“生图”能力突出。1月28日凌晨，DeepSeek在人工智能社区Hugging Face发布了开源多模态模型Janus-Pro，包括1B和7B两个版本，此模型具备读图和生图的能力。其中在图像理解测试中，Janus-Pro系列模型得分高于上代的Janus模型，也好于如LLaVA-v1.5的同参数版本；而在生图能力上，其相比前代Janus改进显著，在GenEval和DPG-Bench测试中，7B版本准确度为80%和84.2%，高于包括DALL-E 3、SD3-Medium等一众可比模型。图13：在图像理解测试中Janus-Pro优于同参数模型图14：在文生图的测试中Janus-Pro-7B表现突出图15：对比Janus，Janus-Pro-7B生图质量提升显著图16：Janus-Pro的图像理解能力优秀 3.团队坚持开源路线，长期耕耘高性价比模型成立两年多次产品迭代，保持开源追求。DeepSeek成立于2023年7月，自成立以来逐步推出了代码大模型DeepSeek Coder、通用大模型DeepSeek LLM，2024年5月推出了第二代MoE模型DeepSeek-V2，9月在V2和Coder的基础上更新了V2.5，并于11月推出媲美o1-preview的R1-Lite。 2024年12月26日，团队推出DeepSeek-V3引发一波重点关注，因为其性能超过了头部开源Llama-3.1-405B，且接近了顶尖闭源GPT-4o等，而API价格大幅降低。2025年之后，公司发布DeepSeek-R1，实现了和OpenAI o1正式版性能的对标。表3：DeepSeek成立以来的重点产品团队一直追求性价比，此前DeepSeek-V3在训练成本和API价格均有显著优势。训练成本上，DeepSeek-V3模型采用H800 GPU训练了278.8万个小时，假设每小时2美元，总训练成本557.6万美元，对比之下，Llama 3的405B版本使用更好的GPU训练时长达到了3080万个小时；从API价格来看，DeepSeek-V3的API价格在0.07美元/百万t

点击免费查看完整报告

DeepSeek+R1：高性价比开源，可加速AI应用落地

核心观点与关键数据

DeepSeek-R1模型性能与开放性

国内外关注度与接入情况

开源模型技术思路与团队发展

开源模型与闭源模型的差距

应用布局与风险提示

你可能感兴趣

AI事件点评：DeepSeek发布高性价比开源模型，有望拉平模型差距、加速AI云与应用发展

国金互联网传媒快手可灵大模型网测效果优秀AI应用落地加速中

商贸零售&社会服务行业深度：AI+消费专题报告，高性价比国产大模型应用落地加速，探索 AI+消费投资机会

商社行业：把握AI+消费新场景，高性价比国产大模型加速应用落地

商贸零售&社会服务行业深度报告：高性价比国产大模型应用落地加速，探索AI+消费投资机会

DeepSeek系列开源模型有望加速AI端侧+应用产业趋势

传媒行业周观察：蚂蚁集团发布 AI 健康管家 AQ，可灵推出全球首部 AI 单元故事集，继续看好 AI 应用落地进展

【盘中宝】研究再迎新进展！该技术可与AI融合，或为未来科技竞争中抢占的制高点，产业正从应用萌芽期迈入普及期，这家公司首款技术产品已落地在该细分领域

AI行业深度更新报告：大模型“开源、轻量、端侧”化，视频与语音加速落地

【盘中宝】 AI技术推进产业在C端商业化变现，这类产品在各个行业应用普及或加速推进，可极大解放生产力，这家公司已创新推出移动端相关产品-20240204