证券研究报告 TMT行业 DeepSeekR1发布,大模型格局预计发生重大变化 关注股份 报告摘要 美图公司1357.HK汇量科技1860.HK第四范式6682.HK金山云3896.HK万国数据9698.HK 2025年1月 , 国 内 人 工 智 能 初创 公 司DeepSeek正 式 发 布 最 新 开 源 模 型DeepSeek-R1,在全球范围引发广泛关注与讨论。目前行业普遍认为DeepSeek带来了两个里程碑性质的意义:1.算力成本投入表现出来的性能超出行业认知,用于训练的成本可能大大降低;2.开源路线对大公司闭源路线的底层颠覆。 技术性能卓越DeepSeek-R1采用MIT许可证开源,允许用户通过蒸馏技术训练其他模型。它的创新性体现在后训练阶段大规模应用强化学习技术,在标注数据极少的情况下,仍显著提升了模型推理能力。在数学、代码和自然语言推理等任务中,DeepSeek-R1性能比肩OpenAIo1正式版,在一些第三方测试中表现 优 异 , 如 在 美 国 加 州 大 学 伯 克 利 分 校 研 究 人 员 设 立 的 聊 天 机 器 人 竞 技 场(chatbotarena)平台上,DeepSeek-R1的性能表现位列前十。 成本优势显著,性价比极高在成本方面,DeepSeek-R1有着无可比拟的优势。此前发布的DeepSeek-V3仅使用2048颗英伟达H800GPU,就完成了6710亿参数模型的训练,成本约为560万美元,远低于其他顶级模型的训练成本。而DeepSeek-R1在运行成本上同样突出,输入费用仅为0.55美元/百万tokens(缓存未命中),缓存命中时更是低至0.14美元/百万tokens,输出费用仅为2.19美元/百万tokens。相比之下仅为OpenAIGPT-4o输入费用同等情况下的,这使得DeepSeek-R1未来可能成为预算敏感企业和团队的首选。 开源模式引领DeepSeek-R1的开源发布在国际AI社区激起千层浪。Meta首席AI科学家YannLeCun表示,其成功证明了开源模型正超越闭源模型。与OpenAI限制对其系统的访问以维护竞争优势不同,DeepSeek允许全球企业和开发者共同开发和改进技术。这种开源策略为开发者提供了更多自由和灵活性,开发者能根据自身需求对模型进行调整和优化,极大地促进了技术社区的交流与创新。 突破外部限制,彰显创新力量近年来,美国在芯片等领域对中国实施出口限制,试图打压中国AI发展。但DeepSeek依然构建出匹敌美国顶尖科技公司的AI模型。OpenAI前高管扎克・卡斯直言,美国的限制未能阻止DeepSeek的进步,资源限制反而激发了中国科研人员的创造力。DeepSeek-R1的发布让怀疑论者重新评估中国的技术发展,也让美国决策者反思通过设置障碍确保领先地位的方法是否可行。 汪阳TMT行业首席分析师Alexwang@sdicsi.com.hk 推荐标的逻辑:AI部署成本降低+运行成本降低,带动AI应用与云服务厂商需求落增加,建议关注:AI应用落地:美图公司1357.HK、汇量科技1860.HK、第四范式6682.HK;基础设施:金山云3896.HK、万国数据9698.HK 王婷TMT行业分析师Tinawang@sdicsi.com.hk 风险提示:地缘政治风险、技术迭代带来需求和供给变化风险等。 杨怡然TMT与消费行业分析师Laurayang@sdicsi.com.hk 1.DeepSeek的核心特点 DeepSeek(深度求索)脱胎于幻方量化,后者作为中国顶尖的量化投资机构,早期储备了大量GPU算力资源(如10,000块英伟达A100芯片,消息来源“暗涌”公开资料),这为其大模型研发提供了硬件基础。 在2024年12月26日,Deepseek就发布V3产品,其仅用2.788M H800GPU小时、557万美元的训练成本,就达到与GPT-4o(训练成本1亿美元)和ClaudeSonnet3.5等顶尖模型相当的性能,颠覆了人们对大模型训练需要巨额成本的认知。 2025年1月20日仅仅不到一个月,Deepseek发布R1,性能与OpenAI的o1正式版持平并开源,在ChatbotArena综合榜单上排名第三。公开信息显示,DeepSeek-R1的性能可以与OpenAI的最新模型相媲美,但其API服务的价格却仅为OpenAI的三十分之一。这一极具竞争力的定价策略,可能会改变市场格局,迫使其他AI研发公司重新考虑其定价策略。DeepSeek创造了两个里程碑性质的意义:1.算力成本投入表现出来的性能超出行业认知,用于训练的成本可能大大降低;2.开源路线对大公司闭源路线的底层颠覆。 2.为什么Deepseek的训练成本如此低 DeepSeek的训练成本之所以如此低,主要得益于其在算法、工程优化和开源策略上的多项创新和高效实践。 技术创新与算法优化DeepSeek通过一系列技术创新显著降低了训练成本。例如,其多头潜在注意力机制(MLA)和自研MoE(混合专家)算法,不仅提升了模型的推理效率,还大幅减少了显存占用和计算量。 工程化优化与高效架构设计DeepSeek采用了工程化优化策略,包括对模型架构的全方位创新,如提出新的MLA结构和独创的DeepSeekMoESparse结构。这些优化显著降低了显存占用和计算量,从而进一步降低了训练成本。 3.DeepSeek鼓励开源,全球复刻狂潮反向验证 根据微信公众号信息平权的解读,DeepSeekR1做到了以下几点突破:抛弃PRM/ORM/MCTS,做完全无监督的RL,免除大量标注过程数据;让模型自己探索,就能实现自发的长序列CoT,和自我的反思(AhaMoment,某种RL能力的涌现)。在此之前,业内所有人(包括Deepmind)都认为需要过程reward或标注才能做到这点。 图灵奖得主杨力昆(YannLecun)就DeepSeekR1的成功复刻在社交媒体X上表示“这一次,正是开源对闭源的胜利!”在没有顶级芯片的情况下,以极低成本芯片训出突破性模型的DeepSeek,或将威胁到美国的AI霸权,大模型比拼的不再是动辄千万亿美元的算力战。HuggingFace团队官宣复刻DeepSeekR1所有Pipeline,UC伯克利的团队以30美元成本复刻R1-Zero,港科大团队使用8K样本完成7B模型复刻,结果都十分出色。 资料来源:公众号量子位,国证国际研究 客户服务热线 国内:4008695517 香港:22131888 免责声明 此报告只提供给阁下作参考用途,并非作为或被视为出售或购买或认购证券的邀请或向任何特定人士作出邀请。此报告内所提到的证券可能在某些地区不能出售。此报告所载的资料由国证国际证券(香港)有限公司(国证国际)编写。此报告所载资料的来源皆被国证国际认为可靠。此报告所载的见解,分析,预测,推断和期望都是以这些可靠数据为基础,只是代表观点的表达。国证国际,其母公司和/或附属公司或任何个人不能担保其准确性或完整性。此报告所载的资料、意见及推测反映国证国际于最初发此报告日期当日的判断,可随时更改而毋须另行通知。国证国际,其母公司或任何其附属公司不会对因使用此报告内之材料而引致任何人士的直接或间接或相关之损失负上任何责任。 此报告内所提到的任何投资都可能涉及相当大的风险,若干投资可能不易变卖,而且也可能不适合所有的投资者。此报告中所提到的投资价值或从中获得的收入可能会受汇率影响而波动。过去的表现不能代表未来的业绩。此报告没有把任何投资者的投资目标,财务状况或特殊需求考虑进去。投资者不应仅依靠此报告,而应按照自己的判断作出投资决定。投资者依据此报告的建议而作出任何投资行动前,应咨询专业意见。 国证国际及其高级职员、董事、员工,可能不时地,在相关的法律、规则或规定的许可下(1)持有或买卖此报告中所提到的公司的证券,(2)进行与此报告内容相异的仓盘买卖,(3)与此报告所提到的任何公司存在顾问,投资银行,或其他金融服务业务关系,(4)又或可能已经向此报告所提到的公司提供了大量的建议或投资服务。投资银行或资产管理可能作出与此报告相反投资决定或持有与此报告不同或相反意见。此报告的意见亦可能与销售人员、交易员或其他集团成员专业人员的意见不同或相反。国证国际,其母公司和/或附属公司的一位或多位董事,高级职员和/或员工可能是此报告提到的证券发行人的董事或高级人员。(5)可能涉及此报告所提到的公司的证券进行自营或庄家活动。 此报告对于收件人来说是完全机密的文件。此报告的全部或任何部分均严禁以任何方式再分发予任何人士,尤其(但不限于)此报告及其任何副本均不可被带往或传送至日本、加拿大或美国,或直接或间接分发至美国或任何美国人士(根据1933年美国证券法S规则的解释),国证国际也没有任何意图派发此报告给那些居住在法律或政策不允许派发或发布此报告的地方的人。 收件人应注意国证国际可能会与本报告所提及的股票发行人进行业务往来或不时自行及/或代表其客户持有该等股票的权益。因此,投资者应注意国证国际可能存在影响本报告客观性的利益冲突,而国证国际将不会因此而负上任何责任。 此报告受到版权和资料全面保护。除非获得国证国际的授权,任何人不得以任何目的复制,派发或出版此报告。国证国际保留一切权利。 规范性披露 本研究报告的分析员或其有联系者(参照证监会持牌人守则中的定义)并未担任此报告提到的上市公司的董事或高级职员。本研究报告的分析员或其有联系者(参照证监会持牌人守则中的定义)并未拥有此报告提到的上市公司有关的任何财务权益。国证国际拥有此报告提到的上市公司的财务权益少于1%或完全不拥有该上市公司的财务权益。 公司评级体系 收益评级: 买入—预期未来6个月的投资收益率为15%以上;增持—预期未来6个月的投资收益率为5%至15%;中性—预期未来6个月的投资收益率为-5%至5%;减持—预期未来6个月的投资收益率为-5%至-15%;卖出—预期未来6个月的投资收益率为-15%以下。 国证国际证券(香港)有限公司 地址:香港中环交易广场第一座三十九楼电话:+852-22131000传真:+852-22131010