您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[平安证券]:AI动态跟踪系列(四):DeepSeek引发广泛关注,大模型应用落地将加速 - 发现报告
当前位置:首页/行业研究/报告详情/

AI动态跟踪系列(四):DeepSeek引发广泛关注,大模型应用落地将加速

信息技术2025-02-06闫磊、付强、黄韦涵、王佳一平安证券S***
AI智能总结
查看更多
AI动态跟踪系列(四):DeepSeek引发广泛关注,大模型应用落地将加速

AI动态跟踪系列(四) 计算机 2025年02月06日 DeepSeek引发广泛关注,大模型应用落地将加速 强于大市(维持) 行情走势图 相关研究报告 【平安证券】行业动态跟踪报告*计算机*AI动态跟踪系列(三):复杂推理大模型OpenAIo1亮相,数学与代码能力飞跃*强于大市20240914 【平安证券】行业动态跟踪报告*计算机*AI动态跟踪 系列(二):英伟达GTC2024AI软件与应用有哪些看点?*强于大市20240327 【平安证券】行业动态跟踪报告*计算机*AI动态跟踪系列(一):Duolingo4Q23业绩超预期,持续关注AI+教育应用前景*强于大市20240305 证券分析师 闫磊投资咨询资格编号 S1060517070006 YANLEI511@pingan.com.cn 付强投资咨询资格编号 S1060520070001 FUQIANG021@pingan.com.cn 黄韦涵投资咨询资格编号 S1060523070003 HUANGWEIHAN235@pingan.com.cn 研究助理 王佳一一般证券从业资格编号 S1060123070023 WANGJIAYI446@pingan.com.cn 平安观点: DeepSeek-V3和DeepSeek-R1陆续发布,国产大模型能力已可比肩海外领军大模型。2024年12月26日,杭州AI公司深度求索(DeepSeek) 正式发布DeepSeek-V3大模型首个版本并同步开源。根据DeepSeek网站信息,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8Ttokens上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet相当。在训练成本方面,根据DeepSeek发布的技术文档论文信息,DeepSeek-V3的训练时长为2788K个H800GPU小时,训练花费约为557.6万美元。2025年1月20日,DeepSeek正式发布复杂推理类大模型DeepSeek-R1,性能对齐OpenAIo1正式版。以DeepSeek系列大模型为代表的国产大模型性能已可比肩海外领军大模型,且成本更低。 DeepSeek系列大模型引发全球广泛关注,海内外巨头科技公司及云服务平台厂商已相继接入。2025年1月15日,DeepSeek推出AI助手 DeepSeekApp。2025年春节期间,DeepSeek系列大模型火爆出圈,引发全球广泛关注。根据新浪财经2月1日引用彭博社信息,DeepSeek的AI助手在140个市场中成为下载量最多的移动应用。根据Appfigures的数据,DeepSeek的推理人工智能聊天机器人在1月26日登上苹果公司AppStore的榜首,并自那时以来一直保持全球第一的位置。同时,全球也开始了对DeepSeek大模型的复刻。以港科大团队为例,港科大助理教授何俊贤的团队,只用了8K个样本,就在7B模型上复刻出了DeepSeek-R1-Zero和DeepSeek-R1的训练。当前,海内外巨头科技公司及云服务平台厂商已相继接入了DeepSeek大模型,部分AI应用领域相关企业也已开始了DeepSeek大模型的部署和应用。DeepSeek大模型获得了全球的广泛关注,认可度持续提升。我们认为,DeepSeek大模型的开源、低成本和高性能将大幅降低大模型的获得、部署和应用成本,将加快大模型在B端和C端应用场景的落地。另外,DeepSeek大模型的出圈将对全球大模型产业的竞争格局产生重要影响,将对海外领军大模型厂商的领先性产生冲击,并同时将对算力的未来发展产生重要影响。 DeepSeek大模型的出圈预计不改算力整体需求向上的态势,但推理和端侧算力有望增长更快。DeepSeek在算法效率和计算成本方面有着较大的优势,短期内可能对训练算力的增长有一定的平抑效应,但是不改AI算 力整体需求长期上升的态势。AI作为全球智能化发展的主要抓手,大模型当前已应用于端侧、教育、金融、办公、传媒、医疗、智能汽车、企业服务等多个应用场景,应用领域广阔。DeepSeek低成本而且开源的解决方案,大幅降低了AI在各行各业应用的技术和成本门槛,为AI的产业化落 行业报 告 行业动态跟踪报 告 证券研究报告 地提供了更快的路径。推理和端侧的算力需求增长潜力非常大。同时,较低训练成本以及开源的DeepSeek,有望带来更低的大模型开发和使用门槛,基于该大模型开发的主体可能更多,也一定程度上为训练算力需求提供了支撑。DeepSeek并不是压缩了算力市场,反而为算力市场增加了更多的想象空间。DeepSeek也在积极与国产AI算力平台合作。DeepSeek大模型与国产AI芯片适配的逐步成熟,将加快推动国产AI芯片在国内大模型训练端和推理端的应用,加快国产AI芯片产业链的成熟,为国产AI芯片产业带来发展机遇,同时加快我国大模型产业的发展。 投资建议:DeepSeek-V3和DeepSeek-R1等DeepSeek系列大模型的陆续发布,表明国产大模型能力已可比肩海外领军大模型。我们认为,DeepSeek大模型的开源、低成本和高性能将大幅降低大模型的获得、部署和应用成本,将加快大模型在B 端和C端应用场景的落地。DeepSeek大模型的出圈,短期内可能对训练算力的增长有一定的平抑效应,但预计不改算力整体需求向上的态势,而且推理和端侧算力有望增长更快。DeepSeek大模型与国产AI芯片适配的逐步成熟,将加快推动国产AI芯片在国内大模型训练端和推理端的应用,加快国产AI芯片产业链的成熟,为国产AI芯片产业带来发展机遇,同时加快我国大模型产业的发展。我们坚定看好AI主题的投资机会,标的方面:1)国产算力基础设施方面,推荐浪潮信息、中科曙光、紫光股份、神州数码、海光信息、龙芯中科,建议关注寒武纪、景嘉微、软通动力、华勤技术;2)端侧算力方面,推荐恒玄科技、兆易创新,关注乐鑫科技、瑞芯微;3)算法方面,推荐科大讯飞;4)应用场景方面,强烈推荐中科创达、恒生电子、盛视科技,推荐金山办公、德赛西威、万兴科技、福昕软件,建议关注同花顺、拓尔思、彩讯股份、卫宁健康。 风险提示:1)AI算力供应链风险上升。2)国产大模型算法发展可能不及预期。3)大模型产品的应用落地低于预期。 一、DeepSeek-V3和DeepSeek-R1陆续发布,国产大模型能力已可比肩海外领军大模型 DeepSeek-V3 2024年12月26日,杭州AI公司深度求索(DeepSeek)正式发布DeepSeek-V3大模型首个版本并同步开源。根据DeepSeek网站信息,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8Ttokens上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet相当。具体而言: 百科知识方面:DeepSeek-V3在知识类任务(MMLU,MMLU-Pro,GPQA,SimpleQA)上的水平相比前代 DeepSeek-V2.5明显提升,接近当前表现最好的模型Claude-3.5-Sonnet-1022。 长文本方面:在长文本测评中,DROP、FRAMES和LongBenchv2上,DeepSeek-V3平均表现超越其他模型。 代码方面:DeepSeek-V3在算法类代码场景(Codeforces),远远领先于市面上已有的全部非o1类模型;并在工程类代码场景(SWE-BenchVerified)逼近Claude-3.5-Sonnet-1022。 数学:在美国数学竞赛(AIME2024,MATH)和全国高中数学联赛(CNMO2024)上,DeepSeek-V3大幅超过了所有开源闭源模型。 中文能力方面:DeepSeek-V3与Qwen2.5-72B在教育类测评C-Eval和代词消歧等评测集上表现相近,但在事实知识C-SimpleQA上更为领先。 图表1DeepSeek-V3大模型与海外领军开闭源大模型的测试比较 资料来源:DeepSeek官网,平安证券研究所 DeepSeek-V3生成Tokens的速度跳跃式提升。根据DeepSeek官网信息,通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS(TokensPerSecond,每秒生成Tokens)大幅提高至60TPS,相比V2.5模型实现了3倍的提升,可以为用户带来更加迅速流畅的使用体验。 在训练成本方面,根据DeepSeek发布的技术文档论文信息,DeepSeek-V3的训练时长为2788K个H800GPU小时,训练花费约为557.6万美元。根据IT之家消息,Meta训练其4050亿参数模型Llama3,在16384块H100GPU训练集群上训练了54天,训练时长约为21,234K个H100GPU小时。以此估算,即使不考虑Llama3.1相比Llama3因为模型能力更强而可能需要的更长的训练时间,也不考虑H100相比H800有更高的性能,DeepSeek-V3的训练时长仅为同水平大模型(Llama3.1)的约13%,训练成本大幅下降。 图表2DeepSeek-V3的训练时长为2788K个H800GPU小时 资料来源:DeepSeek官网,《DeepSeek-V3TechnicalReport》,平安证券研究所注:图表中训练花费金额的计算是假设H800的租赁价格是每小时2美元 DeepSeek-V3的API服务价格更具性价比。随着性能更强、速度更快的DeepSeek-V3更新上线,DeepSeek将V2.5的模型API服务定价调整提高为每百万输入tokens0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens8元。这个价格的提升将在2025年2月8日24:00之后生效。在此之前,属于新模型的优惠价格体验期,价格仍会是之前的每百万 输入tokens0.1元(缓存命中)/1元(缓存未命中),每百万输出tokens2元。在2025年2月8日之前,已经注册的老用户和在此期间内注册的新用户均可享受这个优惠价格。相比而言,GPT-4o的API价格为每百万输入tokens1.25美元 (缓存命中)/2.50美元(缓存未命中),每百万输出tokens10美元。即使是调整之后的价格,DeepSeek-v3的API服务价格也大幅低于GPT-4o的价格。在相当的性能下,DeepSeek-V3的API服务价格更具性价比。 图表3DeepSeek-V3的API服务价格更具性价比 资料来源:DeepSeek官网,平安证券研究所 注:图表是表示大模型MMLUReduxZeroEval得分vs输入API价格(元/1MTokens) DeepSeek-R1 2025年1月20日,即DeepSeek-V3正式发布之后不到1个月,也即OpenAIo1正式版推出(推出时间为2024年12月 6日)之后不到2个月,DeepSeek正式发布复杂推理模型DeepSeek-R1并同步开源模型权重。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。 图表4DeepSeek-R1性能比肩OpenAIo1正式版 资料来源:DeepSeek官网,平安证券研究所 另外,DeepSeek在开源DeepSeek-R1-Zero和DeepSeek-R1这两个660B模型的同时,通过DeepSeek-R1的输出,蒸馏了6个小模型开源给社区,其中32B和70B模型在多项能力上实现了对标OpenAIo1-mini的效果。 图表5De