您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[天风证券]:从长文本到低成本,重申全面看多AI应用 - 发现报告
当前位置:首页/行业研究/报告详情/

从长文本到低成本,重申全面看多AI应用

信息技术2024-05-12缪欣君天风证券文***
从长文本到低成本,重申全面看多AI应用

行业报告 | 行业点评 请务必阅读正文之后的信息披露和免责申明 1 计算机 证券研究报告 2024年05月12日 投资评级 行业评级 强于大市(维持评级) 上次评级 强于大市 作者 缪欣君 分析师 SAC执业证书编号:S1110517080003 miaoxinjun@tfzq.com 刘鉴 联系人 liujianb@tfzq.com 资料来源:聚源数据 相关报告 1 《计算机-行业点评:计算机板块2024Q1业绩分析:出海/SaaS/AI硬件表现优异》 2024-05-10 2 《计算机-行业点评:国产算力板块景气度有望再上一个台阶》 2024-04-30 3 《计算机-行业深度研究:量子加密,一片新蓝海》 2024-04-29 行业走势图 从长文本到低成本,重申全面看多AI应用 幻方AI发布了Deepseek V2模型,在模型性能一流的同时达到极低的价格,性价比凸显 5月6日幻方发布了第二代MOE模型DeepSeek-V2。目前在大模型主流榜单中,DeepSeek-V2均表现出色,中文综合能力(AlignBench)开源模型中最强,与GPT-4-Turbo,文心4.0等闭源模型在评测中处于同一梯队,英文综合能力(MT-Bench)与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral 8x22B,知识、数学、推理、编程等榜单结果也位居前列。同时,DeepSeek-V2 API的定价处于极低的价格:32K上下文每百万tokens输入1元、输出2元,价格仅为GPT-4-Turbo的近百分之一,仅为同属于MoE架构的abab-6.5s模型的1/5,就中文能力来看,DeepSeek-V2在全球模型中处于第一档的位置,但其成本却是最低。 双重架构创新驱动极低训练与推理成本大幅降低 Deepseek-V2模型在模型架构上进行了全方位的创新,使用MLA(Multi-head Latent Attention)和DeepSeekMoE优化了Transformer架构中的Attention与FFN。为缓解键值缓存带来的推理效率下降问题,公司提出了MLA使用低秩键值联合压缩的方式,显著降低KV缓存;在FFN上,公司使用了DeepSeekMoE,采用了细颗粒度的专家分割与共享专家隔离,提高了专家的潜力,相较于Gshard等传统MoE架构,新提出的架构优势较大。在训练过程中,公司使用了约8.1T tokens的训练语料库,随后使用收集的150万对话对大模型进行监督微调,同时采用GRPO,使模型进一步与人类偏好保持对齐。最终,模型在取得了良好效果的同时,训练成本与推理成本大幅降低,相较于DeepSeek 67B模型,V2模型节省了42.5%的训练成本与93.3%的KV缓存,最大生成吞吐量提升至5.76倍。 大模型低成本进程加快,应用有望达到更好盈利水平,全面看多AI应用 降本是实现大模型规模化商业应用的关键,DeepSeek-V2模型通过架构创新,实现了大模型成本尤其是推理成本的显著下降。A16Z的合伙人Martin Casado在演讲中指出,历史上芯片和互联网都曾发生两次边际成本大幅下降,而发生的平台转移和行业革命的案例,随着大模型的成本下降甚至边际成本降到了零后,AI革命即将开始,而每一轮科技革命,从PC互联网到移动互联网都是应用赚最多的钱,因此我们认为以DeepSeek-V2为代表的大模型成本迅速下降,有望全面带动AI应用的发展。 建议关注: (1)办公软件:金山办公、福昕软件;(2)多模态:万兴科技、美图公司(与海外团队联合覆盖)、虹软科技、光云科技;(3)金融、法律:同花顺、恒生电子、通达海、新致软件;(4)B端应用:金蝶国际、泛微网络、用友网络、致远互联、鼎捷软件、汉得信息;(5)算力:华为链+国产AI芯片四小龙 风险提示:应用推广节奏不及预期、国产算力进展不及预期、大模型发展历程不及预期 -40%-32%-24%-16%-8%0%8%2023-052023-092024-01计算机沪深300 行业报告 | 行业点评 请务必阅读正文之后的信息披露和免责申明 2 图1:各大模型API性能对比 资料来源:幻方AI公众号,天风证券研究所 图2:经过强化学习后的Deepseek-V2模型在MMLU测试集得分接近LLAMA3 70B Inst. 资料来源:《DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model》(作者为DeepSeek-AI),天风证券研究所 行业报告 | 行业点评 请务必阅读正文之后的信息披露和免责申明 3 图3:DeepSeek-V2模型在中文能力达到第一梯队的同时成本最低 资料来源:Deepseek Chat官网,天风证券研究所 图4:DeepSeek-v2模型在Attention和FFN上进行了结构创新 资料来源:《DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model》(作者为DeepSeek-AI),天风证券研究所 行业报告 | 行业点评 请务必阅读正文之后的信息披露和免责申明 4 图5:MLA在推理过程中显著降低了KV cashe 资料来源:《DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model》(作者为DeepSeek-AI),天风证券研究所 图6:MLA在降低KV Cache的时候维持了模型的高性能 资料来源:《DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model》(作者为DeepSeek-AI),天风证券研究所 行业报告 | 行业点评 请务必阅读正文之后的信息披露和免责申明 5 分析师声明 本报告署名分析师在此声明:我们具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,本报告所表述的所有观点均准确地反映了我们对标的证券和发行人的个人看法。我们所得报酬的任何部分不曾与,不与,也将不会与本报告中的具体投资建议或观点有直接或间接联系。 一般声明 除非另有规定,本报告中的所有材料版权均属天风证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)及其附属机构(以下统称“天风证券”)。未经天风证券事先书面授权,不得以任何方式修改、发送或者复制本报告及其所包含的材料、内容。所有本报告中使用的商标、服务标识及标记均为天风证券的商标、服务标识及标记。 本报告是机密的,仅供我们的客户使用,天风证券不因收件人收到本报告而视其为天风证券的客户。本报告中的信息均来源于我们认为可靠的已公开资料,但天风证券对这些信息的准确性及完整性不作任何保证。本报告中的信息、意见等均仅供客户参考,不构成所述证券买卖的出价或征价邀请或要约。该等信息、意见并未考虑到获取本报告人员的具体投资目的、财务状况以及特定需求,在任何时候均不构成对任何人的个人推荐。客户应当对本报告中的信息和意见进行独立评估,并应同时考量各自的投资目的、财务状况和特定需求,必要时就法律、商业、财务、税收等方面咨询专家的意见。对依据或者使用本报告所造成的一切后果,天风证券及/或其关联人员均不承担任何法律责任。 本报告所载的意见、评估及预测仅为本报告出具日的观点和判断。该等意见、评估及预测无需通知即可随时更改。过往的表现亦不应作为日后表现的预示和担保。在不同时期,天风证券可能会发出与本报告所载意见、评估及预测不一致的研究报告。 天风证券的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本报告意见及建议不一致的市场评论和/或交易观点。天风证券没有将此意见及建议向报告所有接收者进行更新的义务。天风证券的资产管理部门、自营部门以及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策。 特别声明 在法律许可的情况下,天风证券可能会持有本报告中提及公司所发行的证券并进行交易,也可能为这些公司提供或争取提供投资银行、财务顾问和金融产品等各种金融服务。因此,投资者应当考虑到天风证券及/或其相关人员可能存在影响本报告观点客观性的潜在利益冲突,投资者请勿将本报告视为投资或其他决定的唯一参考依据。 投资评级声明 类别 说明 评级 体系 股票投资评级 自报告日后的6个月内,相对同期沪 深300指数的涨跌幅 行业投资评级 自报告日后的6个月内,相对同期沪 深300指数的涨跌幅 买入 预期股价相对收益20%以上 增持 预期股价相对收益10%-20% 持有 预期股价相对收益-10%-10% 卖出 预期股价相对收益-10%以下 强于大市 预期行业指数涨幅5%以上 中性 预期行业指数涨幅-5%-5% 弱于大市 预期行业指数涨幅-5%以下 天风证券研究 北京 海口 上海 深圳 北京市西城区德胜国际中心B座11层 邮编:100088 邮箱:research@tfzq.com 海南省海口市美兰区国兴大道3号互联网金融大厦 A栋23层2301房 邮编:570102 电话:(0898)-65365390 邮箱:research@tfzq.com 上海市虹口区北外滩国际 客运中心6号楼4层 邮编:200086 电话:(8621)-65055515 传真:(8621)-61069806 邮箱:research@tfzq.com 深圳市福田区益田路5033号 平安金融中心71楼 邮编:518000 电话:(86755)-23915663 传真:(86755)-82571995 邮箱:research@tfzq.com