您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华创证券]:AI+专题系列点评(十七):DeepSeek发布第二代MoE模型,降本增效有望加速AI应用普及 - 发现报告
当前位置:首页/行业研究/报告详情/

AI+专题系列点评(十七):DeepSeek发布第二代MoE模型,降本增效有望加速AI应用普及

信息技术2024-05-14吴鸣远华创证券刘***
AI+专题系列点评(十七):DeepSeek发布第二代MoE模型,降本增效有望加速AI应用普及

证 券 研 究 报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210号 未经许可,禁止转载 行业研究 计算机 2024年05月14日 AI+专题系列点评(十七) 推荐 (维持) DeepSeek发布第二代MoE模型,降本增效 有望加速AI应用普及 事项:  2024年5月6日,幻方量化宣布旗下AI公司 DeepSeek 正式开源第二代 MoE 模型:DeepSeek-V2。该模型能力表现出色,中文综合能力与 GPT-4-Turbo,文心 4.0 等闭源模型处于同一梯队。英文综合能力与LLaMA3-70B 同处第一梯队。其知识、数学、推理、编程能力也位居前列。该模型性价比显著,每百万 tokens 输入 1 元、输出 2 元(32K 上下文),价格仅为 GPT-4-Turbo 的近百分之一 。其价格的降低有望吸引更多开发者和企业的入局,加速AIGC应用的落地和推广。 评论:  大模型主流榜单中DeepSeek-V2各项均表现出色: DeepSeek-V2在中文综合能力评测(AlignBench)中位列开源模型之首,并与GPT-4-Turbo、文心4.0等闭源模型同处第一梯队。在英文综合能力评测(MT-Bench)中,它与LLaMA3-70B并列第一,超过了Mixtral 8x22B。它在知识、数学、推理、编程等评测中也排名靠前,并支持128K上下文窗口。  DeepSeek API调用成本大幅压缩: DeepSeek-V2 采用 MoE 架构,成本大幅降低。其 API 定价远低于 GPT-4-Turbo,仅为 GPT-4-Turbo 的近百分之一。DeepSeek-V2 在中文能力评测中表现出色,位于全球模型的第一梯队,同时具备极高的性价比。  模型结构创新,大幅减少计算量和推理显存:DeepSeek-V2 不采用传统的 Dense 或 Sparse 结构,而是创新性地提出了 MLA(Multi-head Latent Attention)架构,并结合自研的 Sparse 结构 DeepSeekMoE,显著降低了计算量和推理显存需求。以 236B 总参数和 21B 激活参数,实现了相当于 70B-110B Dense 模型的性能,同时显存消耗仅为同级别 Dense 模型的 1/5 至 1/100。在实际部署中,DeepSeek-V2 在 8 卡 H800 机器上,每秒输入吞吐量超过 10 万 tokens,输出超过 5 万 tokens。  投资建议:AI大模型本质应落脚垂类应用,国内大模型正快速追赶美国先进水平,中文大模型的突破有望为下游AI应用注入新的活力,看好AI+应用产品力与商业化落地进程。建议关注以下标的:AI+应用侧:1)安全:永信至诚、深信服;2)办公:金山办公、福昕软件;3)法律:金桥信息、华宇软件、通达海;4)医疗:润达医疗;5)教育:佳发教育、欧玛软件、新开普;6)金融:同花顺、新致软件;7)邮箱:彩讯股份;8)传媒:掌阅科技、华策影视;9)数据:海天瑞声;10)电商:焦点科技;11)OA:致远互联、泛微网络;12)ERP:用友网络、金蝶国际。算力侧:1)算力基础:润泽科技、亚康股份、海光信息、寒武纪、龙芯中科;2)服务器:中科曙光、浪潮信息、紫光股份、神州数码、拓维信息。  风险提示:商业化后表现不及预期,用户付费意愿低,行业技术迭代速度较快。 证券分析师:吴鸣远 邮箱:wumingyuan@hcyjs.com 执业编号:S0360523040001 联系人:张宇凡 邮箱:zhangyufan1@hcyjs.com 行业基本数据 占比% 股票家数(只) 333 0.04 总市值(亿元) 33,268.43 3.70 流通市值(亿元) 28,768.33 4.08 相对指数表现 % 1M 6M 12M 绝对表现 -1.1% -21.4% -27.0% 相对表现 -6.5% -23.7% -20.0% 相关研究报告 《计算机行业2024年Q1基金持仓分析:基金持仓处于相对低位,环比变动幅度较大》 2024-05-13 《计算机行业周报(20240506-20240510):量子信息:光子的分数量子反常霍尔态国际上首次实现》 2024-05-12 《卫星互联网行业点评:商业航天产业提速,打造经济新增长点》 2024-05-11 -41%-21%-1%18%23/0523/0723/1023/1224/0224/052023-05-15~2024-05-13计算机沪深300华创证券研究所 AI+专题系列点评(十七) 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210号 2 目 录 一、DeepSeek-V2降本增效综合性能优异 ..................................................................... 4 (一)大模型主流榜单中DeepSeek-V2各项均表现出色 ............................................. 4 (二)DeepSeek API调用成本大幅压缩 ......................................................................... 4 (三)模型结构创新,大幅减少计算量和推理显存 ..................................................... 6 AI+专题系列点评(十七) 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210号 3 图表目录 图表 1 各大模型API或Chat版本效果对比 ....................................................................... 4 图表 2 不同大模型API价格对比 ......................................................................................... 5 图表 3 不同大模型的中文能力和API价格对比 ................................................................. 5 图表 4 DeepSeek的训练费用和推理效率 ............................................................................ 6 AI+专题系列点评(十七) 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210号 4 一、DeepSeek-V2降本增效综合性能优异 (一)大模型主流榜单中DeepSeek-V2各项均表现出色 DeepSeek-V2中文综合能力(AlignBench)开源模型中最强,与GPT-4-Turbo,文心4.0等闭源模型在评测中处于同一梯队。英文综合能力(MT-Bench)与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral 8x22B,在知识、数学、推理、编程等榜单结果也位居前列。此外其支持128K上下文窗口。 (二)DeepSeek API调用成本大幅压缩 DeepSeek-V2 采用MoE架构,成本大幅优化。DeepSeek-V2 API 的定价为每百万 tokens 输入 1 元、输出 2 元(32K 上下文),而 GPT4-Turbo API 的定价为每百万输入 72 元、输出 217 元,DeepSeek-V2 价格仅为 GPT-4-Turbo 的近百分之一。就中文能力来看, DeepSeek-V2 在全球模型中性能处于第一档的位置,而成本是最低的,突出其性价比优势。 图表 1 各大模型API或Chat版本效果对比 资料来源:DeepSeek公众号 AI+专题系列点评(十七) 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210号 5 图表 2 不同大模型API价格对比 资料来源: DeepSeek公众号 图表 3 不同大模型的中文能力和API价格对比 资料来源: DeepSeek公众号 AI+专题系列点评(十七) 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210号 6 (三)模型结构创新,大幅减少计算量和推理显存 DeepSeek-V2没有沿用主流的“类LLaMA的Dense结构”和“类Mistral的Sparse结构”,而是对模型框架进行了全方位的创新,提出了媲美MHA的MLA(Multi-head Latent Attention)架构,大幅减少计算量和推理显存;自研Sparse结构DeepSeekMoE进一步将计算量降低到极致,两者结合最终实现模型性能跨级别的提升。根据DeepSeek估计,DeepSeek-V2以236B总参数、21B激活,大致达到70B~110B Dense的模型能力,同时消耗的显存(KV Cache)只有同级别Dense模型的1/5~1/100,每token成本大幅降低。实际部署在8卡H800机器上,输入吞吐量超过每秒10万tokens,输出超过每秒5万tokens。 图表 4 DeepSeek的训练费用和推理效率 资料来源: 魔搭 ModelScope 社区DeepSeek-V2-Chat AI+专题系列点评(十七) 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210号 7 计算机组团队介绍 首席研究员、组长:吴鸣远 上海交通大学硕士,曾任职于东方证券、兴业证券研究所,所在团队于2020—2022年连续三年获得新财富最佳分析师第三名,2023年加入华创证券研究所。 研究员:胡昕安 工学硕士,曾任职于海康威视,2023年加入华创证券研究所。 助理研究员:梁佳 上海财经大学经济学硕士,2022年加入华创证券研究所。 助理研究员:张宇凡 香港大学会计学硕士。2023年加入华创证券研究所。 助理研究员:周楚薇 香港中文大学经济学硕士。2024年加入华创证券研究所。 AI+专题系列点评(十七) 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210号 8 华创证券机构销售通讯录 地区 姓名 职务 办公电话 企业邮箱 北京机构销售部 张昱洁 副总经理、北京机构销售总监 010-63214682 zhangyujie@hcyjs.com 张菲菲 北京机构副总监 010-63214682 zhangfeifei@hcyjs.com 刘懿 副总监 010-63214682 liuyi@hcyjs.com 侯春钰 资深销售经理 010-63214682 houchunyu@hcyjs.com 过云龙 高级销售经理 010-63214682 guoyunlong@hcyjs.com 蔡依林 资深销售经理 010-66500808 caiyilin@hcyjs.com 刘颖 资深销售经理 010-66500821 liuying5@hcyjs.com 顾翎蓝 资深销售经理 010-63214682 gulinglan@hcyjs.com 车一哲 销售经理 cheyizhe@hcyjs.com 深圳机构销售部 张娟 副总经理、深圳机构销售总监 0755-82828570 zhangjuan@hcyjs.com 汪丽燕 高级销售经理 0755-83715428 wangliyan@hcyjs.com 张嘉慧 高级销售经理 0755-8