热门搜索：

AI+专题系列点评（十七）：DeepSeek发布第二代MoE模型，降本增效有望加速AI应用普及

信息技术2024-05-14吴鸣远华创证券刘***

证券研究报告证监会审核华创证券投资咨询业务资格批文号：证监许可（2009）1210号未经许可，禁止转载行业研究计算机 2024年05月14日 AI+专题系列点评（十七）推荐（维持） DeepSeek发布第二代MoE模型，降本增效有望加速AI应用普及事项：  2024年5月6日，幻方量化宣布旗下AI公司 DeepSeek 正式开源第二代 MoE 模型：DeepSeek-V2。该模型能力表现出色，中文综合能力与 GPT-4-Turbo，文心 4.0 等闭源模型处于同一梯队。英文综合能力与LLaMA3-70B 同处第一梯队。其知识、数学、推理、编程能力也位居前列。该模型性价比显著，每百万 tokens 输入 1 元、输出 2 元（32K 上下文），价格仅为 GPT-4-Turbo 的近百分之一。其价格的降低有望吸引更多开发者和企业的入局，加速AIGC应用的落地和推广。评论：  大模型主流榜单中DeepSeek-V2各项均表现出色： DeepSeek-V2在中文综合能力评测（AlignBench）中位列开源模型之首，并与GPT-4-Turbo、文心4.0等闭源模型同处第一梯队。在英文综合能力评测（MT-Bench）中，它与LLaMA3-70B并列第一，超过了Mixtral 8x22B。它在知识、数学、推理、编程等评测中也排名靠前，并支持128K上下文窗口。  DeepSeek API调用成本大幅压缩： DeepSeek-V2 采用 MoE 架构，成本大幅降低。其 API 定价远低于 GPT-4-Turbo，仅为 GPT-4-Turbo 的近百分之一。DeepSeek-V2 在中文能力评测中表现出色，位于全球模型的第一梯队，同时具备极高的性价比。  模型结构创新，大幅减少计算量和推理显存：DeepSeek-V2 不采用传统的 Dense 或 Sparse 结构，而是创新性地提出了 MLA（Multi-head Latent Attention）架构，并结合自研的 Sparse 结构 DeepSeekMoE，显著降低了计算量和推理显存需求。以 236B 总参数和 21B 激活参数，实现了相当于 70B-110B Dense 模型的性能，同时显存消耗仅为同级别 Dense 模型的 1/5 至 1/100。在实际部署中，DeepSeek-V2 在 8 卡 H800 机器上，每秒输入吞吐量超过 10 万 tokens，输出超过 5 万 tokens。  投资建议：AI大模型本质应落脚垂类应用，国内大模型正快速追赶美国先进水平，中文大模型的突破有望为下游AI应用注入新的活力，看好AI+应用产品力与商业化落地进程。建议关注以下标的：AI+应用侧：1）安全：永信至诚、深信服；2）办公：金山办公、福昕软件；3）法律：金桥信息、华宇软件、通达海；4）医疗：润达医疗；5）教育：佳发教育、欧玛软件、新开普；6）金融：同花顺、新致软件；7）邮箱：彩讯股份；8）传媒：掌阅科技、华策影视；9）数据：海天瑞声；10）电商：焦点科技；11）OA：致远互联、泛微网络；12）ERP：用友网络、金蝶国际。算力侧：1）算力基础：润泽科技、亚康股份、海光信息、寒武纪、龙芯中科；2）服务器：中科曙光、浪潮信息、紫光股份、神州数码、拓维信息。  风险提示：商业化后表现不及预期，用户付费意愿低，行业技术迭代速度较快。证券分析师：吴鸣远邮箱：wumingyuan@hcyjs.com 执业编号：S0360523040001 联系人：张宇凡邮箱：zhangyufan1@hcyjs.com 行业基本数据占比% 股票家数(只) 333 0.04 总市值(亿元) 33,268.43 3.70 流通市值(亿元) 28,768.33 4.08 相对指数表现 % 1M 6M 12M 绝对表现 -1.1% -21.4% -27.0% 相对表现 -6.5% -23.7% -20.0% 相关研究报告《计算机行业2024年Q1基金持仓分析：基金持仓处于相对低位，环比变动幅度较大》 2024-05-13 《计算机行业周报（20240506-20240510）：量子信息：光子的分数量子反常霍尔态国际上首次实现》 2024-05-12 《卫星互联网行业点评：商业航天产业提速，打造经济新增长点》 2024-05-11 -41%-21%-1%18%23/0523/0723/1023/1224/0224/052023-05-15~2024-05-13计算机沪深300华创证券研究所 AI+专题系列点评（十七）证监会审核华创证券投资咨询业务资格批文号：证监许可（2009）1210号 2 目录一、DeepSeek-V2降本增效综合性能优异 ..................................................................... 4 （一）大模型主流榜单中DeepSeek-V2各项均表现出色 ............................................. 4 （二）DeepSeek API调用成本大幅压缩 ......................................................................... 4 （三）模型结构创新，大幅减少计算量和推理显存 ..................................................... 6 AI+专题系列点评（十七）证监会审核华创证券投资咨询业务资格批文号：证监许可（2009）1210号 3 图表目录图表 1 各大模型API或Chat版本效果对比 ....................................................................... 4 图表 2 不同大模型API价格对比 ......................................................................................... 5 图表 3 不同大模型的中文能力和API价格对比 ................................................................. 5 图表 4 DeepSeek的训练费用和推理效率 ............................................................................ 6 AI+专题系列点评（十七）证监会审核华创证券投资咨询业务资格批文号：证监许可（2009）1210号 4 一、DeepSeek-V2降本增效综合性能优异（一）大模型主流榜单中DeepSeek-V2各项均表现出色 DeepSeek-V2中文综合能力（AlignBench）开源模型中最强，与GPT-4-Turbo，文心4.0等闭源模型在评测中处于同一梯队。英文综合能力（MT-Bench）与最强的开源模型LLaMA3-70B同处第一梯队，超过最强MoE开源模型Mixtral 8x22B，在知识、数学、推理、编程等榜单结果也位居前列。此外其支持128K上下文窗口。（二）DeepSeek API调用成本大幅压缩 DeepSeek-V2 采用MoE架构，成本大幅优化。DeepSeek-V2 API 的定价为每百万 tokens 输入 1 元、输出 2 元（32K 上下文），而 GPT4-Turbo API 的定价为每百万输入 72 元、输出 217 元，DeepSeek-V2 价格仅为 GPT-4-Turbo 的近百分之一。就中文能力来看， DeepSeek-V2 在全球模型中性能处于第一档的位置，而成本是最低的，突出其性价比优势。图表 1 各大模型API或Chat版本效果对比资料来源：DeepSeek公众号 AI+专题系列点评（十七）证监会审核华创证券投资咨询业务资格批文号：证监许可（2009）1210号 5 图表 2 不同大模型API价格对比资料来源： DeepSeek公众号图表 3 不同大模型的中文能力和API价格对比资料来源： DeepSeek公众号 AI+专题系列点评（十七）证监会审核华创证券投资咨询业务资格批文号：证监许可（2009）1210号 6 （三）模型结构创新，大幅减少计算量和推理显存 DeepSeek-V2没有沿用主流的“类LLaMA的Dense结构”和“类Mistral的Sparse结构”，而是对模型框架进行了全方位的创新，提出了媲美MHA的MLA（Multi-head Latent Attention）架构，大幅减少计算量和推理显存；自研Sparse结构DeepSeekMoE进一步将计算量降低到极致，两者结合最终实现模型性能跨级别的提升。根据DeepSeek估计，DeepSeek-V2以236B总参数、21B激活，大致达到70B~110B Dense的模型能力，同时消耗的显存（KV Cache）只有同级别Dense模型的1/5~1/100，每token成本大幅降低。实际部署在8卡H800机器上，输入吞吐量超过每秒10万tokens，输出超过每秒5万tokens。图表 4 DeepSeek的训练费用和推理效率资料来源：魔搭 ModelScope 社区DeepSeek-V2-Chat AI+专题系列点评（十七）证监会审核华创证券投资咨询业务资格批文号：证监许可（2009）1210号 7 计算机组团队介绍首席研究员、组长：吴鸣远上海交通大学硕士，曾任职于东方证券、兴业证券研究所，所在团队于2020—2022年连续三年获得新财富最佳分析师第三名，2023年加入华创证券研究所。研究员：胡昕安工学硕士，曾任职于海康威视，2023年加入华创证券研究所。助理研究员：梁佳上海财经大学经济学硕士，2022年加入华创证券研究所。助理研究员：张宇凡香港大学会计学硕士。2023年加入华创证券研究所。助理研究员：周楚薇香港中文大学经济学硕士。2024年加入华创证券研究所。 AI+专题系列点评（十七）证监会审核华创证券投资咨询业务资格批文号：证监许可（2009）1210号 8 华创证券机构销售通讯录地区姓名职务办公电话企业邮箱北京机构销售部张昱洁副总经理、北京机构销售总监 010-63214682 zhangyujie@hcyjs.com 张菲菲北京机构副总监 010-63214682 zhangfeifei@hcyjs.com 刘懿副总监 010-63214682 liuyi@hcyjs.com 侯春钰资深销售经理 010-63214682 houchunyu@hcyjs.com 过云龙高级销售经理 010-63214682 guoyunlong@hcyjs.com 蔡依林资深销售经理 010-66500808 caiyilin@hcyjs.com 刘颖资深销售经理 010-66500821 liuying5@hcyjs.com 顾翎蓝资深销售经理 010-63214682 gulinglan@hcyjs.com 车一哲销售经理 cheyizhe@hcyjs.com 深圳机构销售部张娟副总经理、深圳机构销售总监 0755-82828570 zhangjuan@hcyjs.com 汪丽燕高级销售经理 0755-83715428 wangliyan@hcyjs.com 张嘉慧高级销售经理 0755-8

点击免费查看完整报告

你可能感兴趣

AI+专题系列点评（十七）：DeepSeek发布第二代MoE模型，降本增效有望加速AI应用普及

你可能感兴趣

传媒行业周报：DeepSeek发布第二代MoE模型，降本增效推动AI应用端发展

信息技术行业动态点评：DeepSeek发布第二代MoE架构模型，API调用成本降低

传媒行业周报：DeepSeek开源第二代MoE模型，OpenAI推出DALL·E 3

计算机行业AI+专题系列（十八）：OpenAI发布GPT-4o：AI应用或加速落地

OpenAI计划宣布ChatGPT和GPT-4更新，DeepSeek发布全新一代MoE大模型