您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[爱建证券]:爱建证券电子行业周报:DeepSeek开源周发布五大技术 - 发现报告

爱建证券电子行业周报:DeepSeek开源周发布五大技术

电子设备2025-03-03许亮爱建证券心***
AI智能总结
查看更多
爱建证券电子行业周报:DeepSeek开源周发布五大技术

行业研究/行业点评 2025年03月03日 DeepSeek开源周发布五大技术 行业及产业电子 ——爱建证券电子行业周报 投资要点: 强于大市 本周(20250222-20250228)电子行业涨跌幅为(-4.9%),涨跌幅排名28/31位,SW电子三级行业涨跌幅榜靠前的分别是:半导体材料(+0.4%),数字芯片设计(-2.1%),半导体设备(-3.4%),LED(-3.5%),面板(-3.9%)。本周申万一级行业领涨行业分别为:钢铁(+3.2%),房地产(+2.2%),食品饮料(+1.8%),建筑材料(+1.6%),纺织服饰(+0.9%),沪深300指数涨跌幅为(-2.2%) DeepSeek开源周发布五大技术。2025年2月24日,DeepSeek启动“开源周”,首发开源项目FlashMLA为Hopper架构GPU(如H800)设计的高效MLA解码内核,通过深度优化变长序列处理及分页KV缓存机制,显著提升大模型推理效率。2025年2月25日,DeepSeek推出EP通信库,用于加速MoE模型训练和推理。2月26日发布的DeepEP解决了在GPU之间分发和聚合token时的低效问题。DeepGEMM是一个专为FP8通用矩阵设计的库,具备DeepSeek-V3的精细化缩放能力,用以驱动V3/R1模型的训练和推理。2月27日,DeepSeek推出了OptimizedParallelismStrategies。这是一个专注于优化并行计算策略的开源框架,其核心技术涵盖DualPipe(双向管道并行算法和EPLB(专家并行负载均衡器)的深度优化。2025年2月28日,DeepSeek开源了第五个项目萤火虫文件系统(3FS)。3FS是一个高性能的分布式文件系统,应对AI训练和推理时工作负载的挑战。它利用现代SSD和RDMA网络,提供一个共享存储层,简化分布式应用程序的开发。 资料来源:聚源数据,爱建证券研究所 相关研究 《爱建证券电子行业周报(0215-0221):全球最新AI模型GroK-3发布》2025/02/24《人工智能专题报告(1):适合投资人的DeepSeek分析报告》2025/02/20 OpenAI正式发布最大、最贵模型GPT-4.5。2月28日,OpenAI举行直播活动,正式发布最新大模型GPT-4.5,GPT-4.5是OpenAI有史以来最大的聊天模型,在计算效率上较GPT-4提升超过10倍。同样它是一个体积非常庞大,且计算密集型的模型,API价格达75美元/百万tokens输入、150美元/百万tokens输出,为GPT-4o的30倍。庞大的规模也带来了出众的性能,GPT-4.5在SimpleQA基准测试中准确率达62.5%,幻觉率37.1%,超越前代模型。 三星与长江存储签署专利许可协议。2月24日,据韩国媒体报道,三星电子近日与长江存储达成了一项3DNAND混合键合专利许可协议,将从第10代V-NAND(V10)开始,采用长江存储的专利技术,特别是在“混合键合”技术领域。三星计划在2025年下半年开始量产下一代V10NAND,预计该产品的堆叠层数将达到420至430层。随着层数的增加,尤其是超过400层时,底层外围电路的压力会显著提升,这可能影响芯片的可靠性。为了克服这一挑战,三星决定在V10NAND中引入W2W混合键合技术。这项技术通过直接将两片晶圆贴合,省去了传统的凸点连接,从而缩短了电气路径,提高了性能和散热能力,同时优化了生产效率。随着全球存储芯片行业的景气度逐步回升以及下一代存储芯片技术的升级,国产半导体芯片正在迎来历史性的成长机遇。 证券分析师 投资建议:OpenAI和DeepSeek在同一周发布了最新的大模型和技术进展,展现出差异化的竞争策略。OpenAI依然保持高投入高精度的模型风格,而DeepSeek低成本高性能方面继续打磨自己的产品,未来哪种策略将会胜出仍然有待市场检验。我们看好包括服务器,智能手机和智能驾驶系统将会迎来新一轮的升级浪潮,同时国产算力芯片需求也将会持续提升。 许亮S08205250100020755-83562506xuliang@ajzq.com 风险提示:1)国际贸易摩擦加剧;2)下游需求不及预期;3)技术升级进度滞后 目录 1.DeepSeek开源周发布五大技术............................................................4 1.1FlashMLA助力AI场景生成提速........................................................................41.2DeepEP助力AI专家高效协同............................................................................41.3DeepGEMM革新矩阵运算..................................................................................51.4DualPipe、EPLB协同实现AI效率飞跃..............................................................61.53FS助力数据加速领域创新................................................................................71.6DeepSeek开源,降低门槛,推动AI持续发展................................................8 2.全球产业动态.......................................................................................9 2.1英伟达公布第四季度及全年财务财报..............................................................92.2OpenAI正式发布最大、最贵模型GPT-4.5.......................................................92.3阿里巴巴宣布投入3800亿元建设云和AI硬件设施.....................................102.4台积电先进封装订单激增,英伟达独揽七成产能.......................................102.5三星与长江存储签署专利许可协议................................................................112.6SiC进入AR眼镜战场........................................................................................11 3.本周市场回顾.....................................................................................12 3.1SW一级行业涨跌幅一览...................................................................................123.2SW三级行业市场表现.......................................................................................133.3SW电子行业个股情况.......................................................................................133.4科技行业海外市场表现....................................................................................14 4.风险提示............................................................................................15 图表目录 图1:FlashAttention-3性能卓越......................................................................................4图2:H100:FlashAttention与其他机制速度比较........................................................4图3:峰值吞吐量测试形式..............................................................................................7图4:3FS基于GraySort基测,可实现3.66TIB/min吞吐量........................................8图5:本周SW一级行业涨跌幅一览............................................................................12图6:本周SW电子三级行业涨跌幅一览....................................................................13图7:SW电子个股本周涨跌幅前十.............................................................................14图8:SW电子个股本周涨跌幅后十.............................................................................14图9:费城半导体指数....................................................................................................14图10:恒生指数..............................................................................................................14图11:本周中国台湾电子指数涨跌幅一览.................................................................15 表1:DeepEP基于NVLink和RDMA普通内核宽带测试结果......................................5表2:DeepEP延迟敏感场景测试结果............................................................................5表3:用于密集模型的普通GEMM测试结果................................................................6表4:GEMM连续性布局性能测试数据.............................