您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[金元证券]:电子行业周度点评报告:DeepSeek迎来第二次“杰文斯效应”,应用侧或加速落地 - 发现报告

电子行业周度点评报告:DeepSeek迎来第二次“杰文斯效应”,应用侧或加速落地

电子设备2025-08-24唐仁杰金元证券娱***
电子行业周度点评报告:DeepSeek迎来第二次“杰文斯效应”,应用侧或加速落地

—DeepSeek迎来第二次“杰文斯效应”,应用侧或加速落地 电子行业2025年8月24日 评级:增持(维持) ⚫全行业:本周上证指数上涨3.49%,深证成指上涨4.57%,沪深300指数上涨4.18%,申万电子版块上涨8.95%,电子行业在全行业中的涨跌幅排名为2/31。板块个股涨幅前五名分别为:科森科技、盛科通信-U、芯原股份、南亚新材、成都华微;跌幅前五名分别为:久量股份、威尔高、冠石科技、福日电子、可立克。 ⚫电子行业:本周从申万二级行业数据维度看,半导体板块以12.26%的显著周涨幅领跑电子行业。其细分申万三级行业中,数字芯片设计子板块凭借16.36%的亮眼涨幅,成为半导体板块乃至整个电子行业的增长亮点;半导体设备子板块也有12.31%的可观涨幅。消费电子板块紧随其后,实现8.26%的周涨幅,消费电子零部件及组装子板块涨幅8.64%的,品牌消费电子子板块涨幅5.28%。光学光电子板块周涨幅达7.13%,光学元件子板块8.74%涨幅表现突出,推动板块发展。电子化学品板块周涨幅5.29%,电子化学品Ⅲ子板块同步实现5.29%涨幅。其他电子板块取得6.61%周涨幅,与电子化学品板块表现协同。元件板块本周虽以1.68%涨幅在二级行业中相对靠后,但印制电路板、被动元件等子板块也有不同程度上涨,为电子行业底层元件支撑贡献力量。 ⚫行业要闻 ◆软银20亿美元入股英特尔,孙正义看好美国半导体制造前景◆英飞凌25亿美元收购Marvell汽车以太网业务落地◆中国放宽稀土出口限制,7月出口来到高点◆Arm重金挖角亚马逊AI芯片专家,加速自研芯片计划◆英特尔与大型投资者洽谈以折扣价格增资入股 相关报告 【金元电子】周报20250719台积电Q3指引超预期、AI与先进制程成增长双引擎 【金元电子】周报20250725世界人工智能大会,昇腾384超节点引领AI算力新纪元 ⚫公司动态: 【金元电子】周报20250801中美芯片博弈再升级,关注H20安全审查背后的国产替代机遇 ◆徕木股份:徕木股份2024年年度权益分派实施公告◆国瓷材料:关于公司2025年度中期现金分红方案的公告◆赛微电子:关于收购青岛展诚科技有限公司56.24%股权的公告◆莱特光电:莱特光电2025年半年度利润分配方案的公告◆长电科技:长电科技2025年中期利润分配方案的公告 【金元电子】周报20250808“China forChina”战略已成为全球半导体产业的重要趋势 【金元电子】周报20250808光刻国产替代从0至1的“蓝海”,AI基础设施投入的“红海”均值得关注 ⚫投资建议:我们认为,DeepSeek更新将是第二次“杰文斯效应”式的扩容。与DeepSeek V3/R1推出时相似,并非降低硬件门槛,而是单位资源可承载更长上下文、更复杂Agent工作流、更高批量与并发。DeepSeek本次更新在软件层面大幅提升了推理及算力效率,应用侧的提效也值得期待,上市公司如鼎捷数智、海天瑞声、拓普农云、当虹科技、索辰科技、博思软件等或将受益。另外,随着国产算力+DeepSeek模型迭代致使端侧应用及国产垂态模型需求增大,端侧领域及AIDC领域值得,相关上市公司包括:端侧:瑞芯微、泰凌微、全志科技等;国产AIDC包括润泽科技、光环新网、奥飞数据等。 分析师:唐仁杰执业证书编号:S0370524080002电话:0755-83025184邮箱:tangrj@jyzq.cn 风险提示:1、FP8编码在不同厂商间存在细微差异,MX的尺度/块大小虽有OCP规范,但软硬实现细节仍需磨合,跨平台迁移可能产生再校准成本。2、先进制程及产能当前饱满,产能与订单或存在错配导致上市公司短期难以实现目标订单。3、全球AI算力需求增速可能放缓,若下游应用大模型、自动驾驶等商业化落地不及预期,或导致基础设施投入、先进制程需求减弱 目录 一、核心观点...............................................................................................................................................3二、行业跟踪...............................................................................................................................................6三、行业新闻...............................................................................................................................................8四、公司公告.............................................................................................................................................14五、下周重要事件提示.............................................................................................................................19 图表目录 图1:MX块级缩放原理..............................................................................................................................3图2:E4M3/E5M2精度及范围对比............................................................................................................4图3:本周各行业版块涨跌幅...................................................................................................................6图4:本周电子版块:子版块涨跌幅.......................................................................................................7图5:电子板块历史走势...........................................................................................................................8图6:电子板块历史市盈率.......................................................................................................................8表1:本周电子板块个股涨幅前五名.......................................................................................................6表2:本周电子版块个股跌幅前五名.......................................................................................................6表3:下周重要会议.................................................................................................................................19表4:电子行业限售股解禁情况汇总(单位:万股).........................................................................20 一、核心观点 DeepSeek官宣DeepSeek-V3.1重大更新,DeepSeek-V3.1使用了UE8M0 FP8Scale的参数精度,并指出该精度配置面向“下一代国产芯片”。另外,本次更新实现思考模式与非思考模式的自由切换,相比于DeepSeek-R1-0528,V3.1的思考效率大幅提升,能够在更短时间内给出答案。 何为UEM8M0 FP8 Scale?UEM8M0 FP8实际是由两部分组成。首先,所谓UE8M0,并非第三种FP8格式,而是MX(Microscaling)块级缩放的“Scale格式”。把一个张量按固定小块切分(常见k=32),每块共享一个尺度X;在MXFP8下,尺度X用E8M0编码(8位指数、0位尾数、无符号,只表示2𝑘),而块内的每个具体数值𝑃𝑖仍用E4M3或E5M2的FP8表示。最终重构时,真实值𝑣ᵢ=𝑋×𝑃ᵢ还原。因为X仅是𝟐𝒌,硬件解码近似等价于指数位平移,路径短、功耗低;同时尺度元数据从传统FP32缩到1字节(FP8),元数据带宽显著下降。这一机制OCP MX1.0规范中被系统化定义,并明确𝑀𝑋𝐹𝑃8=(𝐸4𝑀3/𝐸5𝑀2元素)+(𝐸8𝑀0尺度)+(𝑘=32)。 数据来源:Nvidia、金元证券研究所 与传统E4M3/E5M2 FP8的不同。UE8M0是“尺子”(缩放因子),E4M3/E5M2是 “刻度”(元素值)。在一个k=32的小块里,先用UE8M0选择合适的2𝑘尺度,把该块数据整体搬到“可用动态范围”的合适区间。再利用E4M3或E5M2把块内元素量化存储。E4M3以更多尾数位换取更高精度,但指数位较少、范围较窄;E5M2以更多指数位换取更大范围,但精度略逊。工程上常见“前向/权重偏E4M3、反向/梯度偏E5M2”的混合配方,兼顾稳定性与吞吐。 数据来源:Nvidia,金元证券研究所 严格来说,支持UE8M0分三层含义:存取格式支持、算子/内核支持、指令级/单元级原生支持。不改硬件的前提下,前两层可以通过软件栈做到不同程度的兼容,第三层难以兼容: ⚫存取格式层:即把模型权重/激活以“E8M0尺度+ FP8元素(或INT8元素)”组织起来。只要编译器/运行时在加载时把每块的2𝑘合并进元素(Float是加指数,Int是移位+饱和),就能复原为芯片原生支持的计算类型(例如FP16/BF16/INT8),去执行后续FMA(Fused Multiply–Accumulate)。这一步不需要改硬件,但需要在框架/驱动/编译器里实现“块级解码”的高效流水化(DMA/JIT解码/寄存器打包等)。MX规范还定义了MXINT8(E8M0+INT8)的变体,理论上对只做INT8 NPU也能复用“2𝑘Scale”的解码逻辑 ⚫算子/内核层:如果硬件没有原生FP8乘加与块尺度融合,那就只能在内核前后做“解码/回写”。解码若能在on-chip SRAM/寄存器里完成(而非落到DDR),仍可保留一部分带宽优势:在外存里存的是FP8+1B尺度,拉进片上再变成FP16/INT8去算。相反,如果解码发生在CPU/GPU上再写回NPU,来回搬运可能抵消收益。 ⚫指令级/单元级原生支持:比如像NVIDIA Blackwell把M