您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:电子行业周观点:国内AI迈向软硬协同新纪元,重视国产算力底座 - 发现报告

电子行业周观点:国内AI迈向软硬协同新纪元,重视国产算力底座

电子设备2025-08-23郑震湘、佘凌星国盛证券x***
AI智能总结
查看更多
电子行业周观点:国内AI迈向软硬协同新纪元,重视国产算力底座

周观点:国内AI迈向软硬协同新纪元,重视国产算力底座 DeepSeek发布V3.1,迈向国产AI新纪元。DeepSeek正式发布其最新一代大语言模型DeepSeek-V3.1。此次升级引入了混合推理架构,支持“思考模式”与“非思考模式”自由切换,显著提升响应效率与任务适应能力。本次发布的一大重点在于其采用了UE8M0 FP8 Scale的参数精度。这一选择不仅优化了模型压缩与传输效率,更深层意义在于为“下一代国产芯片”量身定制,推动软硬件协同创新。UE8M0是MXFP8微缩块格式中的一种特殊缩放因子编码方式,其中“U”代表无符号,“E”和“M”则分别表示指数位和尾数位分配到的bit数,“E8M0”表示8个bit全部用于指数位,无尾数分配。这种设计使得处理器在根据缩放因子对数据复原时仅需进行指数位移操作,无需复杂的浮点乘法或规格化流程,从而大幅缩短关键路径延迟,提升计算吞吐。并且,UE8M0以每32个FP8数据仅附加8bit缩放因子的方式,相较传统FP32缩放节省75%内存带宽,在HBM/LPPDDR带宽受限的国产芯片上具有显著优势。 增持(维持) AI时代先进制程重要性高,AI芯片产能占比有望达到7%。CounterpointResearch指出,全球纯半导体晶圆代工行业的收入将在2025年同比增长17%,超过1650亿美元,高于2021年的1050亿美元,并在2021-2025年期间实现12%的复合年增长率。先进的3nm和5/4nm节点在推动半导体收入增长方面发挥着关键作用,包括7nm在内的这些先进节点将在2025年贡献纯晶圆厂总收入的一半以上。以AI服务器所带动的AI芯片需求为例,从AI芯片在整个先进工艺中的产能占比来看,2022年的占比仅有2%,2024年预计将会达到4%,预计到2027年占比将会达到7%,对整个晶圆代工产业的产值贡献正在快速增长。 作者 分析师郑震湘执业证书编号:S0680524120005邮箱:zhengzhenxiang@gszq.com 分析师佘凌星执业证书编号:S0680525010004邮箱:shelingxing1@gszq.com 国产AI正走向软硬协同阶段,看好国产算力产业链投资机遇。UE8M0 FP8精度格式具备更小的带宽、更低的功耗、更高的吞吐的优势,这意味着同样的硬件今后能跑更大的模型,国产芯片的性价比被大幅拉高,国产AI正走向软硬协同阶段,能够实质性减少对英伟达、AMD等国外算力的依赖。我们在看好国产算力芯片厂商极其配套厂商的同时,也强调需要重视国产算力底座,AI芯片的生产离不开先进制程,这也是目前国内供应端最卡脖子的环节,我们看好先进制程扩产加速,产能释放,实现国产算力产业链的供需双击。 相关研究 1、《电子:周观点:鸿海AI服务器业绩强劲,关注AI产业变革机遇》2025-08-162、《电子:AI需求全面爆发,看好先进封装产业链机遇》2025-08-113、《电子:周观点:AI需求爆发催化,网络连接侧预期持续上修》2025-08-10 周观点:相关标的见尾页。 风险提示:下游需求不及预期、研发进展不及预期、地缘政治风险。 内容目录 1、DeepSeek发布V3.1,软硬协同迈向国产AI新纪元...............................................................................32、算力芯片国产化进程加速,重视国产算力底座.......................................................................................53、行情回顾..........................................................................................................................................74、相关标的..........................................................................................................................................9风险提示...............................................................................................................................................9 图表目录 图表1:编程智能体测评(SWE使用内部框架测评,相比开源框架OpenHands所需轮数更少;TerminalBench使用官方Terminus 1 framework)..............................................................................................................3图表2:搜索智能体测评(测试结果调用商用搜索引擎API+网页过滤+128K context window;R1-0528使用内部workflow模式测试;HLE测试同时使用python与search工具).............................................................4图表3:各项评测指标得分基本持平的情况下(AIME 2025:87.5/88.4,GPQA:81/80.1,liveCodeBench:73.3/74.8),R1-0528与V3.1-Think的token消耗量对比图...........................................................................................4图表4:全球纯半导体晶圆代工行业的收入..............................................................................................5图表5:AI芯片产能占比.......................................................................................................................6图表6:各行业涨跌幅...........................................................................................................................7图表7:消费电子、半导体涨幅前20个股...............................................................................................7图表8:电子各细分行业涨跌幅..............................................................................................................8图表9:电子行业PE(月度)................................................................................................................8 1、DeepSeek发布V3.1,软硬协同迈向国产AI新纪元 DeepSeek正式发布其最新一代大语言模型DeepSeek-V3.1。此次升级引入了混合推理架构,支持“思考模式”与“非思考模式”自由切换,显著提升响应效率与任务适应能力。官方App、网页端及API均已同步更新,其中deepseek-chat对应非思考模式,deepseek-reasoner则用于深度推理,上下文长度均扩展至128K,并新增对AnthropicAPI格式的支持,可以轻松接入至Claude Code框架。 在核心能力方面,DeepSeek-V3.1展现出显著增强的Agent表现。编程智能体在SWE代码修复与Terminal-Bench复杂终端任务中,任务完成轮数少于前代模型;搜索智能体在browsecomp多步推理与HLE多学科难题测试中大幅领先R1-0528。通过思维链压缩训练,V3.1-Think在输出Token减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。该模型Base版本在原有基础上额外训练了840B tokens,并已在Hugging Face与魔搭开源。 资料来源:DeepSeek公众号,国盛证券研究所 本次发布的另一重大改变在于其采用了UE8M0 FP8 Scale的参数精度。这一选择不仅优化了模型压缩与传输效率,更深层意义在于为“下一代国产芯片”量身定制,推动软硬件协同创新。UE8M0是MXFP8微缩块格式中的一种特殊缩放因子编码方式,其中“U”代表无符号,“E”和““M”则分别表示指数位和尾数位分配到的bit数,““E8M0”表示8个bit全部用于指数位,无尾数分配。这种设计使得处理器在根据缩放因子对数据复原时仅需进行指数位移操作,无需复杂的浮点乘法或规格化流程,从而大幅缩短关键路径延迟,提升计算吞吐。并且,UE8M0以每32个FP8数据仅附加8bit缩放因子的方式,相较传统FP32缩放节省75%内存带宽,在HBM/LPPDDR带宽受限的国产芯片上具有显著优势。 2、算力芯片国产化进程加速,重视国产算力底座 2021-2025年代工行业实现12%的复合年增长率,2025年先进制程占据一半市场以上。Counterpoint Research指出,全球纯半导体晶圆代工行业的收入将在2025年同比增长17%,超过1650亿美元,高于2021年的1050亿美元,并在2021-2025年期间实现12%的复合年增长率。先进的3nm和5/4nm节点在推动半导体收入增长方面发挥着关键作用。预计2025年3纳米节点的收入将同比增长超过600%,达到约300亿美元,5/4nm节点仍将保持受欢迎,在积极的节点迁移推动下,其收入将超过400亿美元。总体而言,包括7nm在内的这些先进节点将在2025年贡献纯晶圆厂总收入的一半以上。这一激增凸显了业界对尖端技术的关注,以支持高端/旗舰AI智能手机的技术迁移、NPU驱动的AI PC解决方案的兴起,以及对AI ASIC、GPU和高性能计算(HPC)解决方案日益增长的需求。 资料来源:Counterpoint Research,国盛证券研究所 AI芯片产能占比有望达到7%。根据TrendForce的预计,AI服务器市场在2024年将实现42%的成长,2025年预计将保持28%的同比增长。以AI服务器所带动的AI芯片需求为例,从AI芯片在整个先进工艺中的产能占比来看,2022年的占比仅有2%,2024年预计将会达到4%,预计到2027年占比将会达到7%,对整个晶圆代工产业的产值贡献正在快速增长。2025年智能手机、笔记本电脑市场在端侧生成式AI需求的推动下,出货量有望分别实现同比2%和5.7%的增长。同时端侧生成式AI还将进一步推动AI手机和AI PC对于DRAM容量需求的显著提升。 资料来源:TrendForce,国盛证券研究所 国产AI正走向软硬协同阶段,看好国产算力产业链投资机遇。UE8M0 FP8精度格式具备更小的带宽、更低的功耗、更高的吞吐的优势,这意味着同样的硬件今后能跑