AI智能总结
2025年8月25日 计算机行业周度:国产AI软硬件协同破局 看好 本周计算机行业指数表现 本周(8.18-8.22)计算机(申万)板块上涨7.93%,沪深300指数上涨4.18%,计算机板块跑赢沪深300指数3.75个百分点。和申万其他行业对比,计算机行业涨幅排名位列第4位。 本周涨幅前3名分别为御银股份(46.20%)、诚迈科技(34.92%)、科创信息(33.94%),跌幅前3名分别为佳缘科技(-10.73%)、思创医惠(-10.08%)、运达科技(-7.76%)。 本周关注 国产AI软硬件协同破局 数据来源:Wind,国新证券整理 DeepSeek-V3.1正 式 发 布 , 采 用 专 为 下 一 代 国 产 芯 片 设计 的UE8M0 FP8 Scale参数精度。该技术通过无符号指数位与零尾数位的组合,将动态范围扩展至76个数量级,大幅降低内存占用,使国产芯片如昇腾910B可高效运行128K上下文模型。配合微缩放技术,实现以算法补硬件的协同范式,显著提升效能。 国产芯片生态正积极适配FP8精度。摩尔线程MTTS5000和燧原L600已原生支持FP8,寒武纪、海光通过软件优化兼容,沐曦及华为下一代芯片也将集成FP8单元。软硬协同推动国产算力提升,华为昇腾已实现工业物联网端侧决策,海光DCU日均调用达4.7亿次,验证了商业可行性。 UE8M0FP8契合大语言模型的长尾特征,语言任务困惑度较INT8提升15-20%,并通过简化计算降低电路复杂度。政策层面,国家超算互联网将DeepSeek纳入标准算力库,运营商优先采购国产芯片模块,能源巨头全国产化部署加速生态闭环。 尽管面临芯片架构自主性、边缘场景INT8优势及软件栈成熟度等挑战,DeepSeek通过应用需求倒逼硬件创新,逐步构建生态护城河。若突破IP自主与跨厂商标准等问题,国产算力有望在2030年前实现全球竞争力跃升。 分析师:钟哲元登记编码:S1490523030001邮箱:zhongzheyuan@crsec.com.cn 投资线索 国产替代前景明确但仍存挑战,建议聚焦技术验证明确的标的,如海光信息(延迟降40%)、中芯国际(产能利用率超90%)、龙芯中科(实现7B模型部署)。投资者应重点关注华为昇腾订单放量、寒武纪头部客户测试及中芯先进封装突破等。 风险提示 1、政策落地不及预期;2、技术发展不及预期;3、市场竞争加剧。 证券研究报告 目录 一、本周市场回顾........................................................................................................................................................................4 1、DeepSeek-V3.1的技术革新与国产芯片协同...........................................................................................................52、国产芯片生态的适配竞赛............................................................................................................................................53、技术重构产业竞争力....................................................................................................................................................54、未来挑战与突围的关键................................................................................................................................................6 1、首届世界人形机器人运动会闭幕................................................................................................................................62、软银20亿美元投资Intel!将成第五大股东..........................................................................................................73、阿里通义千问:推出图像编辑模型Qwen-Image-Edit...........................................................................................74、小米发布史上营收最高的单季度财报:1160亿增长30%....................................................................................75、智谱发布AutoGLM 2.0:全球首个手机Agent,云端自主完成任务.................................................................86、Meta与谷歌达成首次重磅云合作百亿美元加码AI竞赛....................................................................................9 图表目录 图表1:计算机行业板块相对表现(%).................................................................................................................................4图表2:计算机行业个股涨跌幅.................................................................................................................................................4 一、本周市场回顾 本周(8.18-8.22)计算机(申万)板块上涨7.93%,沪深300指 数上涨4.18%,计算机板块跑赢沪深300指数3.75个百分点。和申万其他行业对比,计算机行业涨幅排名位列第4位。 数据来源:Wind,国新证券整理 目前计算机行业上市公司共335家,其中,293家公司收涨,占比87.2%。本周涨 幅 前3名 分 别为御 银 股 份(46.20%)、诚 迈 科 技(34.92%)、科 创 信 息(33.94%),跌幅前3名分别为佳缘科技(-10.73%)、思创医惠(-10.08%)、运达科技(-7.76%)。 二、本周关注 国产AI软硬件协同破局 DeepSeek-V3.1正式发布,采用UE8M0 FP8 Scale参数精度。DeepSeek称, UE8M0FP8是针对即将发布的下一代国产芯片设计。本次升级主要有三大亮点,包括更强的Agent能力、混合思考模式和更高的思考效率。同时,DeepSeek还上调了API接口调用价格。 1、DeepSeek-V3.1的技术革新与国产芯片协同 DeepSeek发布的V3.1大模型,其核心突破之处在于采用UE8M0 FP8 Scale参数精度。UE8M0 FP8通过无符号指数位(8位)与零尾数位的组合,将动态范围扩展至2^(−127)到2^128的76个数量级。从工程价值来看,它精准匹配了国产芯片的算力瓶颈。国产芯片由于受到先进制程的限制,发展受限,而UE8M0 FP8中指数加法替代浮点乘法的设计,使得同面积芯片能够塞入更多整数计算单元。并且,传统FP32模型每个参数需4字节,而UE8M0 FP8仅需1字节,内存占用减少50%-75%,国产芯片(如昇腾910B)可更高效运行128K上下文模型。再配合微缩放技术(每32元素共享缩放因子)的“动态精度分配”机制,达成了以算法补硬件的协同范式,让中端芯片在特定场景下能够跑出高端芯片的效能,为全球算力博弈开拓了新战场。 2、国产芯片生态的适配竞赛 DeepSeek官方明确UE8M0 FP8是针对“下一代国产芯片”设计,这引发了行业对硬件厂商的高度关注。目前,国产AI芯片中已有多家厂商支持或计划支持FP8精度(尤其是适配DeepSeek UE8M0 FP8格式)。摩尔线程MTT S5000和燧原L600已实现原生硬件FP8支持,显著提升算力并降低功耗;寒武纪思元590、海光DCU等通过软件优化兼容FP8,性能提升30%-40%。沐曦曦云C600(计划2025Q4量产)和华为下一代昇腾910D(预计2025年末送样)也将原生集成FP8单元。这一协同生态通过算法与硬件联合优化,推动国产算力在降低存储开销、提升能效比方面接近国际水平,但需注意部分产品仍处于量产过渡或软件适配阶段。资本市场对此反应强烈,科创板芯片板块集体走强。这反映出国产算力生态正从“单点突破”向“软硬协同”的战略升级转变:华为昇腾适配V3模型后,在工业物联网领域实现了端侧决策;海光DCU日均调用DeepSeek模型达4.7亿次,验证了国产组合在商业应用上的可行性。 3、技术重构产业竞争力 UE8M0 FP8重塑了计算范式。传统INT8的线性精度适用于均匀数据,例如计算机视觉领域,而UE8M0的指数分布特性与大语言模型权重的长尾特征完美契合(90%权重集中于±0.1区间)。实测结果显示,其在语言任务上的困惑度较INT8提升15-20%,并且通过将乘法简化为指数加法,显著降低了电路复杂度。这使得国产芯片在同等制程下能够集成更多计算单元。在政策层面,国家超算互联网将DeepSeek纳入标准算力库,三大运营商优先采购国产芯片推理模块,像中国海 油等能源巨头全国产化部署案例,进一步加速了生态闭环的形成。 4、未来挑战与突围的关键 尽管UE8M0 FP8为国产AI打开了新局面,但挑战依然严峻。部分国产芯片架构尚未完全实现自主,在边缘场景中,INT8因功耗优势仍占据主导地位,FP8软件栈的成熟度也有待优化。DeepSeek此举的本质是以应用需求倒逼硬件创新,通过主动适配国产芯片的最优性能点,逐步构建起生态护城河。这场协同进化若能够突破IP自主、混合精度优化、跨厂商标准统一等核心问题,国产算力有望在2030年前迎来全球竞争力的实质性提升。 三、投资线索 国产替代的逻辑清晰,但仍需警惕三重挑战。在边缘计算场景中,INT8因功耗优势仍占主导,这使得FP8的渗透速度存在不确定性;部分高研发投入企业在短期内盈利承压,需密切跟踪订单的落地进度;华为MindSpore等国产软件生态的成熟仍需要3-5年的培育期。建议优先选择技术验证明确的企业,如海光信息DCU延迟降低40%,中芯国际成熟制程产能利用率维持在90%以上,龙芯中科实现了7B模型本地化部署的突破,这些企业兼具技术护城河与商业兑现的确定性。投资者应当把握国产替代的窗口,聚焦同时通过“技术-政策-商业”三重验证的企业。华为昇腾承接订单的放量节奏、寒武纪在头部客户的测试进展,以及中芯国际在先进封装的技术突破,都将成为下一阶段超额收益的核心观测点。