AI智能总结
参数精度是针对即将发布的下一代国产芯片设计,引起市场广泛关注,我们在此更新产业链信息如下: 特点:1)无符号指数设计(U):减少符号位冗余,提升存储效率;2)动态尾数策略(M0):通过隐式归一化或块级量化动态调整尾数精度,灵活适应 【民生电子】DeepSeek重磅更新,国产算力全面加速领导好,今日DeepSeek更新V3.1版本,并表示其使用的UE8M0 FP8 Scale 参数精度是针对即将发布的下一代国产芯片设计,引起市场广泛关注,我们在此更新产业链信息如下: 定义:FP8训练中采用的一种参数精度配置 特点:1)无符号指数设计(U):减少符号位冗余,提升存储效率;2)动态尾数策略(M0 ):通过隐式归一化或块级量化动态调整尾数精度,灵活适应国产芯片的计算单元设计;3)FP8 Scale缩放因子:通过动态调整量化范围,确保数值在国产芯片浮点运算单元的表示范围内。 优势:计算效率提升,减低部署成本,相比FP16/FP32减少50%-75%的显存占用。 意义:提前布局UE8M0 FP8,本质上是为国产芯片的计算单元特性、访存带宽限制、能效比目标提供预适配。 国产AI芯片正处于技术突破与生态落地的关键窗口期,UE8M0 FP8助力国产芯片加速追赶寒武纪:580及下一代产品690均支持FP8,当前690已顺利流片并进入到云商测试,反馈较好,预计整体出货25年20W,26年50W张。 昇腾:910D及920系列支持FP8,当前910D已成功回片进入到云商测试,预计910D系列26年30W张出货。 芯原股份:国内ASIC龙头,ZJ项目目前设计进展顺利,一批40-50万颗,后续有望提升至百万颗量级,同时二期ASIC启动设计。