行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

守护 AI 数据：GPU 如何重塑格局

信息技术 2026-04-03 格雷德科技金栩生

核心观点与关键数据

AI工作负载对存储系统的要求：AI工作负载具有大规模、高并行、强韧性等特点，包括模型训练、数据集洗牌、检查点与日志、元数据操作等负载特征，对存储系统提出严苛要求。
传统RAID的挑战：奇偶校验RAID（RAID5/6）在容量利用率上有优势，但在高强度随机写负载下性能难以维持，且在降级模式下性能下降明显。
SupremeRAID™ 2.0的解决方案：通过重新设计的I/O卸载引擎和GPU加速，SupremeRAID™ 2.0解决了传统RAID的性能瓶颈，提升了随机写效率，并在降级模式下保持稳定性能。
硬件配置：测试平台采用24块InnoGrit N3X SLC NVMe硬盘，与SupremeRAID™Ultra（搭载50W NVIDIA RTX 2000E Ada芯片）组合使用，实现高性能与高能效。

性能对比

4K随机读取性能：Linux MD在降级模式下性能骤降超过99%，而SupremeRAID™ 2.0在最优状态下可实现36.2百万IOPS，降级模式下仍保持6126百万IOPS。
4K随机写入性能：Linux MD IOPS难以突破百万级别，SupremeRAID™ 2.0在最优状态下提供6477百万IOPS，降级模式下仍维持6646百万IOPS。
1M随机读取性能：Linux MD在降级模式下性能骤降至约13 GB/s，SupremeRAID™ 2.0在降级模式下仍保持92 GB/s。
1M随机写入性能：SupremeRAID™ 2.0在最优状态下提供242 GB/s，超越Linux MD达16倍以上，降级模式下仍维持2218 GB/s。

CPU效率分析

读取效率：SupremeRAID™ 2.0在4K随机读取场景下效率是Linux MD的4.7倍，大数据块I/O场景下效率差距扩大至26倍。
写入效率：Linux MD受制于奇偶校验计算与中断处理开销，SupremeRAID™ 2.0将这一负担卸载至GPU，随机IOPS效率提升达41倍，吞吐量效率提升达107倍。

研究结论

SupremeRAID™ 2.0驱动程序通过重新设计的I/O卸载引擎，满足AI工作负载的大规模、高并行、强韧性需求，在最优模式下实现数百万级IOPS随机写入，降级模式下仍保持强劲性能。
通过将I/O处理任务卸载至GPU，SupremeRAID™显著提升了CPU效率，释放主机计算资源给核心AI任务。
该解决方案依托50W功耗的NVIDIA RTX 2000E Ada，为下一代AI存储节点提供高密度、高能效的基础平台，充分实现N3X存储介质的极低延迟和数据一致性。

基于SupremeRAID™Ultra与InnoGrit N3X，为大规模并行AI I/O带来突破性的奇偶校验RAID性能 2026年4月目录 1. 4K随机读取性能............................................................................................................................................52. 4K随机写入性能.............................................................................................................................................53. 1M随机读取性能............................................................................................................................................64. 1M随机写入性能...........................................................................................................................................执行摘要........................................................................................................................................................................硬件优势：SUPREMERAID™2.0、NVIDIA RTX 2000E ADA innogrit N3X.................................................2AI............................................................................................................................3性能对比........................................................................................................................................................................4检测描述...................................................................................................................................................................4测试环境...................................................................................................................................................................47CPU效率分析（RAID5最优配置）.......................................................................................................................8读取效率:..............................................................................................................................................8写入效率:..............................................................................................................................................9 结论...........................................................................................................................................................................10 附录...............................................................................................................................................................................11 执行摘要人工智能工作负载规模庞大、高度并行且要求严苛。它们会在数千个线程、队列和数据集中产生高强度的小块数据及混合I/O模式的突发负载。在大规模部署场景下，这种压力会使得传统存储控制器成为训练、推理和数据准备过程中的主要瓶颈。 SupremeRAID™2.0AIRAID通过将24块InnoGrit N3XSLC NVMe硬盘与SupremeRAID™Ultra（搭载50W NVIDIA RTX 2000E Ada芯片）组合使用，我们消除了数据保护与性能之间的传统权衡关系。测试结果于定义AI基础设施效率的关键指标。SupremeRAID™在奇偶校验RAID处于最佳状态时，可实现数百万级随机写入操作；即使在降级模式下，仍能维持领的吞吐性能而这些场景下，传统软件RAID往往难以维持。由此带来的效果是：数据采集速度显著提升、元数据响应更加，且在大规模硬件故障发生时，依然可保持稳定且具备性的吞吐能力。硬件优势：SupremeRAID™2.0NVIDIA RTX 2000E Ada和InnoGrit N3X 该测试平台代表了现代AI服务器的理想架构，通过将新一代GPU卸载（GPU Offload）与超低时延存储介质相结合，有效消除系统瓶颈。 RAIDSupremeRAID™UltraNVIDIA RTX 2000E AdaGPU50WSupremeRAID™2.0I/O RAID5/6 存储介质由24块InnoGrit N3X NVMe SSD硬盘构成，基于KIOXIA XL-flash™技术。基于KIOXIAXL-FLASH™技术。该SSD通过采用SLC（单单元）架构，在DRAM与传统NAND闪存之间实现性能，具备极低时延与确定性性能表现。通过将SupremeRAID™2.0引擎与N3X的原生高速性能相结合，我们构建了一个在用奇偶校验保护的情况下，仍可满PCIe总线带的存储子系统，从而有效避免尾时延动对并行AI训练负载造成的阻。注：InnoGrit N3X固态硬盘的官方支持计将在即将发布的SupremeRAID™2.0驱动次版本中提供。 AI工作负载对存储系统的要求相较于传统企业级应用，AI数据平台对存储系统提出了然不同的压力模型。其工作流程通常合以下负载特： 1.2.3.模型训练与数据集洗牌的大规模并行读取负载检查点与日志写为主的突发I/O负载分布式数据服务带来的持续元数据操作负载。奇偶校验RAID（RAID5/6）具有显著优势，因其在大规模部署下具备较高的容量利用率而具有引力。然而，其核心挑战始终在于：在高强度随机写负载下难以保持性能，以及在降级模式（Degraded，指盘发生故障、重建流程进入数据路径时）下性能难以维持。SupremeRAID™2.0即是为解决这两瓶颈而设计的。性能对比检测描述以下结果对比了在相同的24盘NVMe配置下，Linux MD（mdadm）与SupremeRAID™2.0 Linux驱动程序的性能表现。每个子节呈现数据，再分析其对AI工作负载的影响。测试环境 •硬件 ooooCPU：AMD EPYC 9755 128核处理器× 2内存：32GB DDR5-6400 RDIMM × 24GPU RAID加速器：SupremeRAID™Ultra（NVIDIA RTX 2000E Ada），单插槽，低矮型结构，功耗50WNVMe硬盘：InnoGrit N3X SLC NVMe × 24 •软件ooo▪LinuxMD（mdadm）v4.3操作系统：Ubuntu 24.04.2 LTS内核：6.8.0-62GenericRAID实现方案：▪SupremeRAID™2.0(2.0.0-uad-76-71)o基准工具：fio-3.40 •配置ooo一个包含24块物理硬盘的RAID组（支持RAID5和RAID6）最佳：所有驱动器均正常已损坏：一块驱动器故障 1.4K随机读取性能观察分析：随机读取性能对于AI数据加载与数据混洗至关重要。Linux MD在最佳状态下表现优异，但在性能下降模式下，由于重建过程中的CPU瓶颈，其性能会骤降超过99%。SupremeRAID™2.0利用GPU处理I/O，在最优状态下可实现超大吞吐量，即在发生驱动器故障时，仍能维持高达1260万IOPS的性能输出。 2.4K随机写入性能观察分析：该指标是衡量元数据更新与检查点写入性能的最关键参数。传统RAID受制于"空洞"问题带来的性能损耗，IOPS难以突破百万级。SupremeRAID™2.0对这一工作负载实现了革命性的突破，在最优状态下可提供超过640万IOPS，且在降级状态下仍能维持与之乎相的性能表现。 3.1M随机读取性能观察分析：大块数据读取对应高吞吐量的数据摄入和训练数据。在最优状态下，两者性能相近（均受限于驱动器/总线带上限），但降级模式下的差距才真正体现出两者的本质： SupremeRAID™2.0200 GB/sLinux MD13 GB/sGPU 4.1M随机写入性能观察分析：大块数据写入对于AI模型检查点保存至关重要。SupremeRAID™2.0在最优状态下可提供242 GB/s的写入吞吐量，性能超越Linux MD达16倍以上。为关键的是，即在降级状态下，其吞吐量仍可维持在200 GB/s以上，确保单块驱动器故障不会中断模型训练进程。 CPU效率分析（RAID5最优配置）本节对存储操作的CPU开销进行评估。通过将CPU利用率与性能输出进行标准化处理，可以衡量出存储软件的真实"成本"。数值越低，表明效率越高，即可供AI计算工作负载使用的CPU算力资源越充。公式： “标准化成本”表示为实现特定性能单位所需的系统CPU总容量百分比。其计算公式为：标准化成本=总CPU利用率/实际达成性能（以目标单位计） ••CPU总利用率：计算公式为100% -空闲率目标单位：100万IOPS（适用于4K）或10 GB/s（适用于1M）。读取效率:小数据块与大观察结果：在读取操作中，SupremeRAID™消除了软件RAID固有的CPU瓶颈。在4K随机读取场景下，其每IOPS的CPU效率是Linux MD的4.7倍。

点击免费查看完整报告

守护 AI 数据：GPU 如何重塑格局

核心观点与关键数据

性能对比

CPU效率分析

研究结论

你可能感兴趣

AI时代的行业转型：十大行业如何借助AI重塑商业格局

2025年智能养老机器人品牌推荐科技重塑养老边界，智能开启守护纪元

传媒新消费行业周报：关注世界杯经济双十一预售新旧电商格局如何重塑

化妆品行业系列之七：景气度之外，如何抢占格局重塑先机

投资策略主题报告：“战投”新标准如何重塑定增市场格局

2022，全球煤炭贸易格局如何重塑？

固收深度报告20260126：“十五五”规划中的“债”机遇：详解政策东风如何重塑产业债格局（主线篇）

折叠屏的未来：苹果将如何重塑智能手机格局

华创债券资产证券化专题：多重视角看监管文件如何重塑ABS格局

当前时点如何看白电：产业重塑格局，资本重塑估值

守护 AI 数据：GPU 如何重塑格局

你可能感兴趣

AI时代的行业转型：十大行业如何借助AI重塑商业格局

2025年智能养老机器人品牌推荐科技重塑养老边界，智能开启守护纪元

传媒新消费行业周报：关注世界杯经济 双十一预售新旧电商格局如何重塑

化妆品行业系列之七：景气度之外，如何抢占格局重塑先机

投资策略主题报告：“战投”新标准如何重塑定增市场格局

2022，全球煤炭贸易格局如何重塑？

固收深度报告20260126：“十五五”规划中的“债”机遇：详解政策东风如何重塑产业债格局（主线篇）

折叠屏的未来：苹果将如何重塑智能手机格局

华创债券资产证券化专题：多重视角看监管文件如何重塑ABS格局

当前时点如何看白电：产业重塑格局，资本重塑估值

传媒新消费行业周报：关注世界杯经济双十一预售新旧电商格局如何重塑