-
背景与动机:随着大量非结构化数据的生成,三星 DSS 存储解决方案通过分类、高带宽、可扩展的对象存储(键值)API,为 AI/深度学习等数据密集型应用提供服务。指数级数据生成需求推动了高带宽和可扩展性存储的发展。
-
系统介绍:DSS 存储系统基于 NVMe(NVMeOF)架构,实现对象 Key-Value API,支持远程访问协议(如 RDMA),并促进存储和计算资源可扩展性。系统通过多个客户端会话分配带宽需求,解决带宽不一致和拥塞问题。
-
系统设计:
- 存储服务器:基于 MinIO 改进,支持分布式共享存储,采用擦除编码(EC)确保数据一致性,前端使用 S3 兼容的 KV API 访问数据,后端通过用户模式运行的目标应用软件抽象 SSD 设备并执行键值操作,支持 NVMe-oF 的 RDMA 和基于 IP 的网络。
- 网络设置:支持 S3 流量和 RDMA 协议,客户端与存储交互通过 S3 HTTP,存储服务器配备 4 个双端口 200GbE NIC,网络软件堆栈支持 RoCE v2 和 TCP/IP 协议。
- 客户端服务器:DSS 客户端库负责从存储加载数据并分布到存储服务器,通过负载均衡最大化性能,支持 PUT/GET/DEL/LIST 等操作。
-
实验设计:使用 10 个存储服务器和 16 个客户端服务器进行评估,存储服务器采用 AMD EPYC 7742 CPU 和 200GbE NIC,客户端服务器采用戴尔 R740xd CPU 和 100GbE NIC,存储节点使用 SSDPMI733(16x 4TB SSD)。
-
实验结果:使用 30TB 数据(1MB 和 2MB 对象大小)运行 S3 基准测试,DSS 存储服务器实现约 180-275 GB/s 的读取(GET)和 26-38 GB/s 的写入(PUT),擦除编码(EC)提升性能,1MB 对象大小下无 EC 的 PUT/GET 吞吐量分别为 1M 擦除编码的 80% 和 75%。
-
结论与未来工作:DSS 是分层存储系统,具备高 I/O 带宽和对象存储的可扩展性,10 节点存储和 16 节点客户端集群的读写吞吐量分别约为 2 和 1 个数量级。未来计划通过 RDMA 消除 HTTP/TCP 复制开销,并评估更大规模集群的性能。