核心观点与关键数据
-
数据中心面临的挑战
- 数据中心需提升运营效率并最大化硬件基础设施的IT投资,应对不断变化的应用需求。
- 2018年数据中心在服务器和存储基础架构上的花费超过$140B,加速器和GPU市场预计未来5年复合年增长率将超过50%。
-
资源利用不足
- 加速器面临工作负载与资源配比不匹配的问题,IO带宽受限,内存(DRAM)利用率约50%,每年浪费超过$20B的DRAM投资,且DRAM消耗数据中心15-20%的电力。
- 存储介质多样化(M.2/U.2/U.3、企业级硬盘、PCIe卡、EDSFF等),但存在资源搁浅和带宽瓶颈问题。
-
灵活基础架构的必要性
- 数据中心需通过灵活的基础架构优化存储、内存和计算资源,消除资源搁浅和带宽瓶颈,提高GPU利用率。
解决方案:可组合架构
-
可组合架构优势
- 通过动态端点分配、低延迟数据传输和可组合的异构计算,实现资源优化和工作负载匹配。
- Switchtec PCIe结构基于虚拟域,支持SR-IOV和多主机共享,提高GPU到存储的传输速率(如2.5倍带宽提升)。
-
可组合存储与内存
- Flashtec PCIe第4代NVMe控制器支持可扩展的NVMe SSD和其他PCIe端点,实现存储资源的灵活分配。
- SMC 1000智能内存控制器提供高带宽(8x25G),支持基于标准的1U/2U DDIMM,降低内存延迟并共享资源池。
-
应用案例
- 通过Switchtec和SR-IOV NVMe SSD,提升机器学习场景下的存储共享效率。
研究结论
- 数据中心需转向可组合架构以解决资源浪费和性能瓶颈问题,微芯片技术公司的Switchtec和Flashtec解决方案可显著提升GPU利用率、存储效率和计算灵活性,推动数据中心向敏捷化、异构化发展。