Hyperscalers 的 NIC 对数据中心创新至关重要,尤其是在核心数据中心和边缘应用中,加速器(如加密、压缩)对于提升效率至关重要,同时也能启用可组合基础设施。
NIC 类型
-
Foundational NIC(基础网卡)
- 智能网卡:具备现代加速能力的传统 NICs,整个控制平面运行在宿主 CPU 上,适用于可信工作负载的成本总拥有(TCO)最优专用设备。
- 计算内核附加型:基础网络接口芯片(NIC)加上计算内核,使控制平面卸载成为可能,统一支持裸金属和虚拟机(VMs)。
-
运营商引入新 NIC 的挑战
- 特有接口:如遥测、数据包导向 APIs,引入难度较高。
- 复杂功能集:延缓部署速度,新功能可能影响基本功能。
- 供应商需求理解困难:运营商的要求(如规模、安全性、数据包格式)不明确。
标准化与基准
- 标准化硬件功能 API:一致的 API 使移植更容易,初期关注 NetDev 接口。
- 高级别提案工作负载:网络交通运输、BPF NetDev、IF 驱动程序,建立有意义的基准。
超大规模功能示例
-
内联加密
- Transport:支持大规模运营,“应用程序队列”的统一 API,TCP 直接数据放置。
- Multiqueue 网络:启用 CPU 内存旁路流量转向,跨队列优先级排序。
- 替代传输堆栈:QUIC、SNAP,Userspace 工作负载(如 DPDK / AF_XDP)。
- 直接数据到/从 GPU/TPU/SSD 内存,处理 TCP 排序约束。
-
灵活的隧道堆栈支持
- 多重封装:UDP over MPLS over GRE。
- 强大负载:复制,不解析标头,9K 客户端 MTU plus 最大 TE 包络。
- 费率限制:通过最早出发时间 (EDT) 限制。
-
网络交通运输
- 加密负载加速 QUIC:将状态扩展到数百万个连接,内联加密(TLS offload 的替代方案,Hybrid 方案)。
- 网络遥测的部分机密性:无状态,O(1) 缩放。
-
拥塞控制算法
- 改进需要硬件辅助的拥塞控制算法,访问高精度定时事件,正向结构延迟切换队列。
-
规模化运营
- 验收标准:流计数器、数据包采样、丢包计数器。
- 舰队健康管理:自检、设备错误报告、测试框架、规模和压力测试。
对话与未来方向
运营商和供应商需要合作,OCP 作为合适的论坛,进行公开讨论。