带内管理代理的架构与标准化路线图
定义与用途
带内管理代理是在主机上运行的系统管理软件,用于监控、遥测、固件更新、故障预测和自我修复(如记忆毒药遏制)。
采用带内的原因
- 服务器CPU处理能力更高,可增强带外管理的主机CPU指标(如主机内核/软件指标、内存检查异常MCE、内存毒药遏制)。
- 某些监视/管理功能仅在带内可用。
- BMC存在额外成本/复杂性,而带内管理可利用现有网络端口或隧道,适用于无BMC或微控制器有限的机器。
- 固件更新(如GPU卡、PCIe卡)可直接通过PCIe进行高带宽连接。
带内与带外的结合
- 服务器正常工作时使用带内模式,故障时切换至带外模式。
- 可在两种模式间切换,但带外模式可能缺乏浮点支持等低级别数据处理能力。
带内架构
- 红鱼遥测服务器通过带内架构连接BMC/MCU、主机操作系统/虚拟机管理程序、容器和带外管理。
标准化带内管理代理的优势
- 实现跨行业协作,简化编写符合标准的代理。
- 分享通用遥测/协议,替代自定义协议,便于数据收集、存储、共享和分析。
- 供应商受益于额外数据,超大规模企业受益于现成组件。
- 支持远程/离线调试,提升产品改进。
摘要与路线图
超大规模企业倾向于自定义实现,而供应商则采用自定义协议。标准化旨在激励供应商采用,轻松实现增量采用,支持超大规模企业。
- 2021年Q4:发布带内管理代理架构和使用案例。
- 2022年Q2:发布带内管理代理规范草案。