Open Networking (white box) in the Enterprise
核心观点与背景
本文从企业(非超大规模)视角分享 Open Networking 的实践经验。作者 Matt Turner 是高通公司数据中心网络经理,拥有丰富的网络管理经验。文章首先定义了 Open Networking,强调其核心是白盒/亮盒设备、ONIE 协议和软件定义网络,并指出其相较于传统网络可降低约 33% 的成本。
Open Networking 的优势
- 成本效益:传统网络成本的约 67%。
- 灵活性:设备解耦,支持多种硬件厂商。
- 自动化:基于 Linux 平台,易于通过 Ansible 等工具实现自动化管理。
- 运维模式转变:从“宠物”(手动管理)到“牛”(集中自动化管理)。
技术选型与实践
- 软件平台:选择 Cumulus Linux(基于 Linux 的网络操作系统)和 Big Switch Monitoring Fabric(监控平台)。
- Cumulus 支持无编号 BGP/OSPF、BGP 重分发 ARP 等高级功能。
- BMF 基于 OpenFlow 控制器,支持 ZTP 和 DHCP 功能。
- 硬件:兼容主流厂商 HCL 列表中的硬件,支持 Broadcom ASIC 和 Intel/AMD CPU。
- 自动化框架:采用 GitHub/Jenkins/Ansible 三层架构。
- GitHub 存储配置文件和版本控制。
- Jenkins 负责集中调度和日志记录(Splunk)。
- Ansible 执行自动化任务,包括 ZTP、配置部署和合规检查。
自动化应用场景
- ZTP:通过 DHCP 和 ONIE 自动安装操作系统。
- 配置管理:使用 Ansible 动态添加/修改 VLAN、创建 MLAG 配置。
- 合规性检查:定期执行全局配置合规性检查(如 NTP 服务器配置)。
- 自服务工具:通过 API 实现用户自助服务(如 VLAN 配置)。
面临的挑战与解决方案
- 技能转型:工程师需学习 Linux、Git/GitHub、CI/CD 工具。
- 工具适配:传统监控工具(如 RSA/ACS)需重新配置,SNMP 可部分兼容。
- 思维转变:从依赖单一配置文件到采用 Linux 网络管理范式。
- 部署策略:优先从非关键环境(如 OoB 网络和实验室)开始逐步推广。
实验室建设建议
- 虚拟化:使用 Vagrant/VirtualBox 快速搭建测试环境。
- 物理实验室:用于光纤和铜缆测试、监控设备验证。
- 拓扑管理:通过 GitHub/GitLab 存储预配置拓扑,便于测试和开发。
经验总结
- 自动化是关键,需从 Day One 开始实施。
- Linux 网络经验有助于快速适应 Open Networking。
- “牛”式运维模式是未来趋势,需逐步摆脱“宠物”思维。
结论
企业可通过部署白盒交换机降低成本,推动 Linux 网络新时代。成功关键在于:从实验室起步、小规模试点、拥抱自动化并转变运维思维。