双机热备(RBM)技术白皮书总结
概述
产生背景
大数据时代,网络承载的业务日益重要,单点故障风险凸显。为解决关键设备故障导致网络中断的问题,企业通常部署两台设备提升网络可靠性。然而,对于防火墙、入侵防御等需要对报文进行状态检测和策略处理的设备,仅做链路冗余不足,还需保证设备级冗余,即设备间的业务表项和配置信息一致性。
技术优点
双机热备(RBM)技术提供设备级、系统级的可靠性解决方案,具备以下优势:
- 设备级可靠性:将网络通信可靠性从链路级、单板级提升至设备级,实现业务级平滑迁移。
- 业务快速部署:一台设备配置业务,另一台设备自动同步,简化配置,加速上线。
- 设备独立升级:两台设备可独立升级,升级过程对业务几乎无影响。
- 流量自动切换:通过多种监测技术动态感知设备及链路状态,并与OSPF等协议联动实现流量自动切换。
- 支持多业务:支持SecPolicy、DPI、NAT、LB、IPsec、SSL VPN等功能的高可靠性部署。
- 组网兼容性强:可与OSPF、IS-IS、BGP、VRRP等RFC标准协议联动,兼容性强。
技术实现
概念介绍
- 主、从管理设备:用于控制设备间的配置信息同步,只能手工配置,不能动态选举。
- 主、备业务设备:用于数据层面,主设备处理业务并备份业务表项,备设备接收备份信息并在主设备故障时接替工作。
- RBM报文:基于RBM协议承载设备间交互信息,使用TCP作为传输层协议。
- RBM通道:用于设备间传输运行状态信息、配置信息和业务表信息,包括控制通道和数据通道。
- 双机热备工作模式:支持主备和双主两种模式,主备模式下主设备处理业务,备设备待命;双主模式下两台设备同时处理业务。
双机热备的组建
- RBM报文:包括控制报文、心跳报文、配置一致性检查报文、配置信息备份报文、表项备份报文和透传报文。
- RBM通道:包括控制通道(传输运行状态报文、一致性检查报文和同步配置信息的报文)和数据通道(传输热备报文和透传报文)。
- 设备角色:包括主、从管理角色和主、备业务角色,主、从管理角色手工配置,主、备业务角色动态选举。
- 建立过程:包括建立RBM通道、发送双机热备协商报文、竞选主从管理角色、竞选主备业务角色、批量同步配置信息和业务表项、周期性发送Keepalive报文、实时同步数据。
双机热备工作模式
- 主备模式:正常情况下主设备处理业务,备设备待命;主设备故障时备设备切换为主设备。
- 双主模式:两台设备同时处理业务,充分利用资源;其中一台设备故障时另一台设备接替工作。
双机热备备份配置信息
- 备份方式:支持自动和手动两种方式,自动方式实时同步配置信息变化,手动方式进行一次批量备份。
- 触发批量备份配置信息:包括首次批量备份、设备重启或RBM进程重启且对端设备开启自动备份功能。
- 配置信息一致性检查:通过交互一致性检查报文检测配置信息是否一致,防止主备切换后业务中断,支持自动和手动两种方式。
双机热备备份业务表项
双机热备将主设备上生成的业务表项信息实时备份到备设备,避免主备切换时因备设备上缺失业务表项而造成业务中断。
双机热备状态切换
- 触发事件:包括控制通道断开、主设备整机故障、主设备上双机热备监控的接口故障、主设备上任意业务板故障、主设备上所有主控板故障、主设备上所有交换网板故障、主设备上双机热备关联的任意Track项状态为Negative。
- 监控机制:部分监控事件如控制通道、整机故障等自动监控,部分监控事件如接口、Track项目等需手工配置,具体使用方法建议参考推荐表。
- 切换过程:主备切换时仅数据层面的主备业务状态发生切换,设备整机故障时控制层面和数据层面的主从管理状态和主备业务状态均发生切换。
双机热备部署方式
- 三层主备直路部署:适用于Device串联部署在上下行设备之间,Device的上、下行业务接口均为三层接口,所有业务流量必须经过Device。
- 三层双主直路部署:适用于Device串联部署在上下行设备之间,Device的上、下行业务接口均为三层接口,所有业务流量必须经过Device,两台Device同时处理业务。
- 透明主备直路部署:适用于Device作为二层设备串联部署在上下行二层网络之间,Device的上、下行业务接口均为二层接口,所有业务流量必须经过Device。
- 透明双主直路部署:适用于Device作为二层设备串联部署在上下行三层网络之间,Device的上、下行业务接口均为二层接口,所有业务流量必须经过Device,两台Device同时处理业务。
双机热备流量引导
- 双机热备+VRRP:双机热备控制设备在多个VRRP备份组中Master和Backup状态的统一切换,保证上下行流量同时切换到新的主设备。
- 双机热备+静态路由:双机热备监控接口将接口状态与静态路由联动,保证主备切换时上下行流量同时切换到新的主设备。
- 双机热备+动态路由:双机热备调高备设备上动态路由协议对外通告的链路开销值,保证主备切换时上下行流量同时切换到新的主设备。
- 双机热备+VLAN:双机热备的监控VLAN或监控接口功能将上下行接口的状态进行联动,保证一个接口故障时另一个接口也失去报文转发能力,从而使设备的上下行流量同时切换到新的主设备。
- 非对称流量业务:针对不需要对报文进行四层以上内容处理的模块(如安全策略、NAT等),双机热备通过实时备份会话表项到对端设备即可保证业务正常处理;针对需要对报文进行四层以上内容处理的模块(如IPS、NBAR等DPI类业务),双机热备在实时备份会话的同时,也将请求报文的相关信息同步到对端设备。
双机热备流量回切
当原主设备恢复正常后,流量不回切,可开启双机热备流量回切功能,在配置信息和业务表项同步完成后,延迟一段时间再进行流量回切。双机热备的双主模式下必须开启流量回切功能,主备模式下可选择性开启。
双机热备与其它功能配合
- 双机热备支持NAT:NAT相关配置需与VRRP备份组进行绑定,以保证ARP请求由Master设备响应,确保业务正常运行。
- 双机热备支持SSL VPN:SSL VPN的用户数据、表项信息和配置信息通过RBM通道进行备份,仅支持在双机热备+VRRP方式的主备模式下进行高可靠性部署。
- 双机热备支持DPI业务:双机热备双主部署场景下的非对称路径中,使用DPI业务时必须开启DPI支持双机热备功能。
- 双机热备支持Context:双机热备技术能够满足多Context环境的高可靠性部署需求,仅需要在缺省Context中配置双机热备功能即可完成所有非缺省Context的高可靠性部署。
- 双机热备支持vSystem:双机热备技术能够满足多vSystem环境的高可靠性部署需求,仅需要在缺省vSystem中配置双机热备功能即可完成所有非缺省vSystem的高可靠性部署。
双机热备应用限制
- 双机热备仅支持两台硬件和软件环境完全一样的设备进行双机热备组网。
- 建议在正常情况下每台设备只负载各自实际能力50%的流量。
典型组网应用
- 双机热备联动VRRP三层主备典型组网:Device A作为主设备,Device B作为备设备,Device A或其链路故障时由Device B接替工作。
- 双机热备联动VRRP三层双主典型组网:两台Device同时处理业务,Device A或其链路故障时由Device B接替工作。
- 双机热备联动动态路由三层主备典型组网:Device A作为主设备,Device B作为备设备,Device A或其链路故障时由Device B接替工作。
- 双机热备联动动态路由三层双主典型组网:两台Device同时处理业务,Device A或其链路故障时由Device B接替工作。
- 双机热备透明主备典型组网:Device A作为主设备,Device B作为备设备,Device A或其链路故障时由Device B接替工作。
- 双机热备透明双主典型组网:两台Device同时处理业务,Device A或其链路故障时由Device B接替工作。
双机热备(RBM)技术白皮书
Copyright©2025新华三技术有限公司版权所有,保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。本文中的内容为通用性技术信息,某些信息可能不适用于您所购买的产品。
目录
1概述1
1.1产生背景1
1.2技术优点2
2技术实现1
2.1概念介绍1
2.2双机热备的组建1
2.2.1RBM报文1
2.2.2RBM通道1
2.2.3设备角色2
2.2.4建立过程3
2.3双机热备工作模式4
2.4双机热备备份配置信息6
2.4.1触发批量备份配置信息7
2.4.2配置信息一致性检查7
2.5双机热备备份业务表项7
2.6双机热备状态切换7
2.6.1触发事件8
2.6.2监控机制9
2.6.3切换过程9
2.7双机热备部署方式11
2.7.1三层主备直路部署11
2.7.2三层双主直路部署12
2.7.3透明主备直路部署14
2.7.4透明双主直路部署16
2.8双机热备流量引导17
2.8.1双机热备+VRRP17
2.8.2双机热备+静态路由19
2.8.3双机热备+动态路由20
2.8.4双机热备+VLAN21
2.8.5非对称流量业务22
2.9双机热备流量回切23
2.10双机热备与其它功能配合24
2.10.1双机热备支持NAT24
2.10.2双机热备支持SSLVPN26
2.10.3双机热备支持DPI业务27
2.10.4双机热备支持Context27
2.10.5双机热备支持vSystem27
2.11双机热备应用限制27
3典型组网应用1
3.1双机热备联动VRRP三层主备典型组网1
3.2双机热备联动VRRP三层双主典型组网2
3.3双机热备联动动态路由三层主备典型组网3
3.4双机热备联动动态路由三层双主典型组网3
3.5双机热备透明主备典型组网4
3.6双机热备透明双主典型组网5
1概述
1.1产生背景
大数据时代,随着各行各业数字化转型的蓬勃开展,网络承载的业务越来越多,越来越重要。如何保证网络的可靠性和业务的不间断传输成为网络建设中必须要解决的问题。
如图1-1中的左图所示,Device部署在网络的出口,内、外网之间的业务流量均会通过Device处理和转发。如果Device出现故障,便会导致内、外网之间的业务全部中断。由此可见,在这种网络关键位置上如果只使用一台设备,无论设备的可靠性多高,都会存在因设备单点故障而导致的网络中断风险。
因此,企业通常会在网络的关键位置部署两台设备,以提升网络的可靠性。如图1-1中的右图所示,当DeviceA出现故障时,流量会通过DeviceB转发,保证内、外网之间业务流量的不间断传输。
图1-1网络可靠性示意图
Internet
Internet
Router
Device
Switch
Router
DeviceA
DeviceB
Switch
Failure
Backupchannel
Servicetraffic
对于传统的网络设备(如交换机、路由器),只需要做好接口或网络的冗余就可以保证流量的不间断传输。但是,对于需要对报文进行状态检测和策略处理的设备(如防火墙、入侵防御、上网行为审计等),它会对一条流量的首包进行合法性检测,并建立会话来记录流量的状态信息(包括报文的源IP、源端口、目的IP、目的端口、协议等)。而这条流量的后续报文只有匹配会话才会在此类设备上进行处理并完成转发,如果后续报文不能匹配到会话则被丢弃。所以当此类设备进行可靠性
部署时,不仅需要做好链路级的冗余,还需要保证两台设备之间的业务表项信息和配置信息的一致性,做到设备级的冗余,只有如此才能真正保证流量的不间断传输。
双机热备功能可以有效解决以上问题。如图1-1中的右图所示,双机热备可以将两台Device组建成高可靠性系统,在保证链路级冗余的同时,还能将设备上的会话表项等业务状态信息和配置信息在两台设备之间同步,最终达到设备级的冗余。
1.2技术优点
双机热备是一种跨设备的备份管理技术,提供了一种设备级、系统级的可靠性解决方案。双机热备不仅具有其它冗余技术(如链路聚合、VRRP等)所具有的增加链路带宽、提高网络可靠性、流量负载分担的优势外,还兼具以下优势:
设备级可靠性:双机热备将网络通信的可靠性从链路级、单板级提高到了设备级。对于需要对报文进行深度处理和检测的业务,真正做到了业务级的平滑迁移。
业务快速部署:双机热备中只需要在一台设备上配置相关业务,另一台设备会实时自动同步配置信息,这样既能简化设备的配置操作,又能加速业务的上线。
设备独立升级:双机热备中的两台设备可以进行独立升级,升级其中一台设备时,另一台可以正常工作,升级过程对正在运行的业务几乎零影响。
流量自动切换:双机热备通过多种监测技术,动态感知设备及其链路的健康状况,并与其它多种技术(如OSPF)联动实现流量自动切换。
支持多业务:双机热备支持SecPolicy、DPI、NAT、LB、IPsec、SSLVPN等功能在业务层面的高可靠性部署,保证流量切换后业务处理不中断。
组网兼容性强:双机热备可与OSPF、IS-IS、BGP、VRRP等RFC标准协议联动引导流量,因此双机热备在不同品牌设备的综合组网中,具有非常强的兼容性和扩展性。
2技术实现
本文的双机热备技术通过RBM(RemoteBackupManagement,远端备份管理)协议实现,其不仅可以备份设备间的配置信息和业务表项,还能联动VRRP和动态路由等,统一管理流量的切换保证用户业务数据的不间断传输。
2.1概念介绍
双机热备技术在控制层面和业务层面对设备进行统一管理,从而提供设备级冗余保护和流量负载分担。双机热备技术包含的基本概念如下。
主、从管理设备:双机热备中的设备在控制层面分为主、从两种管理角色(也可以称作主、从管理状态),用于控制设备之间的配置信息同步。
主、备业务设备:双机热备中的设备在数据层面包含主、备两种业务角色(也可以称作主、备业务状态)。主设备处理业务,并向备设备实时备份业务表项信息。
RBM报文:RBM报文使用RBM协议承载两台设备之间需要交互的信息。其使用TCP作为传输层协议,TCP连接建立后,主管理设备和从管理设备通过RBM通道交互RBM报文。
RBM通道:用于两台设备之间交互双机热备的运行状态信息、配置信息和业务表信息。
双机热备工作模式:支持主备和双主两种工作模式。主备模式下,仅由主设备处理业务,备设备处于待命状态;双主模式下,两台设备同时处理业务,充分利用设备资源,提高系统负载分担能力。
2.2双机热备的组建
2.2.1RBM报文
1.报文类型
RBM报文是基于RBM协议的,其从大类上基本可以分为如下几类:
控制报文:首先根据设备的配置信息建立双机热备系统,系统建立后依据设备的运行状态来控制设备的主备状态切换。
心跳报文(Keepalive报文):两台设备通过定期互相发送心跳报文来检测对端设备是否存活。
配置一致性检查报文:用于设备之间检测配置信息,以确保两台设备的关键配置一致。
配置信息备份报文:用于两台设备之间进行配置信息的备份。
表项备份报文:用于两台设备之间进行业务表项的备份。
透传报文:用于设备间非对称路径业务报文的透传或复制。
2.2.2RBM通道
RBM通道用于两台设备之间进行双机热备运行状态、关键配置和业务表项等信息的传输,从逻辑上包括以下几种类型的通道:
控制通道:可传输的报文类型包括双机热备的运行状态报文、一致性检查报文和同步配置信息的报文等。创建RBM控制通道时,设备会将配置的本端IP地址与对端IP地址进行比较,IP地址较大的设备将作为Server,IP地址较小的设备将作为Client。Client向Server发起TCP连接请求来建立RBM控制通道。双机热备中所有设备配置的控制通道端口必须相同。
数据通道:可传输的报文类型包括热备报文和透传报文。数据通道直接使用底层驱动进行数据传输,因此仅支持二层转发。
2.2.3设备角色
双机热备中的设备具有双重角色,在管理层面将设备分为主、从两种角色,以简化系统配置和保证设备间的配置信息一致;在业务层面将设备分为主、备两种角色,以保证设备间的业务表项、上下行流量的一致和故障时的统一切换。下面将详细介绍这四种角色。
1.主、从管理角色
如图2-1所示,为了保证备设备可以平滑地接替主设备的工作,双机热备必须能够将主设备的配置信息备份到备设备。尤其在双主组网环境中,两台设备都是主设备,如果允许两台主设备之间能够相互备份配置信息,那么就会造成两台设备上配置信息相互覆盖或冲突的问题。所以,为了方便管理员对两台设备的配置信息进行统一管理,避免配置信息的混乱,我们引入了主、从管理角色的概念(也可以称作主、从管理状态)。主、从管理角色只能手工配置,不能动态选举。
图2-1主、从管理角色示意图
同步
RBMchannel
主管理设备从管理设备
配置完设备的管理角色后,系统将会在命令行提示符前增加前缀信息,以便标识设备的主、从管理角色。这样能够更加友好醒目地提示管理员设备当前的管理角色是什么。具体标示方法如下:
主管理设备:将在命令行提示符前面增加RBM_P前缀信息,如:RBM_P。
从管理设备:将在命令行提示符前面增加RBM_S前缀信息,如:RBM_S。
在RBM控制通道建立成功前,无论配置的设备管理角色是什么,其都认为自己是主管理角色,这时命令行提示符前缀总是RBM_P。在RBM控制通道建立成功后,系统将按照实际配置的管理角色显示命令行提示符前缀信息。
在双机热备组网中必须将其中一台设备配置为主管理设备,另一台设备配置为从管理设备,RBM控制通道建立后只能在主管理设备上配置相关业务,从管理设备上不能配置。配置信息只能从“主管理设备”同步到“从管理设备”,并覆盖从管理设备上对应的配置信息。
2.主、备业务角色
如图2-2所示,为保证报文的有序性处理和流量的统一管理,在数据层面双机热备将设备划分为主、备两种业务角色(也可以称作主、备业务状态,或简称“业务主”和“业务备”)。主设备处理业务,
并向备设备实时备份业务表项信息;备设备除接收主设备的业务表项备份信息外,在主设备发生故障后,备设备会转换成主设备,继续处理业务流量,保证业务不中断。
主、备业务角色由双机热备选举产生,可动态切换。初始状态下,主备工作模式中设备的主备业务角色与主从管理角色保持一致,即主管理设备就是业务主,从管理设备就是业务备;双主工作模式中两台设备均为业务主。
备份
RBMchannel
图2-2主、备业务角色示意图
主设备备设备
2.2.4建立过程
如图2-3所示,两台设备之间建立双机热备(即RBM)的详细过程如下:
(1)当两台设备配置完双机热备功能和启动进程后,它们开始协商建立RBM通道。
(2)RBM通道建立成功后,开始发送双机热备协商报文组建双机热备。
(3)当本端设备收到对端设备的双机热备协商报文后,会判断协商报文中的双机热备配置是否和本端的双机热备配置相同。若相同,则这两台设备组建双机热备成功,否则不能组建双机热备。
(4)双机热备组建成功后,两端设备会进行主、从管理角色的竞选。目前双机热备的主、从管理角色仅支持管理员手工指定,配置为主管理角色的一端将成为主管理设备,配置为从管理角色的一端将成为从管理设备。
(5)双机热备中的管理角色选定后,将进行主、备业务角色的竞选。业务角色由双机热备根据双机热备的工作模式和设备的运行状态等因素动态选举产生。
(6)双机热备中的业务角色选定后,主管理设备开始向从管理设备批量同步自己当前已有的配置信息,业务主设备