HA(High Availability)高可用集群:双主,可同时承载业务服务
单核CPU一般用于中低端设备
高端交换机关键部件都会采用冗余备份
通常使用MTTR和MTBF这两个指标评价产品或系统的可靠性。
MTTR:平均修复时间(Mean Time to Repair)是指从故障到恢复正常所需的平均时间
MTBF:平均故障间隔时间(Mean Time Between Failures)是指无故障运行平均时间
可用度的计算公式为:A=MTBF/(MTBF+MTTR)
在电讯行业,99.999%的可用度意味着设备的MTTR每年不得超过5分钟。
高端交换机由主控板、业务处理板和网板组成
主控板负责交换机的控制平面和管理平面,例如路由学习、路由计算、建立LSP等工作
业务处理板负责具体业务处理,如MPLS交换,IP报文转发,QOS保证等工作
网板负责各主控板、业务处理板的连接和通信
当主控板因为硬件或软件失效出现故障时,备用主控板接管失效主控板的工作,重新启动控制平面、管理平面、以及各业务处理板。这个过程一般要持续几分钟,期间数据报文无法处理。
主用主板:处于工作状态,运行所有软件,包括运行路由协议、与邻居进行报文交互、维护路由表
备用主板:处于备份状态,也启动路由协议,但不进行报文收发和路由计算。主用主板的各种路由协议、MPLS信令协议,数据备份到备用主板上
主用主板一旦失效,备用主板立即接管失效主板并成为主用主板,这个过程称作“倒换”,倒换也可以由操作人员通过命令驱动
HA高可靠性,特征实现系统的高可靠性,支持HA特性的设备有两块单板,一块为主用板,工作在Master模式,另一块为备用板工作在Slave模式,用户不能直接对备用板进行命令操作,需要通过主用板的命令行界面进行配置,然后主用板会将配置同步给备用板,来保持主备板当前配置一致
HA主要体现两个方面
1、当主用板故障或拔出时,备用板将迅速自动取代主用板称为新的主用板,保证设备的继续运行
2、当升级设备的时候,可以先升级备用板,在手工执行主备倒换
提供冗余监控引擎:监控引擎是模块化SW的重要组件,一旦监控引擎出现问题,将无法转发通信流。在一些高端的SW(4500/5500/6500)上都配有2个监控引擎来冗余
SW使用RPR(Route Processor Redundancy)和RPR+来支持监控引擎
现在常用的技术是SSO(状态化切换)
MSFC(Multilayer Switch Feature Card) 负责路由协议的运算 (PRP+独有的)
PFC(Policy Feature Card)负责处理多层交换 (PRP+独有的)
故障切换时间 | 备用监控引擎状态 | |
RPR | 2-4分钟 | 启动但不处于运转状态 |
RPR+ | 30-60秒 | 启动并处于运转状态 |
Switch(config)#redundancy
Switch(config-red)#mode rpr-plus
Switch#show redundancy states
Switch(config)#power redundancy-mode combined | redundant 电源冗余
Switch#show power
提供电源冗余
模块化交换机通常可以安装多个电源,如果一台电源就能满足电耗需求,则可使用另一台做冗余
默认电源冗余就已被启动,在冗余模式下,系统的功耗是由两个电源分担的,也就是说是负载均衡
SSO状态化切换
Switch(config)#redundancy
Switch(config-red)#mode sso
Switch#show redundancy states
缺点:
snmp改变不能自动同步
不能镜像不能负载分担(板卡不可以同时负载业务)
同一时间只有一个激活的板卡
两块板卡的ISO版本必须运行一致
两块板卡必须插在相应的卡槽
RPR+切换
FIB表清空,路由有可能中断
静态路由可以维持