第五章应用多活的管理策略255.1 应用多活的投入产出比企业衡量是否进行应用多活的建设,一般从收益和成本两方面综合考虑。5.1.1 应用多活的收益应用多活的收益分为三部分:高可用容灾、容量拓展、创新实验田❶ 容灾:分钟级 RTO ,“业务恢复时间”和“故障恢复时间”解耦在企业生产实践中,不免会发生大大小小的故障,影响系统的稳定性。有些故障在发生后快速恢复,外部用户无感,有些故障长时间无法恢复,造成外部舆情、资金损失等问题,甚至可能导致公司破产,故障一般有如下几类:人为操作失误:常见的有配置错误、应用发布失败等等。硬件故障:常见的就是网络设备出故障,导致机房或者集群内多台服务器受影响。网络攻击:DDoS 等网络攻击断网/断电:支付宝光缆被挖断自然灾害:青云雷击导致机房电力故障26图 5-1 应用多活应对的灾难场景在应用多活架构下,本着“业务恢复时间”和“故障恢复时间”解耦的原则,在发生故障时,基于分钟级切流能力,优先恢复业务。在业务恢复的前提下,进行故障定位修复。应用多活覆盖的故障场景:公网网络故障。接入网关故障。业务应用故障。数据库等中间件故障。27两个机房间网络故