随着数字金融业务的快速发展,传统集中式生产环境已经很难满足需求。当前演化方向是“异 地多活”的单元化架构,以单元化机房(后面简称为 LDC)为基础运行单元,以满足快速发展 的数字金融业务对基础设施扩展和容灾的高时效性、金融级安全性要求。
金融机构普遍采用的“两地三中心”架构有几个典型的不足,一是该架构要求同城双中心 具备接近的机房容量以满足全量切换,二是该架构模式下异地容灾系统平时一般是“冷”的, 并不真正承载业务流量, 且灾难发生时很难接管全量业务。随着新建数据中心普遍集中在内蒙、 贵州等远离传统数据中心的地域,新老数据中心容量配比很不均衡等客观条件限制下,要求金 融机构在运行架构上突破“两地三中心”的传统模式,向 N+1“多活”的灾备方案演进,进一 步提升故障恢复的体系性能力。
“异地多活架构”是指基于 LDC 单元化架构的扩展能力,在不同地域的 IDC 中部署 LDC 单元,并且每个 LDC 单元都是“活”的,是真正承接线上真实业务流量的,在发生故障时, 可以进行 LDC 单元之间的快速切换。 异地多活单元化架构解决了以下四个关键问题:
① 由于尽量减少了跨单元交互和使用异步化,使得异地部署成为可能。整个系统的水平可伸 缩性大大提高,不再依赖同城 IDC;
② 可以实现 N+1 的异地灾备策略,大大缩减灾备成本,同时确保灾备设施真实可用;
③ 整个系统已无单点存在,大大提升了整体的高可用性;同城和异地部署的多个单元可用作 互备的容灾设施,通过运维管控平台进行快速切换,有机会实现 100% 的持续可用率;
④ 该架构下业务级别的流量入口和出口形成了统一的可管控、可路由的控制点,整体系统的 可管控能力得到很大提升。基于该架构,线上压测、流量管控、灰度发布等以前难以实现的运 维管控模式,现在能够十分轻松地实现。