在国家政策引导及数字化转型的大趋势下,我国的各主要行业根据自身业务特点及需求来规划容灾建设步伐,并以稳健而有序的方式推进。同时,随着业务的发展及整合,核心业务系统承担了更多更重要的责任,对业务连续性要求也更高。因系统集中而带来的风险集中就越发突出,如何防范就变得尤为重要。公共行业涉及国计民生,其中金融和医保两个行业尤其受到国家和公众的关注,因此本文将重点围绕这两个行业进行分析。
1.3.1 金融行业
行业规范性要求
无论是传统金融业,还是步入新模式的现代金融业,均与科技创新有着密不可分联系。一方面,科技创新的过程在不断放大资金的需求;另一方面,科技创新的成果运用到金融业务后,会显著提升金融服务的质量和效率。
金融行业有着极高的业务连续性要求,在高速发展中对 IT 系统的信息化、数据安全的依赖越来越高,对于保护信息系统免受自然灾害、物理损坏、人为故障等的挑战也越来越高。
我国政府及金融监管机构历来高度重视金融行业安全稳定运行及发展,出台一系列标准及规范以促进金融行业的灾备建设,如下:
《网上银行信息系统安全通用规范》(JR/T 0068-2020)
《云计算技术金融应用规范 容灾》(JR/T 0168-2018)
《金融行业信息系统信息安全等级保护实施指引》(JR/T 0071-2012)
《商业银行数据中心监管指引》(银监办发 [2010] 114 号)
《银行业信息系统灾难恢复管理规范》(JR/T 0044-2008)
其中,JR/T 0168-2018 由中国人民银行制定并于 2018 年 8 月 15 日实施,是云计算技术金融应用规范的系列标准之一。该标准规定了金融领域云计算平台的容灾要求,包括云计算平台容灾能力分级、灾难恢复预案与演练、组织管理、监控管理等内容。在遵循 GB/T 20988-2007 标准的基础上,该标准针对金融行业特点,更新定义了 4 个容灾等级和 4 个能力要素,是指导金融行业容灾建设的核心标准。其中,容灾等级 3 级并未对异地机房有强制要求。从容灾等级 4 级开始,建议异地具备相应的数据处理及备份能力,这是异地容灾的需求来源。同时,建议在异地可用区具备灾难恢复所需的全部备用数据处理能力,并处于就绪状态或运行状态。这项能力在实际落地时会存在一定的时间周期,即分阶段实现。
JR/T 0168-2018 中对容灾等级进行了定义,其中的关键指标如下:
RTO:恢复时间目标(recovery time object),指灾难发生后,信息系统或业务功能从停顿到必须恢复的时间要求。
RPO:恢复点目标(recovery point object),指灾难发生后,系统和数据必须恢复到的时间点要求。
表 1-1 应用于金融领域的云计算平台容灾能力等级关键指标要求
由于大部分项目的容灾等级在 4 级及以上,本文以金融行业常见的 4/5/6 级为例,其核心技术要求如下:
同城和异地均需提供数据灾备能力
同城和异地均需部署同等能力的网络及数据处理能力
应用系统具备高可用能力
具备自动或集中式切换能力
至少每年进行一次相关预案的更新和演练
因此,金融行业尤其是银行机构,通常会将容灾目标等级定位为 5 级,并将“两地三中心”作为目标架构。“两地三中心”可理解为同城双机房和异地灾备机房组合,即在同城可抵御单机房故障,又可利用异地机房抵御地域级灾难。同城机房通常选择在几十公里内,异地机房则要求是数百公里外,需要避开同一地震、同一电网及同一江河流域。
容灾建设现状分析
金融行业中,银行机构的容灾建设进度是最快的。早在 2002 年左右,国内大中型商业银行普遍开展了容灾体系建设。随着银监办发 [2010] 114 号《商业银行数据中心监管指引》中明确提出了灾备中心建设模式及建设时间,更进一步促进了容灾体系建设。
目前,在我国 4000 多家商业银行中,无论是大型国有商业银行、股份制银行、城商行,还是农商行,有相当比例的银行已经建设或正在建设容灾基础设施。
特别要提到的是城商行和农商行,虽然自身规模相对有限,但很多银行在容灾建设上不遗余力。考虑到业务范围、建设成本及资源利用率的因素,多数城商行或农商行会首选同城容灾,业务上以互联网金融应用作为优先试点对象;而部分城商行或农商行已经开始两地三中心或多地多中心的建设。同时,这些银行对于云计算及云化基础设施用于容灾建设的方向,也在做积极的探索和实践,利用云计算为金融服务、为容灾建设服务已成为大趋势。
《云上容灾交付服务白皮书》——2.容灾技术架构——1.3 行业容灾现状分析(下):https://developer.aliyun.com/article/1229971?groupCode=supportservice