容灾是一个系统化、体系化的工程,通常会覆盖分析、规划、设计和实施环节。项目是否成功、是否达到设计目标,需要多种手段进行分阶段管理和衡量。通过容灾演练来验证容灾建设效果是最直接有效的手段,只有成功的演练才能最好地证明设计和交付的正确性。但同时,容灾演练是具有较大风险的过程,稍有闪失可能导致业务或数据损失。
为了保证容灾演练的成功和灾难恢复预案的有效性,本文结合多个项目的交付经验,总结出一套适合容灾项目交付的标准化参考框架,称之为“五阶十三步”。
五阶: 面向管理人员,标记交付过程的关键里程碑,并定义出容灾项目分阶段的验收范围,包括:需求分析、现状调研、容灾方案设计、演练方案设计、演练实施。
十三步:面向技术人员,定义出每个阶段的关键技术动作,方便不同的技术人员有相同的标准化流程可遵循,包括:可交付评审,应用调研,云平台调研,基础设施调研,总体方案设计,云平台容灾部署,应用容灾设计,应用容灾部署,演练场景设计,应急预案设计,DRP 方案设计,演练实施,演练复盘。
图 3-1 容灾项目标准化交付的参考框架