《云上容灾交付服务白皮书》——3交付标准化参考框架——3.5 演练实施(下)

简介: 《云上容灾交付服务白皮书》——3交付标准化参考框架——3.5 演练实施(下)

《云上容灾交付服务白皮书》——3交付标准化参考框架——3.5 演练实施(上) https://developer.aliyun.com/article/1229833?groupCode=supportservice



组织保障是否到位,是容灾演练成功与否的最关键因素之一。在大型项目中,涉及的关联团队通常比较复杂。在演练开始前,需要梳理保障团队,并举行演练开工会,保证每个团队的参与人清楚时间和职责范围。下图是阿里云某大型项目容灾演练的保障队形及职责分工的一个例子。


image.png

图 3-17 容灾演练人员保障矩阵


容灾演练组织保障的重点关注项如下:

应确保业务验证人员熟悉业务,确保在有限的时间窗口内,高效地完成业务验证。

应确保和远程保障的技术专家沟通到位,确保深夜出现紧急的复杂问题时,能够及时联系产品技术专家。

应明确问题管理负责人和问题修复负责人,确保问题通报和问题修复的过程有序开展。


3.5.2 演练复盘


容灾演练是为了全方位验证灾难场景下的响应能力,包括方案、技术、流程、人员等综合因素。通过演练发现系统短板,通过复盘动作持续修复短板。复盘的基本逻辑是一个PDCA(Plan-Do-Check-Act)的循环过程。


image.png

图 3-18 演练复盘的流程


容灾演练复盘的重点关注项如下:


应检查演练的场景,确保能够应对真实世界中的故障场景。

应检查演练的计划,是否按期完成。如未完成,应评估客观因素,是否需要和有条件新增演练窗口。

应评估业务的影响范围,确保影响的用户数、功能和时间是在可接受范围内。

应检查组织保障机制,确保分工明确、职责清晰。

应分析方案改进点,识别在容灾方案和演练方案上可优化改进的地方。

应分析技术改进点,识别在容灾切换演练的过程中,可观察、可灰度、可回滚三个维度上可改进的地方。

应分析管理改进点,识别在变更评审、组织协调上可改进的地方。

应评估人员成长的情况,分别对自有人员和合作方的能力,是否可达到自主开展容灾切换的水平。

应明确改进的落地计划,对于识别出来的改进项,任务分解到跟踪人、负责人和时间计划。


相关文章
|
存储 设计模式 容器
专题八图形窗口与坐标轴-3
专题八图形窗口与坐标轴
472 0
|
算法 安全 数据安全/隐私保护
什么是国密证书?
什么是国密证书?
727 0
|
自然语言处理 监控 搜索推荐
Elasticsearch的应用场景
Elasticsearch的应用场景
|
测试技术 持续交付 Apache
Python性能测试新风尚:JMeter遇上Locust,性能分析不再难🧐
Python性能测试新风尚:JMeter遇上Locust,性能分析不再难🧐
645 3
|
供应链 安全 数据安全/隐私保护
在 Active Directory 中批量管理组和用户的方法
Active Directory (AD) 是 Microsoft 提供的目录服务,用于管理数字身份。随着组织规模的扩大,AD 的管理复杂性增加,可能导致安全漏洞。本文介绍了批量管理 AD 组和用户的方法,包括使用管理工具、分离用户和计算机 OU、创建独立的安全组 OU、使用安全组分配权限、创建受限制的本地组、定期清理 AD、自动化常见任务和实施变更控制。这些方法有助于提高管理效率和安全性。
457 1
|
SQL 数据库
SQL Server 如何进行备份?
【8月更文挑战第20天】SQL Server 如何进行备份?
621 3
|
存储 监控 安全
OSS如何保证数据安全?
【7月更文挑战第19天】OSS如何保证数据安全?
1077 7
|
监控 NoSQL JavaScript
《Redis服务监控神器:用RedisLive轻松掌控实时数据》
【8月更文挑战第13天】确保Redis稳定运行可通过监控工具RedisLive实现,它实时监控服务状态以便及时处理问题。RedisLive是款开源工具,具备易用、实时与可视化特性,透过Web界面展示内存使用及命令统计等关键指标。使用前需确认已安装Redis、Node.js环境,并配置MongoDB用于数据持久化。安装步骤包括克隆项目、安装依赖、配置连接信息,最后启动应用并通过浏览器访问监控页面。
619 0
|
前端开发 算法 JavaScript
如何优化前端性能:探索图片压缩与延迟加载技术
本文深入探讨了前端性能优化中的关键问题:图片压缩与延迟加载技术。通过介绍图片压缩的原理和方法,并结合实例说明了如何有效减少图片大小、提升加载速度;同时,详细解析了延迟加载技术的实现原理及其在提高页面加载性能中的作用,为前端开发者提供了实用的优化方案。
|
存储 弹性计算 运维
如何利用阿里云实现高效低成本灾备演练?
如何利用阿里云实现高效低成本灾备演练?
1244 6
如何利用阿里云实现高效低成本灾备演练?