《云上容灾交付服务白皮书》——3交付标准化参考框架——3.5 演练实施(下)

简介: 《云上容灾交付服务白皮书》——3交付标准化参考框架——3.5 演练实施(下)

《云上容灾交付服务白皮书》——3交付标准化参考框架——3.5 演练实施(上) https://developer.aliyun.com/article/1229833?groupCode=supportservice



组织保障是否到位,是容灾演练成功与否的最关键因素之一。在大型项目中,涉及的关联团队通常比较复杂。在演练开始前,需要梳理保障团队,并举行演练开工会,保证每个团队的参与人清楚时间和职责范围。下图是阿里云某大型项目容灾演练的保障队形及职责分工的一个例子。


image.png

图 3-17 容灾演练人员保障矩阵


容灾演练组织保障的重点关注项如下:

应确保业务验证人员熟悉业务,确保在有限的时间窗口内,高效地完成业务验证。

应确保和远程保障的技术专家沟通到位,确保深夜出现紧急的复杂问题时,能够及时联系产品技术专家。

应明确问题管理负责人和问题修复负责人,确保问题通报和问题修复的过程有序开展。


3.5.2 演练复盘


容灾演练是为了全方位验证灾难场景下的响应能力,包括方案、技术、流程、人员等综合因素。通过演练发现系统短板,通过复盘动作持续修复短板。复盘的基本逻辑是一个PDCA(Plan-Do-Check-Act)的循环过程。


image.png

图 3-18 演练复盘的流程


容灾演练复盘的重点关注项如下:


应检查演练的场景,确保能够应对真实世界中的故障场景。

应检查演练的计划,是否按期完成。如未完成,应评估客观因素,是否需要和有条件新增演练窗口。

应评估业务的影响范围,确保影响的用户数、功能和时间是在可接受范围内。

应检查组织保障机制,确保分工明确、职责清晰。

应分析方案改进点,识别在容灾方案和演练方案上可优化改进的地方。

应分析技术改进点,识别在容灾切换演练的过程中,可观察、可灰度、可回滚三个维度上可改进的地方。

应分析管理改进点,识别在变更评审、组织协调上可改进的地方。

应评估人员成长的情况,分别对自有人员和合作方的能力,是否可达到自主开展容灾切换的水平。

应明确改进的落地计划,对于识别出来的改进项,任务分解到跟踪人、负责人和时间计划。


相关文章
|
资源调度 算法 关系型数据库
5G 物理层|带你读《5G无线网络规划与设计》之十
使用非授权频谱是移动通信系统扩展频谱资源的重要手段之一。非授权频谱上的业务非常繁忙,抢占信道最好的方法是一旦发现信道空闲马上开始传输。在 LTE 中,资源调度以时隙为单位,即使监听到信道空闲,也必须等到下一个时隙开始进行传输
5G 物理层|带你读《5G无线网络规划与设计》之十
|
8月前
|
Java 关系型数据库 MySQL
weixin050高校体育场管理系统+ssm(文档+源码)_kaic
本文针对高校体育场管理系统的开发与实现进行详细介绍。随着经济快速发展,人们对手机软件需求增加,高校体育场管理系统应运而生。系统采用JAVA技术、Mysql数据库和SSM框架等成熟技术,通过分析功能需求、可行性及性能,设计出包含管理员、用户和学生角色的功能模块。系统实现用户注册登录、信息管理等功能,简化传统手工统计模式,提高管理效率,满足用户对信息获取的及时性与准确性需求。
weixin050高校体育场管理系统+ssm(文档+源码)_kaic
|
消息中间件 canal 缓存
项目实战:一步步实现高效缓存与数据库的数据一致性方案
Hello,大家好!我是热爱分享技术的小米。今天探讨在个人项目中如何保证数据一致性,尤其是在缓存与数据库同步时面临的挑战。文中介绍了常见的CacheAside模式,以及结合消息队列和请求串行化的方法,确保数据一致性。通过不同方案的分析,希望能给大家带来启发。如果你对这些技术感兴趣,欢迎关注我的微信公众号“软件求生”,获取更多技术干货!
597 6
项目实战:一步步实现高效缓存与数据库的数据一致性方案
|
存储 关系型数据库 MySQL
|
前端开发 JavaScript 程序员
【前端开发---Vue2】史上最详细的Vue2入门教程,从基础到进阶带你彻底掌握Vue(三)
【前端开发---Vue2】史上最详细的Vue2入门教程,从基础到进阶带你彻底掌握Vue(三)
Commons StringSubstitutor对模板占位符进行赋值
Commons StringSubstitutor对模板占位符进行赋值
423 0
|
数据采集 人工智能 监控
揭秘数据治理:七步工作法&十大准则全解析
数据治理的“七步工作法”与“十大准则”为企业构建科学、系统、高效的数据治理体系提供了重要的指导和借鉴。企业应结合自身实际情况,灵活运用这些方法和准则,充分挖掘数据潜能,赋能业务创新,实现数字化转型的稳健推进。
1243 0
|
SQL 关系型数据库 MySQL
MySQL的事务处理
MySQL的事务处理
|
存储 Rust 安全
Rust中避免不必要的内存分配与复制的优化策略
在Rust编程语言中,内存分配与复制是常见的性能瓶颈。本文深入探讨了如何在Rust中避免不必要的内存分配和复制,包括使用栈分配、借用与所有权、智能指针、以及零拷贝策略等。通过理解这些概念并应用相应的优化策略,Rust开发者可以显著提高代码的性能和效率。
|
应用服务中间件 测试技术 Linux