《云上容灾交付服务白皮书》——3交付标准化参考框架——3.5 演练实施(上)

简介: 《云上容灾交付服务白皮书》——3交付标准化参考框架——3.5 演练实施(上)

3.5 演练实施


演练实施的核心逻辑是验证容灾效果,并找到改进方向。在这个过程中,需要重点关注的两个步骤:


1. 容灾演练:根据上一节的演练场景设计,将容灾演练分批次开展,便于有效地分散和控制容灾演练的风险。


2. 演练复盘:通过对演练完成的情况以及存在的问题进行评估,并找到改进方向,为下一次容灾演练做准备。


3.5.1 容灾演练


分批次容灾演练,是将演练的场景分批次进行,以控制每次演练的风险范围。容灾演练窗口的设计,主要的评估因素是影响业务的范围和时间。因此,对生产系统的任何容灾演练,必然是在业务流量最小的时间段内开展。


任何形式的容灾演练,本质上是对生产系统的一种变化,而变化是产生风险的基本因素。因此容灾演练的窗口,必须包含切换时间和应急时间。从变更三板斧的角度看,回滚是重要的应急措施。切换和回滚是一个相反的操作,因此应保证用于回滚的应急时间,大于等于切换时间。规划容灾演练窗口时间,常见的方式是:容灾演练窗口 (t)= 切换时间(t1)+ 应急时间 (t2),且 t2 ≥ t1。


下面分别举例子说明,常见业务场景的容灾演练窗口是如何设计的。


场景 1:7x24 小时的在线业务,用户对系统响应的实时性要求最高,且用户数量比较大,业务高峰期主要集中在非睡眠时间,如银行机构的手机银行系统。这类业务的特点包括:① 7x24 小时有业务访问流量;② 凌晨 2 点至 6 点,是业务访问流量最小的时间段。因此常见的演练窗口为凌晨 2 点至 6 点,其中 2 点至 4 点是容灾切换时间 (t1),4 点至6 点是应急时间 (t2)。

image.png

图 3-14 高度敏感业务的演练窗口


场景 2:7x24 小时的在线业务,用户实时性要求较高,且用户数量较大,业务高峰期主要集中在白天,如医保结算系统。业务特点包括:① 7x24 小时有业务;② 夜间 21点至上午 8 点,是业务流量最小的时间。因此常见的演练窗口为夜间 21 点至上午 8 点,其中 21 点至 0 点是容灾切换时间 (t1),0 点至 8 点是应急时间 (t2)。


image.png

图 3-15 一般敏感业务的演练窗口


场景 3:离线任务,每日定时运行的大数据加工任务,如许多行业的大数据分析系统。业务特点包括:①凌晨 23 点开始至上午 9 点期间,是大数据系统进行数据汇集和加工的时间;②其他时间只有少量的流量访问大数据系统。因此常见的演练窗口为夜间 19点至 23 点,其中 19 点至 21 点是容灾切换时间 (t1),21 点至 23 点是应急时间 (t2)。


image.png

图 3-16 大数据场景的演练窗口



《云上容灾交付服务白皮书》——3交付标准化参考框架——3.5 演练实施(下):

https://developer.aliyun.com/article/1229830?groupCode=supportservice

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
前端开发 Java 程序员
记录:java.net.SocketTimeoutException: connect timed out...【亲测有效】
记录:java.net.SocketTimeoutException: connect timed out...【亲测有效】
2868 0
|
2月前
|
前端开发 编译器
前端组件库——Element Plus知识点大全(二)
教程来源 https://yyvgt.cn/category/jiulishi.html Element Plus核心组件详解:涵盖按钮(6类语义化类型、多种样式变体及图标支持)、栅格与间距布局、表单(含验证规则)、表格(排序/分页/树形等)、数据录入(输入框、选择器、时间控件等)及反馈组件(消息/弹窗/通知),并支持SCSS变量覆盖与CSS变量双模式主题定制。
|
2月前
|
资源调度 JavaScript 前端开发
前端组件库——Arco Design Vue知识点大全(一)
教程来源 https://bncne.cn/sheyingjiqiao.html Arco Design Vue是字节跳动开源的企业级Vue 3设计系统,源于抖音等亿级应用实践。聚焦设计一致性、开发提效与多端适配,具备60+高质量组件、全TypeScript支持、极致性能及可视化主题定制能力,已成为Vue 3生态中增长迅速的现代化UI解决方案。
|
4月前
|
人工智能 JSON 数据格式
抖音弹幕游戏开发之第1集:课程介绍与环境准备·优雅草云桧·卓伊凡
《抖音弹幕游戏开发专栏》由优雅草出品,云桂主讲、卓伊凡辅助,20集Python实战教程。零基础入门,教你用websocket-client监听弹幕/礼物,pyautogui模拟操作,实现“发弹幕→角色跳跃”“送花→视角旋转”等趣味互动效果。
278 7
|
5月前
|
弹性计算 人工智能 固态存储
2026阿里云服务器租用费用:包年包月和按小时收费标准与活动价格参考
2026年阿里云服务器租用费用涵盖多种实例规格及计费模式。轻量应用服务器2核2G低至38元/年(需抢购),ECS经济型e实例2核2G 3M带宽99元/年(新老同享续费不涨价),企业专享u1实例2核4G 5M带宽199元/年。GPU服务器如NVIDIA A10、V100等包年包月享4-5折优惠。价格由CPU内存、公网带宽及系统盘三部分组成,支持包年、包月、按小时计费,不同规格和时长折扣各异,实时价格以官网为准。
1092 11
|
5月前
|
机器学习/深度学习 人工智能 算法
【AI大模型面试宝典七】- 训练优化篇
【AI大模型面试宝典】聚焦强化学习核心考点:从SARSA轨迹、在线/离线数据来源,到同策略与异策略差异,深入解析PPO、DPO、GRPO等主流算法原理与优化技巧,助你系统掌握RLHF、奖励模型设计及训练稳定性方案,轻松应对大模型面试高频难题,快速提升实战能力,offer拿到手软!
751 0
|
人工智能 安全 算法
《大模型开源与闭源的深度博弈:科技新生态下的权衡与抉择》
开源智能体大模型通过开放代码和架构,构建了全球开发者协作网络,降低了技术门槛,使初创企业、小型团队及学术机构能快速进入AI领域。它透明的特性增强了用户信任,但开放性也带来质量与安全挑战。相比之下,闭源模型由大型机构开发,具备专业定制、严格质量和高安全性优势,适合对精准性和保密性要求高的场景,却因高昂成本和技术封闭限制了部分用户的灵活性。两者并非对立,而是互补关系:开源促进创新,闭源保障商用。未来,二者可能融合,形成更优发展模式。
917 31
|
SQL 监控 算法
|
数据采集 计算机视觉 异构计算
FPGA进阶(2):基于I2C协议的EEPROM驱动控制
FPGA进阶(2):基于I2C协议的EEPROM驱动控制
411 0
|
XML Prometheus 监控
基于flowcharting实现定制化业务链路动态监控
flowcharting是grafana社区提供的一款插件,其借助开源绘图工具drawio可以实现定制化的的业务链路动态监控,将各项监控指标以更加面向业务的图表形式进行展示,可以实现网络拓扑图、流程图、架构图等等各种图形,将比较分散的指标统一成可视化的监控图形。
3835 0
基于flowcharting实现定制化业务链路动态监控