《云上容灾交付服务白皮书》——3交付标准化参考框架——3.5 演练实施(上)

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 《云上容灾交付服务白皮书》——3交付标准化参考框架——3.5 演练实施(上)

3.5 演练实施


演练实施的核心逻辑是验证容灾效果,并找到改进方向。在这个过程中,需要重点关注的两个步骤:


1. 容灾演练:根据上一节的演练场景设计,将容灾演练分批次开展,便于有效地分散和控制容灾演练的风险。


2. 演练复盘:通过对演练完成的情况以及存在的问题进行评估,并找到改进方向,为下一次容灾演练做准备。


3.5.1 容灾演练


分批次容灾演练,是将演练的场景分批次进行,以控制每次演练的风险范围。容灾演练窗口的设计,主要的评估因素是影响业务的范围和时间。因此,对生产系统的任何容灾演练,必然是在业务流量最小的时间段内开展。


任何形式的容灾演练,本质上是对生产系统的一种变化,而变化是产生风险的基本因素。因此容灾演练的窗口,必须包含切换时间和应急时间。从变更三板斧的角度看,回滚是重要的应急措施。切换和回滚是一个相反的操作,因此应保证用于回滚的应急时间,大于等于切换时间。规划容灾演练窗口时间,常见的方式是:容灾演练窗口 (t)= 切换时间(t1)+ 应急时间 (t2),且 t2 ≥ t1。


下面分别举例子说明,常见业务场景的容灾演练窗口是如何设计的。


场景 1:7x24 小时的在线业务,用户对系统响应的实时性要求最高,且用户数量比较大,业务高峰期主要集中在非睡眠时间,如银行机构的手机银行系统。这类业务的特点包括:① 7x24 小时有业务访问流量;② 凌晨 2 点至 6 点,是业务访问流量最小的时间段。因此常见的演练窗口为凌晨 2 点至 6 点,其中 2 点至 4 点是容灾切换时间 (t1),4 点至6 点是应急时间 (t2)。

image.png

图 3-14 高度敏感业务的演练窗口


场景 2:7x24 小时的在线业务,用户实时性要求较高,且用户数量较大,业务高峰期主要集中在白天,如医保结算系统。业务特点包括:① 7x24 小时有业务;② 夜间 21点至上午 8 点,是业务流量最小的时间。因此常见的演练窗口为夜间 21 点至上午 8 点,其中 21 点至 0 点是容灾切换时间 (t1),0 点至 8 点是应急时间 (t2)。


image.png

图 3-15 一般敏感业务的演练窗口


场景 3:离线任务,每日定时运行的大数据加工任务,如许多行业的大数据分析系统。业务特点包括:①凌晨 23 点开始至上午 9 点期间,是大数据系统进行数据汇集和加工的时间;②其他时间只有少量的流量访问大数据系统。因此常见的演练窗口为夜间 19点至 23 点,其中 19 点至 21 点是容灾切换时间 (t1),21 点至 23 点是应急时间 (t2)。


image.png

图 3-16 大数据场景的演练窗口



《云上容灾交付服务白皮书》——3交付标准化参考框架——3.5 演练实施(下):

https://developer.aliyun.com/article/1229830?groupCode=supportservice

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
编解码 数据安全/隐私保护 iOS开发
uniapp IOS从打包到上架流程(详细简单) 原创
uniapp IOS从打包到上架流程(详细简单) 原创
536 0
|
Java Apache Spring
springboot如何导出Excel某个表的表字段以及字段类型
springboot如何导出Excel某个表的表字段以及字段类型
390 0
|
10月前
|
自然语言处理 调度 决策智能
Coconut:基于连续潜在空间推理,提升大语言模型推理能力的新方法
Coconut提出了一种新的大语言模型推理范式,通过在潜在空间中运算,利用隐藏层生成的连续思维状态取代传统文本推理。该方法采用广度优先搜索探索多条路径,避免单一路径局限,显著提升逻辑任务性能并减少token消耗。 Coconut结合“语言模式”和“潜在模式”动态切换,通过多阶段课程学习优化推理能力,在复杂规划任务中表现卓越,尤其在GSM8k和ProsQA等任务中优于传统模型。实验表明,Coconut能有效捕获中间变量,减少幻觉错误,具备更强的推理规划能力。
414 2
Coconut:基于连续潜在空间推理,提升大语言模型推理能力的新方法
|
10月前
|
消息中间件 存储 缓存
kafka 的数据是放在磁盘上还是内存上,为什么速度会快?
Kafka的数据存储机制通过将数据同时写入磁盘和内存,确保高吞吐量与持久性。其日志文件按主题和分区组织,使用预写日志(WAL)保证数据持久性,并借助操作系统的页缓存加速读取。Kafka采用顺序I/O、零拷贝技术和批量处理优化性能,支持分区分段以实现并行处理。示例代码展示了如何使用KafkaProducer发送消息。
|
存储 网络协议 Linux
NFS(Network File System 网络文件服务)
NFS(Network File System 网络文件服务)
|
测试技术 开发工具 git
Git 命令行教程:如何在 GitLab 中恢复已删除的分支
在软件开发过程中,版本控制是一个至关重要的环节。Git 是最流行的分布式版本控制系统之一,它能够帮助团队高效地管理代码。然而,有时候会发生意外,例如代码误合、错误的删除等情况,导致重要的开发分支本地和远程不慎被删除。本文将为您介绍如何使用 Git 命令行在 GitLab 中恢复已删除的分支,帮助您快速解决这类问题。
1285 0
Git 命令行教程:如何在 GitLab 中恢复已删除的分支
|
存储 Shell 数据安全/隐私保护
【Shell 编程指南】Shell read命令 (从标准输入读取数值)
【Shell 编程指南】Shell read命令 (从标准输入读取数值)
472 0
|
存储 缓存 监控
一文搞懂绍Servlet规范。
Servlet规范是JavaEE规范中的一种。在servlet规范中,指定【动态资源文件】开发步骤,在servlet规范中,指定Http服务器调用动态资源文件的规则,在servlet规范中,指定Http服务器管理动态资源文件实例对象规则。
|
Dubbo Java 应用服务中间件
Dubbo 3.x结合Zookeeper实现远程服务基本调用
ZooKeeper和Dubbo是两个在分布式系统中常用的开源框架,它们可以协同工作,提供服务注册与发现、分布式协调等功能。
269 0
|
JSON 数据挖掘 API
获取商品详情信息API接口:1688开放平台功能解析
随着互联网技术的发展,电商平台已经成为人们购物的主要渠道。在这个背景下,1688开放平台提供了丰富的API接口,帮助开发者更好地与平台交互,获取所需数据。本文将重点关注如何获取商品详情信息的API接口。