《云上业务稳定性保障实践白皮书》——二. 理论概念——2.1 稳定性

简介: 《云上业务稳定性保障实践白皮书》——二. 理论概念——2.1 稳定性


一、引言


随着客户云上业务规模不断扩大,迭代速度不断加快,系统复杂度也随之不断提

升,如何保障云上业务稳定性这个话题也变的愈发重要。本书将从理论概念出发、围

绕故障管理体系和变更管控体系展开,并根据各行业客户稳定性实践经验,对云上业

务稳定性体系建设进行多角度的讲解。


创作团队名单


顾问组成员

王超(明稀) 陈阳(楷睿) 李斯达(木仔) 张医博(韩笠) 陈庆康(辰路)

周建平(嘉益) 徐元(英为) 王海忠(豫仁)


二、理论概念


2.1 稳定性


“稳定性是数学或工程上的用语,判别一系统在有界的输入是否也产生有界的输出。若是,称系统为稳定;若否,则称系统为不稳定”。这是维基百科上对稳定性的定义,所以当一个业务系统接收到输入后,可以产生符合预期的输出,那么认为业务系统是稳定的,否则业务系统是不稳定的。一个产品/系统其实可以分为一个个循环往复的周期单元,简单来看:


一个完整周期单元时间 = 无故障时间 + 故障恢复时间。


尽可能延长无故障时间(MTBF),缩短故障恢复时间(MTTR),提升业务整体可用性,也就是所谓的"稳定"。业务可用性也是可以通过Availability = MTBF / (MTBF + MTTR) 来度量。通常业界习惯用N个9来表征系统可用性,比如99.9%(3-9 availability),99.999%(5-9 availability)。


可用性概念在各个业务上的落地实践即为业务可用率。业务可用率是业务稳定性度量的重要指标之一,通过选取一个或者几个业务核心指标,定义该指标(集)的下跌程度和持续时长作为影响该业务可用率的定义。围绕业务场景的可用性指标定义、目标设定、系统监控能力建设,及通过目标关联,最终达成联动上下游团队确保业务视角可用性目标达成的结果。


案例定义及目标:

电商全站交易可用率目标99.995%

•可用性事件定义:因故障引发,全站交易创建、支付笔数与基线相比下跌超过20%,且持续10分钟及以上,则记为可用性事件。

•发生可用性事件后,对应时长计算为宕机时间(downtime),全年对应的可用率即可计算出来。

image.png

相关文章
|
4月前
|
移动开发 监控 前端开发
如何从0-1的建设云上稳定性?
本文将从前后端的视角整体看下我们在云上稳定性治理的一些路径和经验。首先从平台的系统架构模型出发,站在全局视角看下整个平台的风险。
|
7月前
|
移动开发 监控 前端开发
从0-1的建设云上稳定性
本文将从前后端的视角整体看下我们在云上稳定性治理的一些路径和经验。首先从平台的系统架构模型出发,站在全局视角看下整个平台的风险。
|
运维 监控 测试技术
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(4)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(4)
163 0
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(4)
|
运维
《云上业务稳定性保障实践白皮书》——二. 理论概念——2.2 故障
《云上业务稳定性保障实践白皮书》——二. 理论概念——2.2 故障
193 0
|
缓存 监控 网络协议
云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.3高可用架构建设(上)
云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.3高可用架构建设(上)
255 0
|
缓存 监控 容灾
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.3高可用架构建设(下)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.3高可用架构建设(下)
196 0
|
弹性计算 数据安全/隐私保护
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1游戏业务稳定性保障
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1游戏业务稳定性保障
151 0
|
弹性计算 运维 Kubernetes
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.2 游戏容器化部署最佳实践(1)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.2 游戏容器化部署最佳实践(1)
196 0
|
存储 弹性计算 Cloud Native
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.2 游戏容器化部署最佳实践(2)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.2 游戏容器化部署最佳实践(2)
264 0
|
弹性计算 运维 Kubernetes
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.2 游戏容器化部署最佳实践(3)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.2 游戏容器化部署最佳实践(3)
237 0
下一篇
DataWorks