《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.1 应急预案原则

简介: 《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.1 应急预案原则

4.2 云上大型赛事应急预案


4.2.1 应急预案原则


当监控异常或者收到告警后,需要有充足的预案进行处理及快速恢复。详细的应急预案是保证服务SLA的重要手段,也是大型赛事活动的必备。

与分层监控对应的就是分层预案,注意虽然在不同的层级我们的应急手段、应急指标不同,但核心的原则不变,即应急预案应集中在如何快速止血恢复业务。对于IDC层,对应的应急预案有机房升温时应如何迅速降温、市电供电中断时如何快速上电、运营商BGP出口故障时如何做流量容灾、突发拥塞如何做绕行等等;对于云平台层,对应的应急预案主要由各产品团队设计实施,例如XGW流量打满如何限流、NC批量宕机如何快速拉起或者迁移、CDN节点流量超限如何处置等等;对于云产品层和应用业务层,则主要由保障团队和客户自身做相应的考量设计。

下面详细介绍北京冬奥保障项目中关于产品层和业务层的应急预案,我们针对不同的业务场景,梳理了预警等级、快恢方案、优化建议等等32项告警预案以及73项各类产品技术场景的预案。

相关文章
|
11月前
|
监控
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.2 北京冬奥告警预案
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.2 北京冬奥告警预案
|
11月前
|
监控
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.3 北京冬奥技术场景预案(1)
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.3 北京冬奥技术场景预案(1)
|
11月前
|
监控
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.3 北京冬奥技术场景预案(2)
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.3 北京冬奥技术场景预案(2)
|
11月前
|
监控
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.3 北京冬奥技术场景预案(3)
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.3 北京冬奥技术场景预案(3)
|
11月前
|
容灾
《医保行业容灾演练云上技术白皮书》——第四章 医保云容灾演练方案——4.5 演练风险及应对措施
《医保行业容灾演练云上技术白皮书》——第四章 医保云容灾演练方案——4.5 演练风险及应对措施
|
11月前
|
弹性计算 监控 关系型数据库
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.1 云上大型赛事监控告警——4.1.2 北京冬奥监控告警体系介绍(3)
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.1 云上大型赛事监控告警——4.1.2 北京冬奥监控告警体系介绍(3)
|
11月前
|
监控 安全 API
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.1 云上大型赛事监控告警——4.1.2 北京冬奥监控告警体系介绍(2)
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.1 云上大型赛事监控告警——4.1.2 北京冬奥监控告警体系介绍(2)
132 0
|
11月前
|
缓存 Prometheus 监控
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.1 云上大型赛事监控告警——4.1.2 北京冬奥监控告警体系介绍(1)
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.1 云上大型赛事监控告警——4.1.2 北京冬奥监控告警体系介绍(1)
106 0
|
11月前
|
存储 数据采集 运维
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.1 云上大型赛事监控告警——4.1.1 监控告警基本概念
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.1 云上大型赛事监控告警——4.1.1 监控告警基本概念
|
11月前
《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.2 北京冬奥稳定性治理实践——6.2.3 冬奥重保--风险巡检(3)
《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.2 北京冬奥稳定性治理实践——6.2.3 冬奥重保--风险巡检(3)