《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.1 应急预案原则

简介: 《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.1 应急预案原则

4.2 云上大型赛事应急预案


4.2.1 应急预案原则


当监控异常或者收到告警后,需要有充足的预案进行处理及快速恢复。详细的应急预案是保证服务SLA的重要手段,也是大型赛事活动的必备。

与分层监控对应的就是分层预案,注意虽然在不同的层级我们的应急手段、应急指标不同,但核心的原则不变,即应急预案应集中在如何快速止血恢复业务。对于IDC层,对应的应急预案有机房升温时应如何迅速降温、市电供电中断时如何快速上电、运营商BGP出口故障时如何做流量容灾、突发拥塞如何做绕行等等;对于云平台层,对应的应急预案主要由各产品团队设计实施,例如XGW流量打满如何限流、NC批量宕机如何快速拉起或者迁移、CDN节点流量超限如何处置等等;对于云产品层和应用业务层,则主要由保障团队和客户自身做相应的考量设计。

下面详细介绍北京冬奥保障项目中关于产品层和业务层的应急预案,我们针对不同的业务场景,梳理了预警等级、快恢方案、优化建议等等32项告警预案以及73项各类产品技术场景的预案。

相关文章
|
运维 监控 算法
稳定性保障6步走:高可用系统大促作战指南!
年年有大促,大家对于大促稳定性保障这个词都不陌生,业务场景尽管各不相同,“套路”往往殊路同归,全链路压测、容量评估、限流、紧急预案等,来来去去总少不了那么几板斧。跳出这些“套路”,回到问题的本质,我们为什么要按照这些策略来做?除了口口相传的历史经验,我们还能做些什么?又有什么理论依据?
稳定性保障6步走:高可用系统大促作战指南!
|
Kubernetes 监控 调度
在 Kubernetes 中应该如何设置 CPU 的 requests 和 limits
在 Kubernetes 中应该如何设置 CPU 的 requests 和 limits
567 0
|
10月前
|
监控 物联网 大数据
应急物资智能仓储系统解决方案
凌讯应急物资智能仓储系统集成了物联网、云计算、大数据等技术,实现了物资实时监控、精准定位和智能调度。通过RFID、二维码等自动识别技术,确保信息准确更新,支持移动端操作,快速响应突发事件,提供定制化解决方案,优化跨部门协作,提高救援效率,降低风险。
364 47
|
10月前
|
Kubernetes 容灾 Cloud Native
服务网格容灾系列场景(三):使用服务网格应对服务级故障容灾
文章介绍了使用服务网格应对服务级故障容灾的实践:服务网格ASM通过多集群、多地域部署和基于地理位置的故障转移机制,实现服务级故障的自动检测与秒级流量切换,能够确保业务在复杂故障场景下的高可用性。
|
12月前
|
人工智能 自然语言处理 搜索推荐
年度排名 | 2024年最受市场欢迎的智能客服机器人有哪些?
本文分析了2024年智能客服机器人的发展现状,并介绍了国内五大主流服务商——合力亿捷等,并重点阐述了它们的核心功能和服务优势,如多渠道对接、大模型应用、个性化服务、AI自动生成小结等,旨在帮助企业根据自身需求选择合适的智能客服解决方案。
739 1
|
自然语言处理 机器人 API
解锁电商直播新纪元:无人数字人客服如何在直播间掀起智能革命,重塑顾客服务体验的未来?
【10月更文挑战第7天】随着电商直播的兴起,客户咨询量激增,传统人工客服难以应对,无人数字人直播机器人客服应运而生。本文介绍如何使用Python、LangChain和ChatGPT搭建高效客服系统,包括安装库、设置API密钥、定义问答流程、构建FAQ知识库、集成实时聊天界面及部署上线,帮助企业自动处理客户咨询,提升用户体验。
475 2
|
人工智能 自然语言处理 搜索推荐
人人都是AI大师 - Prompt工程
prompt工程不需要复杂的编程知识,人人都可以使用prompt工程成为AI大师。本文只探讨prompt工程,不涉及模型训练等内容。只讨论文本生成,不涉及图像等领域。
|
C++ 计算机视觉
Opencv(C++)系列学习---读取视频文件和打开摄像头
Opencv(C++)系列学习---读取视频文件和打开摄像头
766 0
|
运维 自然语言处理 安全
阿里云解决方案架构师张平:云原生数字化安全生产的体系建设
企业要做安全生产建设的话,核心分为两大部分:一部分是技术体系建设,一部分是服务体系建设。
阿里云解决方案架构师张平:云原生数字化安全生产的体系建设
|
监控
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.3 北京冬奥技术场景预案(1)
《云上大型赛事保障白皮书》——第四章 监控告警与应急预案——4.2 云上大型赛事应急预案——4.2.3 北京冬奥技术场景预案(1)
181 0