《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(4)

简介: 《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(4)

《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(3) https://developer.aliyun.com/article/1232029?groupCode=supportservice



6. 故障演练


演练目的是需要验证各模块的健壮性,以及在异常发生时,相关告警、异常影响范围是否符合预期以及通过故障处理预案是否可按预期恢复。演练参考用例可参考:

image.png

image.png

image.pngimage.png

image.png

image.png

image.png


7. 应急保障


OB前需要组织前中后场配合的护航保障团队以应对当天的突发情况。TAM一般作为客户的直接对接人,在现场通过监控告警协助客户发现异常,并进行初步定界和技术判断,如判断为阿里云问题或疑难问题会协同中台团队中的产品垂直线专家AES一同进行分析,如确定为产品问题会引入研发进一步协同处理。如定位后需要对线上环境进行修复,TAM需要对方案进行风险评估,并和客户讨论敲定最终修复方案。

OB护航异常处理流程如下:


image.png

常见问题排障思路参考图:


image.png


相关文章
|
Linux
QT桌面(实现界面的滑动切换)
QT桌面(实现界面的滑动切换)
715 1
|
机器学习/深度学习 监控 算法
吸烟行为检测系统(Python+YOLOv5深度学习模型+清新界面)
吸烟行为检测系统(Python+YOLOv5深度学习模型+清新界面)
2131 0
吸烟行为检测系统(Python+YOLOv5深度学习模型+清新界面)
flutter开发中Use ‘const’ with the constructor to improve performance. Try adding the ‘const’ keyword to the constructor invocation.报错如何解决-优雅草卓伊凡
flutter开发中Use ‘const’ with the constructor to improve performance. Try adding the ‘const’ keyword to the constructor invocation.报错如何解决-优雅草卓伊凡
258 1
|
存储 Kubernetes 容器
Kubernetes 存储选项:持久化卷与存储类
【8月更文第29天】随着容器化的普及,越来越多的应用程序需要持久化数据以保持状态信息。Kubernetes 提供了一套完整的解决方案来管理和配置持久化存储,包括持久卷 (Persistent Volume, PV)、持久卷声明 (Persistent Volume Claim, PVC) 和存储类 (StorageClass)。本文将详细介绍这些概念,并通过实际示例来演示如何在 Kubernetes 中配置存储。
1102 3
|
存储 Prometheus 监控
SLS时序监控实战: Spring Boot应用监控最佳实践
当今随着云原生和微服务的盛行, 我们的应用的运行环境也变得越来越复杂, 也使得我们越来越难以掌握它的运行状态, 也因此诞生了一批开源软件来帮助我们提升应用的可观察性, 例如prometheus, grafana, open tracing, open telementry等, 这些多半是比较通用的技术, 在实际的场景下, 我们需要怎么从各个层面来做监控和数据的分析呢, 我们就以大家使用最多的技术栈: Java + Spring Boot为例, 来详细阐述应用监控的最佳实践
8433 0
SLS时序监控实战: Spring Boot应用监控最佳实践
|
关系型数据库 MySQL Nacos
生产环境下的终极指南:在生产环境部署 Nacos 集群和高可用 MySQL 使用 Docker
生产环境下的终极指南:在生产环境部署 Nacos 集群和高可用 MySQL 使用 Docker
1554 0
|
C++
Leetcode第56题(合并区间)
这篇文章介绍了LeetCode第56题“合并区间”的解题方法,通过排序和贪心策略合并重叠区间,并提供了C++的代码实现。
372 0
Leetcode第56题(合并区间)
|
存储 监控 调度
Django中的定时任务与后台任务队列的实践
【6月更文挑战第10天】在Django中实现定时任务和后台任务队列,可以使用Celery+Beat进行定时任务,Django Q处理后台任务。Celery配置包括设置Broker和Result Backend,创建Celery实例及任务。Django Q则涉及安装、配置ORM和创建任务。通过`async_task`将任务放入队列。注意性能、资源、安全和错误处理。使用时需考虑认证、输入验证、日志监控、部署策略和测试质量保障。
Django中的定时任务与后台任务队列的实践
|
存储 缓存 安全
动态DMA映射指南 【ChatGPT】
动态DMA映射指南 【ChatGPT】