《云上大型赛事保障白皮书》——第七章 保障阵型与流程管理——7.2 云上大型赛事流程管理——7.2.2 北京冬奥应急流转流程

简介: 《云上大型赛事保障白皮书》——第七章 保障阵型与流程管理——7.2 云上大型赛事流程管理——7.2.2 北京冬奥应急流转流程

7.2.2 北京冬奥应急流转流程


依据北京冬奥组委的整体技术运行计划,此次保障的SLA如下表所示。由于奥运业务的极端重要性,因此本次SLA制定的非常激进和严格。对于最高等级的P1故障,要求在1个小时内解决。

1684906369908.png

因此我们精心设计了前中后台的角色和流程,确保任何级别的问题我们都可以在SLA内处理。针对于服务请求和P4问题,我们定义为普通问题,针对于P4以上问题,我们定义为故障问题,对于故障问题,我们采用了在上一小节所阐述的应急流程,基于协同工具云鼎进行快速的故障应急处置。具体的应急流程如下图所示。

具体的应急流程如下图所示。

image.png图:故障应急流程

在实际操作中,会由前线和中台协同进行上报和主导故障排查。因此,对OCOC中台团队,我们制定了详细的普通问题和故障问题的处理流程,如下图所示。我们根据业务影响来决定我们的服务行为,是做重按照抽丝剥茧的方式来体现技术深度,还是做轻按照短平快的方式来体现服务响应能力。

image.png

图:技术中台(OCOC)团队视角问题流转流程

在整个北京冬奥保障过程中,我们全部满足了约定的SLA,没有发生服务风险。

相关文章
|
网络协议 网络架构
TCP/IP协议中分包与重组原理介绍、分片偏移量的计算方法、IPv4报文格式
本文章讲述了什么是IP分片、为什么要进行IP分片、以及IP分片的原理及分析。分片的偏移量的计算方法,一个IPv4包前三个分片的示例。还讲述了IPv4表示字段的作用,标志位在IP首部中的格式以及各个标志的意义:.........
4233 0
TCP/IP协议中分包与重组原理介绍、分片偏移量的计算方法、IPv4报文格式
|
4月前
|
人工智能 移动开发 物联网
ModelScope魔搭25年6月发布月报
从2022年11月的青涩发布,魔搭现今已进入第三个年头,成为中国最大最活跃的开源模型社区,与超过1600万的开发者同行。
229 6
Linux:nohup、&、 2>&1、/dev/null
Linux:nohup、&、 2>&1、/dev/null
|
Web App开发 数据可视化 Docker
|
12月前
|
并行计算 Ubuntu 算法
Ubuntu18 服务器 更新升级CUDA版本 pyenv nvidia ubuntu1804 原11.2升级到PyTorch要求12.1 全过程详细记录 apt update
Ubuntu18 服务器 更新升级CUDA版本 pyenv nvidia ubuntu1804 原11.2升级到PyTorch要求12.1 全过程详细记录 apt update
360 0
|
JSON 前端开发 JavaScript
Java接收前端请求体方式
Java接收前端请求体方式
268 0
|
人工智能
如何优化人工智能人才培养体系以适应快速发展的AI技术?
【6月更文挑战第1天】如何优化人工智能人才培养体系以适应快速发展的AI技术?
243 4
|
机器学习/深度学习 自然语言处理 算法
【论文泛读】 知识蒸馏:Distilling the knowledge in a neural network
【论文泛读】 知识蒸馏:Distilling the knowledge in a neural network
【论文泛读】 知识蒸馏:Distilling the knowledge in a neural network
|
缓存 前端开发 开发者
基于Next.js的服务端渲染(SSR)
基于Next.js的服务端渲染(SSR)
306 0
|
监控 安全 关系型数据库
稳定性之故障应急处理流程
尽管可以通过稳定性体系建设,来避免出现生产系统故障。但是仍然无法彻底避免一点风险都不会产生,当稳定性风险产生后,怎么快速协调组织,缩短故障时长,科学的流程呢?
稳定性之故障应急处理流程