《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.3 关键时刻保障——4.3.4 重大活动和赛事保障

简介: 《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.3 关键时刻保障——4.3.4 重大活动和赛事保障

4.3.4 重大活动和赛事保障

 

4.3.4.1 保障概述


大活动和顶级赛事期间阿里云对客户业务提供全程业务护航保障服务,针对 客户业务性和资源使用情况提前梳理风险点并制定保障方案,确保期间业务平稳 行。

 

4.3.4.2 保障信息同步


前阿里云与客户共同确认保障时间段以及保障期间管控动作,确认资源需 求、更管控、在线值守、信息同步机制等。

 

4.3.4.3 巡检与风险治理

 

务类型

检项

房物理设施

力、空调、油料储备

风险

 

理网络设备、水位。

风险

络实例规格、水位。

风险

算资源容量、水位、风险。

风险

存储

云盘OSS水位;容量和QPS情况。

风险

安全

安全品规格合理,各类产品配置齐全。

风险

CDN

容量检查,带宽储备充足。

风险

DCDN

容量查,满足预估突发请求。

风险

监控

核实护航域名,配置监控告警。

风险

数据报接口测试,数据正常上报。

风险

户证书

名证书检查。

风险

 

 

4.3.4.4 应急预案

 

常情况

1

机房电力、空凋等物理环境异常。

油运行正常,有量储备充足。

调系统备份正常。

2

理网络水位异常

客户,业务流量调度

3

网络水位异常

自动限速并通知客户,客户调整流

4

储水位异常

响应处理

5

OSS码异常

配置告,重保团队响应处理

6

个域名或节点异常

配置告,重保团队响应处理

7

直播播整体带宽超限

据大盘水位决策承接或切量

8

直播推流异常

配置告,重保团队响应处理

9

批量卡顿或拉流失败

应急响应,执行快恢和兜底方案。


4.3.4.5 保障演练


阿里云保障团队根据保障业务类型选定多个场景进行全链路保障演练。演练前后 端团队按照实战场景触发问题上报、问题升级、应急处置等各个环节,验证机制流程 和各预案的有效性。

 

4.3.4.6 保障值守

 

系方式

XX

/

障总指挥

XX

/

客户服务负责人-值班

XX

/

户服务工程师

XX

/

决方案负责人

相关文章
|
负载均衡 算法 应用服务中间件
Nginx系列教程(08) - Upstream Server 负载均衡
Nginx系列教程(08) - Upstream Server 负载均衡
1297 0
|
人工智能 并行计算 开发工具
阿里云Q2财报:开放、开源、开发者
阿里云Q2财报:开放、开源、开发者
1461 0
阿里云Q2财报:开放、开源、开发者
|
负载均衡 算法 数据安全/隐私保护
|
容灾 网络协议 数据库
云卓越架构:云上网络稳定性建设和应用稳定性治理最佳实践
本文介绍了云上网络稳定性体系建设的关键内容,包括面向失败的架构设计、可观测性与应急恢复、客户案例及阿里巴巴的核心电商架构演进。首先强调了网络稳定性的挑战及其应对策略,如责任共担模型和冗余设计。接着详细探讨了多可用区部署、弹性架构规划及跨地域容灾设计的最佳实践,特别是阿里云的产品和技术如何助力实现高可用性和快速故障恢复。最后通过具体案例展示了秒级故障转移的效果,以及同城多活架构下的实际应用。这些措施共同确保了业务在面对网络故障时的持续稳定运行。
|
11月前
|
存储 JSON API
Python测试淘宝店铺所有商品接口的详细指南
本文详细介绍如何使用Python测试淘宝店铺商品接口,涵盖环境搭建、API接入、签名生成、请求发送、数据解析与存储、异常处理等步骤。通过具体代码示例,帮助开发者轻松获取和分析淘宝店铺商品数据,适用于电商运营、市场分析等场景。遵守法规、注意调用频率限制及数据安全,确保应用的稳定性和合法性。
|
机器学习/深度学习 算法 Python
深度解析机器学习中过拟合与欠拟合现象:理解模型偏差背后的原因及其解决方案,附带Python示例代码助你轻松掌握平衡技巧
【10月更文挑战第10天】机器学习模型旨在从数据中学习规律并预测新数据。训练过程中常遇过拟合和欠拟合问题。过拟合指模型在训练集上表现优异但泛化能力差,欠拟合则指模型未能充分学习数据规律,两者均影响模型效果。解决方法包括正则化、增加训练数据和特征选择等。示例代码展示了如何使用Python和Scikit-learn进行线性回归建模,并观察不同情况下的表现。
1722 3
|
人工智能 搜索推荐 API
一键解锁:快速上手文心一言指令编程实践
【7月更文第18天】随着人工智能技术的飞速发展,对话式AI已经成为连接人与信息的新桥梁。百度的“文心一言”(ERNIE)作为国内领先的预训练语言模型,以其强大的语义理解和生成能力,正逐步改变我们获取信息和交互的方式。本文旨在为开发者提供一份快速上手指南,通过实际代码示例,深入浅出地介绍如何利用文心一言API进行指令编程,解锁AI对话新体验。
797 7
|
Kubernetes Java Linux
ChaosBlade常见问题之阻止chaosblade和沙盒进程如何解决
ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集:
420 0
|
Web App开发 编解码 前端开发
浏览器之性能指标-CLS(二)
浏览器之性能指标-CLS(二)
516 0