《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.3 关键时刻保障——4.3.3 热点事件护航保障流程

简介: 《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.3 关键时刻保障——4.3.3 热点事件护航保障流程

4.3.3 热点事件护航保障流程

 

4.3.3.1 明确护航目标


明确本次活动在业务上最终需要达到什么样的目标即可符合预期。护航目标主要 包含整体业务活动目标明确与整体活动架构方案确认,通俗来讲在护航前需要对客户 的业务架构、应用架构、数据架构、技术架构等进行梳理及对保障方案进行确认,并 通过压测数据对本次活动的流量等指标进行评估,通过不断探底来确保云上可以完美 承载业务压力即为护航目标

 

云上护航服务checklist

护航流程

检查

任务评估

责人

 

完成 

备注及  题风险

 

 

 

 

 

 

 

 

航目标对焦

 

业务目标确认

 

活动预估流量/访问量

(QPS/TPS)

 

/

 

/

 

/

 

/

 

技术目标确认

 

全风控             (DDOS峰值、WEB防护)

 

/

 

/

 

/

 

/

活动日期确认

高峰时间点

/

/

/

/

 

 

保障方式确认

 

障方案沟通+活动驻场支持, 其余远程保障为主

 

 

/

 

 

/

 

 

/

 

 

/

 

 

 

系统容量分析

资源需求报

源需求评估,

提前一个月报备阿里云

/

/

/

/

资源准备预

云为客户

准备并预留资源

/

/

/

/

 

 

资源风险识

心实例梳理

ECSRDSSLBRedis DRDS、MQES

/

/

/

/

资源使用率巡检

CPU/MEM/IOPS/ 盘空间等

/

/

/

/

 

 

安全风险识别

账户安

因素认证、操作审计、 访问控

/

/

/

/

账户安

堡垒机访问权限 ***

/

/

/

/

务安全

安全产品接入状态

/

/

/

/

案确认

案确认

/

/

/

/

整体验收

验收报告确

/

/

/

/

复盘

大促复

复盘保障得失,总结经验, 沉淀流程工具

/

/

/

/


4.3.3.2 设计护航方案


护航方案的设计理念,1、确保客户业务无损的在云上运行,2、确保服务的即时 性,拉通产品7*24小时保障护航,3、设计相关的应急预案,在业务有损的情况下有 回滚恢复。


航应急方案

点大项

事项描

任人

计划完成时间

实际完成时间

 

提前预

/

/

/

急预案

/

/

/

各个产品的紧急落地预案

现场预

/

/

/

播报流程、问题升级流程

 

控告警项配置

护航群预警

/

/

/

告警推送/风险巡检同步

监控告警配置

/

/

/

ECSSLB监控大盘及告警配置

务大盘

护航群建设

/

/

/

 

应急人

/

/

/

ECSSLB等应急人员名单

 


4.3.3.3 风险巡检及评估


通过架构梳理及全链路评估,对架构及全链路风险进行识别,达到风险提前

的作用。


动巡检风险

风险描述

风险等级

风险规避方案

任人

风险规避时间

*

*

*

*

*

*


*

*

*

*


4.3.3.4 护航事件记录


记录护航时间段出现的事件、风险及重点时间节点等,在后续可以根据记录

题进行针对性复盘。


航事件记录

事件描

任人

否解决

 

 

 

 

 


4.3.3.5 护航大


屏功能:

可以实时关注客户业务实例的资源使用及网络情况,并能实时关注客户侧保有量 从而间接体现出业务高峰期所对应云上的压力。为上云的客户提供了,可扩展性、可 复制性的便利。

image.png

相关文章
|
11月前
|
编解码 监控 视频直播
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.3 关键时刻保障——4.3.2 直播业务保障方案
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.3 关键时刻保障——4.3.2 直播业务保障方案
88 0
|
11月前
|
存储 Serverless 调度
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.3 关键时刻保障——4.3.1 图片业务保障方案
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.3 关键时刻保障——4.3.1 图片业务保障方案
80 0
|
11月前
|
存储 监控 安全
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.3 关键时刻保障——4.3.4 重大活动和赛事保障
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.3 关键时刻保障——4.3.4 重大活动和赛事保障
101 0
|
11月前
|
监控 网络协议 UED
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.1 社交平台可靠性——4.1.1行业质量监控指标
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.1 社交平台可靠性——4.1.1行业质量监控指标
306 0
|
11月前
|
存储 运维 算法
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(3)
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(3)
362 0
|
11月前
|
弹性计算 监控 Kubernetes
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(9)
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(9)
89 0
|
11月前
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(2)
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(2)
298 0
|
11月前
|
存储 弹性计算 运维
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(6)
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(6)
91 0
|
11月前
|
存储 负载均衡 监控
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(7)
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(7)
103 0
|
11月前
|
负载均衡
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(8)
《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(8)
78 0