《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.3 关键时刻保障——4.3.3 热点事件护航保障流程

简介: 《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.3 关键时刻保障——4.3.3 热点事件护航保障流程

4.3.3 热点事件护航保障流程

 

4.3.3.1 明确护航目标


明确本次活动在业务上最终需要达到什么样的目标即可符合预期。护航目标主要 包含整体业务活动目标明确与整体活动架构方案确认,通俗来讲在护航前需要对客户 的业务架构、应用架构、数据架构、技术架构等进行梳理及对保障方案进行确认,并 通过压测数据对本次活动的流量等指标进行评估,通过不断探底来确保云上可以完美 承载业务压力即为护航目标

 

云上护航服务checklist

护航流程

检查

任务评估

责人

 

完成 

备注及  题风险

 

 

 

 

 

 

 

 

航目标对焦

 

业务目标确认

 

活动预估流量/访问量

(QPS/TPS)

 

/

 

/

 

/

 

/

 

技术目标确认

 

全风控             (DDOS峰值、WEB防护)

 

/

 

/

 

/

 

/

活动日期确认

高峰时间点

/

/

/

/

 

 

保障方式确认

 

障方案沟通+活动驻场支持, 其余远程保障为主

 

 

/

 

 

/

 

 

/

 

 

/

 

 

 

系统容量分析

资源需求报

源需求评估,

提前一个月报备阿里云

/

/

/

/

资源准备预

云为客户

准备并预留资源

/

/

/

/

 

 

资源风险识

心实例梳理

ECSRDSSLBRedis DRDS、MQES

/

/

/

/

资源使用率巡检

CPU/MEM/IOPS/ 盘空间等

/

/

/

/

 

 

安全风险识别

账户安

因素认证、操作审计、 访问控

/

/

/

/

账户安

堡垒机访问权限 ***

/

/

/

/

务安全

安全产品接入状态

/

/

/

/

案确认

案确认

/

/

/

/

整体验收

验收报告确

/

/

/

/

复盘

大促复

复盘保障得失,总结经验, 沉淀流程工具

/

/

/

/


4.3.3.2 设计护航方案


护航方案的设计理念,1、确保客户业务无损的在云上运行,2、确保服务的即时 性,拉通产品7*24小时保障护航,3、设计相关的应急预案,在业务有损的情况下有 回滚恢复。


航应急方案

点大项

事项描

任人

计划完成时间

实际完成时间

 

提前预

/

/

/

急预案

/

/

/

各个产品的紧急落地预案

现场预

/

/

/

播报流程、问题升级流程

 

控告警项配置

护航群预警

/

/

/

告警推送/风险巡检同步

监控告警配置

/

/

/

ECSSLB监控大盘及告警配置

务大盘

护航群建设

/

/

/

 

应急人

/

/

/

ECSSLB等应急人员名单

 


4.3.3.3 风险巡检及评估


通过架构梳理及全链路评估,对架构及全链路风险进行识别,达到风险提前

的作用。


动巡检风险

风险描述

风险等级

风险规避方案

任人

风险规避时间

*

*

*

*

*

*


*

*

*

*


4.3.3.4 护航事件记录


记录护航时间段出现的事件、风险及重点时间节点等,在后续可以根据记录

题进行针对性复盘。


航事件记录

事件描

任人

否解决

 

 

 

 

 


4.3.3.5 护航大


屏功能:

可以实时关注客户业务实例的资源使用及网络情况,并能实时关注客户侧保有量 从而间接体现出业务高峰期所对应云上的压力。为上云的客户提供了,可扩展性、可 复制性的便利。

image.png

相关文章
|
数据可视化 测试技术 PyTorch
智谱ChatGLM3魔搭最佳实践教程来了!
ChatGLM3-6B 是 ChatGLM 系列最新一代的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上
|
机器学习/深度学习 监控 Web App开发
SLS机器学习最佳实战:根因分析(一)
通过算法,快速定位到某个宏观异常在微观粒度的具体表现形式,能够更好的帮助运营同学和运维同学分析大量异常,降低问题定位的时间。
12995 0
|
9月前
LangChain-03 astream_events 流输出
LangChain-03 astream_events 流输出
114 3
|
5月前
|
云安全 人工智能 安全
《大模型安全研究报告(2024年)》正式发布
《大模型安全研究报告(2024年)》正式发布
|
6月前
|
云安全 人工智能 供应链
阿里云安全白皮书发布:面向未来的安全能力与实践
阿里云发布2024年安全白皮书,聚焦数智化趋势下的安全新态势、安全治理框架的八大支柱及云上安全最佳实践。白皮书强调动态更新和实战验证,涵盖云平台自身安全、数据合规、身份管控等关键领域,并介绍淘宝上云的安全转型经验。通过红蓝对抗、自动化防御等手段,确保持续提升安全能力,帮助客户应对复杂多变的网络安全挑战。
816 6
|
安全 Cloud Native 数据安全/隐私保护
【阿里云云原生专栏】云原生安全挑战与对策:阿里云的安全防护实践
【5月更文挑战第22天】随着云原生技术推动企业数字化转型,安全挑战日益凸显:容器安全、微服务安全和数据安全成为关注点。阿里云通过容器安全沙箱、镜像安全扫描服务保障容器安全;使用API网关和RAM强化微服务安全;借助TDE和SSE保护数据安全。通过这些实践,用户可在享受云原生优势的同时确保业务安全。
828 0
|
设计模式 测试技术 Go
Go 项目必备:Wire 依赖注入工具的深度解析与实战应用
在现代软件开发中,依赖注入(Dependency Injection,简称 DI)已经成为一种广泛采用的设计模式。它的核心思想是通过外部定义的方式,将组件之间的依赖关系解耦,从而提高代码的可维护性、可扩展性和可测试性。然而,随着项目规模的增长,手动管理复杂的依赖关系变得日益困难。这时,依赖注入代码生成工具就显得尤为重要。在众多工具中,Wire 以其简洁、强大和易用性脱颖而出,成为 Go 语言项目中的宠儿。本文将带你深入了解 Wire 的安装、基本使用、核心概念以及高级用法,并通过一个实际的 web 博客项目示例,展示如何利用 Wire 简化依赖注入的实现。准备好了吗?让我们开始这场代码解耦的奇
|
SQL Oracle 关系型数据库
java实现oracle和mysql的group by分组功能|同时具备max()/min()/sum()/case when 函数等功能
java实现oracle和mysql的group by分组功能|同时具备max()/min()/sum()/case when 函数等功能
|
SQL 存储 缓存
MySQL高级第三篇(共四篇)之应用优化、查询缓存优化、内存管理优化、MySQL锁问题、常用SQL技巧(一)
前面章节,我们介绍了很多数据库的优化措施。但是在实际生产环境中,由于数据库本身的性能局限,就必须要对前台的应用进行一些优化,来降低数据库的访问压力。
16204 7