《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(3)

简介: 《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(3)

《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(2) https://developer.aliyun.com/article/1232030?groupCode=supportservice



5. 监控大盘配置实践


游戏业务资源一般都涉及大量ECS计算资源实例、数据库实例和多款网络相关阿里云云产品。在重保项目启动后即可与客户对接监控需求、制定监控方案,通过与客户沟通对项目整体业务情况进一步了解后,针对客户提出的需求和项目的整体业务逻辑,以及需要重点关注的关键性监控指标,从全局到局部细节提供多种维度监控方案供客户选择。


现场保障盯屏维度(峰谷观测):


现场护航盯屏视角的监控需要在展示项目整体资源的同时,突出展示重点关注的关键性指标数据,具有综合性、全局性、针对性、关联性等特点。如ECS实例、CDN、EIP弹性公网IP、共享带宽包中关键性监控指标,从全局角度配置综合汇总的TOP&SUM监控数据,为客户提供新游上线玩家在线增长率趋势、TOPx游戏服用户负载和关键资源使用情况、内/外网网络带宽流量汇总、CDN域名命中率和回源带宽。通过建立ECS公网IP标签与EIP弹性公网IP标签关联,提供玩家在线请求流量和游戏服的综合负载情况。


护航现场盯屏样例:


1.网络带宽:网络带宽水位过高或打满会直接导致玩家掉线或无法进入游戏,同时也可辅助发现网络攻击行为,因此网络带宽的实时监控是必须的。一般包括共享带宽包流入带宽总和、流出带宽总和,每个共享带宽的流入带宽和流出带宽等。如下图:


image.png


2.CDN:重点关注CDN下行流量监控(边缘网络总带宽)、回源带宽监控、命中率,4xx,5xx等指标,如下:


image.png

image.png


3.游戏服ECS:游戏服需关注总连接数,反映总体在线玩家数量情况。热门区服所在ECS的CPU内存负载监控,关注高负载时的性能波动,如下图:


image.png

image.png


4.安全:包括对IP出入流量、连接数、QPS、状态码、黑洞事件、清洗事件的告警监控等。

5.负载均衡、OSS、数据库等监控大盘可按需配置,不做示例。




《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(4) https://developer.aliyun.com/article/1232028?groupCode=supportservice

相关文章
|
算法 人机交互 调度
进程调度算法_轮转调度算法_优先级调度算法_多级反馈队列调度算法
轮转调度算法(RR)是一种常用且简单的调度方法,通过给每个进程分配一小段CPU运行时间来轮流执行。进程切换发生在当前进程完成或时间片用尽时。优先级调度算法则根据进程的紧迫性赋予不同优先级,高优先级进程优先执行,并分为抢占式和非抢占式。多队列调度算法通过设置多个具有不同优先级的就绪队列,采用多级反馈队列优先调度机制,以满足不同类型用户的需求,从而优化整体调度性能。
1174 15
|
自然语言处理 Kubernetes 监控
ChaosBlade:从混沌工程实验工具到混沌工程平台
ChaosBlade 是阿里巴巴 2019 年开源的混沌工程项目,已加入到 CNCF Sandbox 中。起初包含面向多环境、多语言的混沌工程实验工具 ChaosBlade,到现在发展到面向多集群、多环境、多语言的混沌工程平台 chaosblade-box,平台支持实验工具托管和工具自动化部署,通过统一用户实验界面,将用户的精力聚焦在通过混沌工程解决云原生过程中高可用问题上。本文从混沌实验模型抽象、混沌实验工具开源和混沌工程平台升级项目三阶段出发,详细介绍 ChaosBlade。
986 84
ChaosBlade:从混沌工程实验工具到混沌工程平台
|
传感器 调度
光学雨量计红外雨量传感器应用于集水测量
光学雨量计红外雨量传感器应用于集水测量
114 10
光学雨量计红外雨量传感器应用于集水测量
|
算法
扭曲算法
【6月更文挑战第27天】
282 2
|
JavaScript 前端开发 安全
VUE——APP,后端,前端三端AES加密解密
VUE——APP,后端,前端三端AES加密解密
1047 0
|
人工智能 小程序 BI
矩阵的转置、加和乘法写入C++
矩阵的转置、加和乘法写入C++
316 0
|
运维 监控 测试技术
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(4)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(4)
335 0
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(4)
|
机器学习/深度学习 自然语言处理 人工智能
关于阿里云AIGC背后的技术解读
AIGC背后的推手(个人学习)
840 0
|
设计模式 缓存 算法
带你手撸一个Kotlin版的EventBus
EventBus的优点有很多(现在来看也并不是优点):代码简洁,是一种发布订阅设计模式(观察者设计模式),简化了组件之间的通讯,分离了事件的发送者和接收者,而且可以随意切换线程,避免了复杂的和易错的依赖关系和生命周期问题
721 0
带你手撸一个Kotlin版的EventBus
|
弹性计算 运维 安全
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(1)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.1新游上线稳定性保障实践(1)
505 0