《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(5) https://developer.aliyun.com/article/1230989?groupCode=supportservice
•监控大盘配置
针对游戏业务,一般关心的监控指标包括:
网络带宽:网络带宽水位过高或打满会直接导致玩家掉线或无法进入游戏,同时 也可辅助发现网络攻击行为,因此网络带宽的实时监控是必须的。一般包括共享带宽 包流入带宽总和、流出带宽总和每个共享带宽的流入带宽和流出带宽等。如下图:
CDN:重点关注CDN下行流量监控(边缘网络总带宽)、回源带宽监控、命中率, 4xx,5xx等指标,如下:
游戏服ECS:游戏服需关注总连接数,反映总体在线玩家数量情况。热门区服所 在ECS的Cpu内存负载监控,关注高负载时的性能波动,如下图:
安全:包括对IP出入流量、连接数、QPS、状态码、黑洞事件、清洗事件的告警 监控等。
负载均衡、OSS、数据库等监控大盘可按需配置,不做示例。
以上监控图都来自企业云监控大盘,护航团队可以根据客户需求进行定制化配 置。
•告警策略参考
3.2.2.2.6 重保应急与故障预案
•应急处理流程
•故障预案样例
•3.2.2.2.7 总结
本节介绍了游戏发布重保护航中的完整流程和其中的关键环节。实际护航中还需 要根据实际介入时间、游戏规模、业务要求等因素进行灵活调整。但总结来说一方面 是通过架构图进行架构评估优化,保障安全防护、网络延迟、单点容量等指标可以满 足业务目标,另一方面通过压力测试发现适配性、产品bug、性能瓶颈、参数配置等 隐藏问题并进行优化解决。同时结合风险评估checklist查漏补缺,企业云监控大盘 发现实时问题。通过该护航流程可以最大限度的将问题、风险提前排除,保障OB当 天可以顺利稳定上线。
《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(7) https://developer.aliyun.com/article/1230987?groupCode=supportservice