6.2.5 冬奥重保--赛时每日巡检
在赛时重保关键期,我们针对各类产品对底层宿主机稳定性、管控组件、容量水位、安全告警进行每日巡检,保障赛时期间云产品平稳运行。
ECS稳定性:风险每日巡检及规避、聚合度打散等7项措施。
ACK稳定性:容器ARMS业务监控及每日巡检。
RDS稳定性:NC/实例/管控任务3个维度进行每日巡检。
云网络稳定:8类云网络产品监控告警,水位监控 / IDC和XGW物理网络水位监控。
云安全稳定性:欧洲项目群监控大盘及安全告警。
DCDN稳定:DCDN节点水位巡检。
图:赛时每日云产品水位巡检结果
对于系统核心业务资源,我们也进行了关键节点的流量峰值巡检,进而与压测结果进行对比,动态调整横向扩容策略。
DCDN流量
• 核心系统DCDN总流量峰值巡检
• 重点DCDN域名流量峰值巡检
• WAF流量
• 核心系统WAF总请求量巡检
• 核心系统WAF峰值带宽巡检
• 公网流量
• 核心系统与欧洲项目公网总出入流量峰值巡检
• Anti-DDoS高防带宽
• Anti-DDoS高防整体流量峰值巡检
图:赛时每日业务侧流量巡检结果