3. 可靠性评估
可靠性主要从业务架构、数据备份、提前规避、故障恢复等多个维度进行评估
1) 核心业务是否采用多可用区部署模式?
A. 否(0 分)
B. 是(5 分)
2) 核心业务是否具备容灾能力?
A. 不具备(0 分)
B. 可用区级别容灾(可用区级别即同城跨机房)(3 分)
C. 地域级别容灾(地域级别即不同城的跨机房)(5 分)
3) 核心业务数据是否会做数据备份?
A. 从来不做(0 分)
B. 偶尔才做(1 分)
C. 以月为单位定期周(2 分)
D. 以周为单位定期做(4 分)
E. 每天自动做(5 分)
4) 您目前在业务维度的监控能力有哪些?(多选)
A. 没有任何监控能力(0 分)
B. 基础资源的基础指标监控(比如 CPU 使用率,内存使用率)(1 分)
C. 基础设施的异常事件监控(比如实例宕机事件)(2 分)
D. 应用维度的监控(比如时延、错误率等)(2 分)
5) 当业务出问题时,您是如何排查定位问题?
A. 只能查看历史监控数据(1 分)
B. 简单业务日志或手动保留现场(2 分)
C. 有比较详细的问题诊断工具和链路 trace 工具(3 分)
D. 有现场的自动化诊断工具进行排查(5 分)
6) 您的业务多久会进行一次故障演练?
A. 从来没有(0 分)
B. 每年一次(1 分)
C. 每半年一次(2 分)
D. 每月一次(3 分)
E. 每周一次(5 分)
7) 您的业务是否具备以下能力?(多选)
A. 业务可以自动应对流量洪峰、依赖服务质量下降等情况(2 分)
B. 业务部分场景可以达到故障自愈(3 分)
C. 具备通过 AIOps 预测故障(5 分)
D. 都不具备(0 分)
总分 40 分 ,评分对应等级:
• 0 分~9 分:初级
• 10 分~19 分:中级
• 20 分~29 分:高级
• 30 分~39 分:标准化
• 40 分:智能化