丰富的线上&线下活动,深入探索云世界
做任务,得社区积分和周边
资深技术专家手把手带教
技术交流,直击现场
让创作激发创新
海量开发者使用工具、手册,免费下载
极速、全面、稳定、安全的开源镜像
开发手册、白皮书、案例集等实战精华
热门
关于阿里的技术创新均呈现于此.
1
回答
数据驱动,首先建立全链路可视化对账体系,所有不一致资源全部数据化。财(钱)、产(资源)两个抓手,从资源和资损两个角度来度量一致性问题。离线(T+1)与实时(一小时对账)两种方式,及时止损。
针对预警进行体系化整理,实现预警的真实性、准确性、精确性、高质量。
数量多,平均每天100+,峰值200+,信噪比低。渠道多,大量重复报警,干扰大。配置异常,存在预警丢失情况,风险高。损耗人力,预警反复出现导致处理预警需要投入大量人力,人效低。黑屏操作风险高,大量黑屏操作增加生产运维风险,风险高。
空间增长过快,无法支撑业务近期发展需求。 慢SQL频发,严重影响应用稳定性。 数据库变更故障率高,DDL大表变更引起的故障占比高。 RDS性能指标异常,数据库各种性能指标异常。 RDS报警配置混乱,报警信息存在遗漏,误报的情况。
全链路SLO;资源一致性治理;故障诊断;监控预警治理;数据库稳定性治理
0
开发者学习资源库: https://developer.aliyun.com/group/tech_library
云智能前沿 : https://developer.aliyun.com/group/cloud_intelligence_info
更多内容,欢迎关注《开发者必读》 https://developer.aliyun.com/group/tech_information