进一步的说, 能提前预警服务将出现瓶颈,并提示运维吗?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
可以实现提前预警服务可能出现的瓶颈并通知运维。根据云消息队列RocketMQ版的故障管理实践,通过设置可观测性指标监控与报警规则,能够有效预警服务异常。具体操作包括:
配置一级指标报警:将直接影响业务正常运行的无歧义指标设为一级指标,例如,当实例消息收发TPS接近或超过规格限制时,创建报警规则以预警潜在的流控风险。
监控消费与生产指标:
深入分析二级与三级指标:一旦一级指标报警,迅速查看更详细的二级和三级指标,这些指标能帮助快速定位到问题的具体环节,比如消费者客户端性能瓶颈或服务端资源过载等。
结合智能瓶颈分析与异常根因排查的实践,通过ARMS应用监控服务与全链路监控配置,可以在压测及日常运行中自动识别应用的异常事件和潜在瓶颈,进一步分析其根因,并及时通知运维团队进行干预,从而达到提前预警并提示运维的目的。