开发者社区 问答 正文

云监控站点监控创建报警规则

设置站点监控的监控点后,会弹出窗口提示站点监测添加成功,选择[backcolor=transparent]设置报警规则按钮,可进入报警规则设置。


如果不进行设置,可后续在站点管理页添加报警规则。


报警规则说明
对状态码和响应时间设置范围 (ping 协议设置丢包率),当实际值不在设置的范围内时,即为超出阈值。
  • 连续几次超过阈值后报警::您可以选择连续几次探测结果超过阈值才报警,默认是三次,通常偶然因素会导致状态不对或者服务响应超时,连续三次以上更能代表服务工作不正常,减少误报的情况。
  • 多检测点独立报警:任一检测点异常时都会发生一次报警。
  • 多检测点组合报警:xxx.status 状态类报警采用所有检测点都异常才报警,ping.loss 丢包率及 xxx.responsetime 响应时间类报警采用多检测点取平均值进行报警。

展开
收起
反向一觉 2017-10-31 10:49:14 2015 分享 版权
阿里云 AI 助理回答

在阿里云中,站点监控是一项重要的服务,它帮助用户实时了解网站或服务的可用性和性能。您提到的报警规则设置是确保及时发现并响应问题的关键步骤。下面是对您描述内容的进一步解释和补充:

报警规则设置的重要性

  • 状态码和响应时间设置:允许您根据HTTP状态码(如200代表成功,4xx或5xx代表错误)和页面加载响应时间来定义正常范围。当监控点检测到的状态码不在预设的正常范围内,或者响应时间超过设定阈值时,即认为监控项出现问题。

  • 连续几次超过阈值后报警:这个设置可以减少因瞬时网络波动或服务器短暂故障导致的误报。例如,默认设置为连续三次探测结果异常才触发报警,这样可以更准确地反映持续存在的问题。

  • 多检测点独立报警与组合报警

    • 独立报警:意味着如果配置了多个监测点(比如分布在不同地区的节点),任何一个节点探测到异常就会立即触发报警。这种方式适用于需要即时知道任何一处服务中断的情况。
    • 组合报警:分为两种情况:
    • 对于.status这类状态类报警,所有检测点都必须报告异常才会触发报警,这适用于确保全局性的问题被捕捉。
    • 对于.responsetime响应时间和.loss丢包率这类指标,采用多检测点取平均值进行判断,若平均值超出阈值,则报警。这种策略有助于过滤掉因局部网络状况导致的异常,更关注整体表现。

如何操作

  1. 设置报警规则:在添加监控点后,通过点击“设置报警规则”按钮进入报警规则配置界面,按照提示填写各项参数,包括阈值、连续次数等。

  2. 后续管理:如果您当时未设置报警规则,可以在“站点管理”页面找到相应的监控项目,点击编辑或添加报警规则。

  3. 测试与调整:建议初次设置后进行测试,确保报警规则按预期工作,并根据实际情况适时调整报警阈值和条件,以达到最佳的监控效果。

通过精细的报警规则设置,您可以有效监控网站或应用的健康状况,及时响应潜在问题,保障服务质量。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答