开发者社区> 问答> 正文

云监控创建自定义监控项和报警规则

反向一觉 2017-10-31 11:50:26 1574

创建自定义监控项
用户需要先创建监控项,再根据定义的监控项字段通过接口上报监控数据。
注意事项
  • 云监控当前允许至多 10 个自定义监控项。
  • 上报监控数据的服务必须在阿里云的云服务器上。
  • 监控项名称不区分大小写。比如已定义了 cpuUtilization,再定义 CPUUtilization 时,不会产生新的监控项。

参数说明
  • 监控项名称:用户上报的监控数据指标名称,例如 CPUUtilization。
  • 单位:监控数据的单位,在上报数据时不会做校验,只是为了便于展示数据,或者便于数据信息的沟通,用户根据自己的实际情况填写即可。
  • 上报频率: 监控数据上报的周期,只支持 1 分钟、5 分钟、15 分钟三种上报频率。
  • 字段信息:通过字段信息确定唯一监控项。如 ECS 的 CPU 监控项,字段信息为实例名,只有指定实例名才能唯一确定一条 CPU 信息。再如 ECS 的磁盘使用率,字段信息是实例名和挂载点,只有确定了实例名和挂载点,才能磁盘使用率才有意义。
  • 统计周期:定义上报的监控数据需要以何种频率进行聚合。
  • 统计方法:与统计周期结合使用,若您选择了 5 分钟的统计周期,则云监控会为您计算这 5 分 钟内上报数据的平均值、求和值、最大值、最小值、采样计数值(统计周期内上报了多少条数据)。

操作步骤
  1. 登录云监控控制台
  2. 进入自定义监控页面。
  3. 点击页面右上角的创建监控项,填写相关参数。

创建报警规则(可选)
参数说明
  • 字段:输入创建监控项时定义的字段的具体值。
  • 统计周期:报警系统会按照这个周期检查您对应的监控数据是否超过了报警阈值。例如设置内存使用率报警规则的统计周期为1分钟,则每间隔1分钟会检查一次内存使用率是否超过了阈值。
  • 统计方法:统计方法指对超出阈值范围的设置。统计方法中可以设置平均值、最大值、最小值、求和值。
    平均值:统计周期内监控数据的平均值。统计结果是 15 分钟内采集的所有监控数据的平均值,当这个平均值大于 80% 时,才算超过阈值。
  • 最大值:统计周期内监控数据的最大值。统计周期内采集的监控数据中,最大值超过80%,即为超过阈值。
  • 最小值:统计周期内监控数据的最小值。统计周期内采集的监控数据中,最小值超过80%,即为超过阈值。
  • 求和值:统计周期内监控数据的总和。对统计周期内采集的监控数据进行求和,求和后的结果超过 80% 即为超过阈值。流量类指标需要用到此类统计方法。

连续几次超过阈值后报警:指连续几个统计周期监控项的值持续超过阈值后触发报警。
例如:设置CPU使用率超过 80% 报警,统计周期为 5 分钟,连续 3 次超过阈值后报警,则第一次探测 CPU 使用率超过 80% 时,不会发出报警通知。5 分钟后第二次探测 CPU 使用率超过 80%,也不会发出报警。第三次探测仍然超过 80% 时,才会发出报警通知。即从实际数据第一次超过阈值到最终发出报警规则,最少需要消耗的时间为统计周期×(连续探测次数-1)=5×(3-1)=10分钟。
操作步骤
  1. 登录云监控控制台
  2. 进入[backcolor=transparent]自定义监控页面。
  3. 点击监控项列表[backcolor=transparent]操作中的[backcolor=transparent]报警管理,进入监控项的报警规则页面。
  4. 点击报警规则页面下方的[backcolor=transparent]添加报警规则按钮,新建报警规则。

分享到
取消 提交回答
全部回答(0)
+ 订阅

时时分享云计算技术内容,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。

推荐文章