在Linux系统部署prometheus监控(2) --配置规则-阿里云开发者社区

在Linux系统部署prometheus监控(2) --配置规则

2023-08-08 216

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 在Linux系统部署prometheus监控(2) --配置规则

首先确保服务开启

vim node_rules.yml

注意：编写这个文件注意不要用tab键，只用空格来缩进

访问localhost:9090/rules

如果relod发现rules没有生效，可以重启服务

netstate -lntp |grep prom

kill -9 进程号

./prometheus &

再次访问

cpu > 80

100-(avg(irate(node_cup_seconds_total{mode='idle'}[5m]))by(instance)*100) > 80

内存

100 - (node_memory_MemFree_bytes + node_memory_Cached_bytes + node_memory_Buffers_bytes) / node_memory_MemTotal_bytes * 100

disk

100 - (((node_filesystem_size_bytes{fstype=~"xfs|ext4"} - node_filesystem_free_bytes{fstype=~"xfs|ext4"}) / node_filesystem_size_bytes{fstype=~"xfs|ext4"}) * 100)

节点状态

up metric

监视特定节点状态的另一个有用指标：up ,如果实例是健康的，度量就被设置为1 ，失败返回 - 或 0

用来监控节点是否健康，如果健康则为1，不健康的话说明该服务器node服务可能停了，也可能该节点down了需要立马检查

- alert: NodeDown

expr: node_up == 0

for: 0m

labels:

severity: serious

annotations:

summary: "NodeDown"

下面都一样的模板配置即可

MysqlDown

RedisDown

NginxDown

JavaDown

groups:

- name: Hoststate-alert（）

rules:

- alert: RedisDown

expr: up == 0

for: 0m

labels:

status: critical

annotations:

summary: "Redisdown"

description: "Redis instance is down"

- alert: MysqlDown

expr: up == 0

for: 0m

labels:

status: critical

annotations:

summary: "Msqldown"

description: "Mysql instance is down"

- alert: NginxDown

expr: up == 0

for: 0m

labels:

status: critical

annotations:

summary: "Nginxdown"

description: "Nginx instance is down"

- alert: NodeDown

expr: up == 0

for: 0m

labels:

status: critical

annotations:

summary: "Nodedown"

description: "Node instance is down"

- alert: JavaDown

expr: up == 0

for: 0m

labels:

status: critical

annotations:

summary: "Javadown"

description: "Java instance is down"

- alert: CPUusage

expr: 100-(avg(irate(node_cpu_seconds_total{mode='idle'}[5m]))by(instance) * 100) > 80

for: 5m

labels:

status: critical

annotations:

summary: "{{$labels.mountpoint}} CPU usage high"

description: "{{$labels.mountpoint}} CPU usage above 80% ( current usage:{{$value}})"

- alert: Memoryusage

expr: 100 - (node_memory_MemFree_bytes + node_memory_Cached_bytes + node_memory_Buffers_bytes)/ node_memory_MemTotal_bytes * 100 > 80

for: 5m

labels:

status: critical

annotations:

summary: " Memory usage high"

description: "Memory usage above 80%.( current usage:{{$value}})"

- alert: Diskusage

expr: 100 - (((node_filesystem_size_bytes{fstype=~"xfs|ext4"} - node_filesystem_free_bytes{fstype=~"xfs|ext4"}) / node_filesystem_size_bytes{fstype=~"xfs|ext4"}) * 100) > 80

for: 5m

labels:

status: critical

annotations:

summary: "Disk usage high"

description: "Disk usage above 80% ( current usage:{{$value}})"

在Linux系统部署prometheus监控(2) --配置规则

up metric

龙蜥操作系统

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像