在Linux系统部署prometheus监控(2) --配置规则

简介: 在Linux系统部署prometheus监控(2) --配置规则

首先确保服务开启

vim node_rules.yml

注意:编写这个文件注意不要用tab键,只用空格来缩进

访问localhost:9090/rules

如果relod发现rules没有生效,可以重启服务

netstate -lntp |grep prom

kill -9 进程号

./prometheus &

再次访问

cpu > 80

100-(avg(irate(node_cup_seconds_total{mode='idle'}[5m]))by(instance)*100) > 80

内存

100 - (node_memory_MemFree_bytes + node_memory_Cached_bytes + node_memory_Buffers_bytes) / node_memory_MemTotal_bytes * 100

 

disk

100 - (((node_filesystem_size_bytes{fstype=~"xfs|ext4"} - node_filesystem_free_bytes{fstype=~"xfs|ext4"}) / node_filesystem_size_bytes{fstype=~"xfs|ext4"}) * 100)

节点状态

up metric

监视特定节点状态的另一个有用指标:up ,如果实例是健康的,度量就被设置为1 ,失败返回 - 或 0

用来监控节点是否健康,如果健康则为1,不健康的话说明该服务器node服务可能停了,也可能该节点down了需要立马检查

- alert: NodeDown

 expr: node_up == 0

 for: 0m

 labels:

    severity: serious

 annotations:

      summary: "NodeDown"

下面都一样的模板配置即可

MysqlDown

RedisDown

NginxDown

JavaDown

groups:

- name: Hoststate-alert()

 rules:

 - alert: RedisDown

   expr: up == 0

   for: 0m

   labels:

     status: critical

   annotations:

     summary: "Redisdown"

     description: "Redis instance is down"

 - alert: MysqlDown

   expr: up == 0

   for: 0m

   labels:

     status: critical

   annotations:

     summary: "Msqldown"

     description: "Mysql instance is down"

 - alert: NginxDown

   expr: up == 0

   for: 0m

   labels:

     status: critical

   annotations:

     summary: "Nginxdown"

     description: "Nginx instance is down"

 - alert: NodeDown

   expr: up == 0

   for: 0m

   labels:

     status: critical

   annotations:

     summary: "Nodedown"

     description: "Node instance is down"

 - alert: JavaDown

   expr: up == 0

   for: 0m

   labels:

     status: critical

   annotations:

     summary: "Javadown"

     description: "Java instance is down"

 - alert: CPUusage

   expr: 100-(avg(irate(node_cpu_seconds_total{mode='idle'}[5m]))by(instance) * 100) > 80

   for: 5m

   labels:

     status: critical

   annotations:

     summary: "{{$labels.mountpoint}} CPU usage high"

     description: "{{$labels.mountpoint}} CPU usage above 80% ( current usage:{{$value}})"

 - alert: Memoryusage

   expr: 100 - (node_memory_MemFree_bytes + node_memory_Cached_bytes + node_memory_Buffers_bytes)/ node_memory_MemTotal_bytes * 100 > 80

   for: 5m

   labels:

     status: critical

   annotations:

     summary: " Memory usage high"

     description: "Memory usage above 80%.( current usage:{{$value}})"

 - alert: Diskusage

   expr: 100 - (((node_filesystem_size_bytes{fstype=~"xfs|ext4"} - node_filesystem_free_bytes{fstype=~"xfs|ext4"}) / node_filesystem_size_bytes{fstype=~"xfs|ext4"}) * 100)  > 80

   for: 5m

   labels:

     status: critical

   annotations:

     summary: "Disk usage high"

     description: "Disk usage above 80% ( current usage:{{$value}})"



相关实践学习
容器服务Serverless版ACK Serverless 快速入门:在线魔方应用部署和监控
通过本实验,您将了解到容器服务Serverless版ACK Serverless 的基本产品能力,即可以实现快速部署一个在线魔方应用,并借助阿里云容器服务成熟的产品生态,实现在线应用的企业级监控,提升应用稳定性。
相关文章
|
11天前
|
Prometheus Kubernetes 监控
k8s部署针对外部服务器的prometheus服务
通过上述步骤,您不仅成功地在Kubernetes集群内部署了Prometheus,还实现了对集群外服务器的有效监控。理解并实施网络配置是关键,确保监控数据的准确无误传输。随着监控需求的增长,您还可以进一步探索Prometheus生态中的其他组件,如Alertmanager、Grafana等,以构建完整的监控与报警体系。
104 60
|
12天前
|
Prometheus Kubernetes 监控
k8s部署针对外部服务器的prometheus服务
通过上述步骤,您不仅成功地在Kubernetes集群内部署了Prometheus,还实现了对集群外服务器的有效监控。理解并实施网络配置是关键,确保监控数据的准确无误传输。随着监控需求的增长,您还可以进一步探索Prometheus生态中的其他组件,如Alertmanager、Grafana等,以构建完整的监控与报警体系。
109 62
|
1月前
|
网络协议 安全 Linux
如何配置Linux端的ftp?
如何配置Linux端的ftp?
137 64
|
16天前
|
自然语言处理 PyTorch 算法框架/工具
掌握从零到一的进阶攻略:让你轻松成为BERT微调高手——详解模型微调全流程,含实战代码与最佳实践秘籍,助你应对各类NLP挑战!
【10月更文挑战第1天】随着深度学习技术的进步,预训练模型已成为自然语言处理(NLP)领域的常见实践。这些模型通过大规模数据集训练获得通用语言表示,但需进一步微调以适应特定任务。本文通过简化流程和示例代码,介绍了如何选择预训练模型(如BERT),并利用Python库(如Transformers和PyTorch)进行微调。文章详细说明了数据准备、模型初始化、损失函数定义及训练循环等关键步骤,并提供了评估模型性能的方法。希望本文能帮助读者更好地理解和实现模型微调。
41 2
掌握从零到一的进阶攻略:让你轻松成为BERT微调高手——详解模型微调全流程,含实战代码与最佳实践秘籍,助你应对各类NLP挑战!
|
9天前
|
Ubuntu Linux 编译器
Linux/Ubuntu下使用VS Code配置C/C++项目环境调用OpenCV
通过以上步骤,您已经成功在Ubuntu系统下的VS Code中配置了C/C++项目环境,并能够调用OpenCV库进行开发。请确保每一步都按照您的系统实际情况进行适当调整。
114 3
|
13天前
|
监控 安全 网络协议
快速配置Linux云服务器
【10月更文挑战第3天】快速配置Linux云服务器
|
29天前
|
Oracle Java 关系型数据库
Linux下JDK环境的配置及 bash: /usr/local/java/bin/java: cannot execute binary file: exec format error问题的解决
如果遇到"exec format error"问题,文章建议先检查Linux操作系统是32位还是64位,并确保安装了与系统匹配的JDK版本。如果系统是64位的,但出现了错误,可能是因为下载了错误的JDK版本。文章提供了一个链接,指向Oracle官网上的JDK 17 Linux版本下载页面,并附有截图说明。
Linux下JDK环境的配置及 bash: /usr/local/java/bin/java: cannot execute binary file: exec format error问题的解决
|
1月前
|
Linux 编译器 开发工具
快速在linux上配置python3.x的环境以及可能报错的解决方案(python其它版本可同样方式安装)
这篇文章介绍了在Linux系统上配置Python 3.x环境的步骤,包括安装系统依赖、下载和解压Python源码、编译安装、修改环境变量,以及常见安装错误的解决方案。
48 1
|
1月前
|
Ubuntu Linux
Linux服务器的自动启动可以在哪里进行配置?
Linux服务器的自动启动可以在哪里进行配置?
117 3
|
14天前
|
应用服务中间件 Linux Shell
Linux 配置 Nginx 服务的详细步骤,绝对干货
Linux 配置 Nginx 服务的详细步骤,绝对干货
43 0