nagios自定义监控系统磁盘脚本-阿里云开发者社区

nagios自定义监控系统磁盘脚本

2017-11-17 964

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

之前写了一篇文章主要介绍nagios的搭建使用 http://msiyuetian.blog.51cto.com/8637744/1704346

下面这篇文章主要介绍nagios自定义监控系统磁盘的脚本实现。

Nagios可以识别4种状态返回信息，即 0 表示状态正常(OK)、1 表示出现警告(WARNING)、2 表示出现非常严重的错误(CRITICAL)，3 表示未知错误(UNKNOWN)。Nagios根据插件返回来的值，来判断监控对象的状态，并通过web显示出来。我们就可以利用上面这个特性来实现监控磁盘的状态：

a、当磁盘使用率大于97%则表示出现非常严重的错误(CRITICAL)，返回值为2；

b、当磁盘使用率大于95%则表示出现警告(WARNING)，返回值为1；

c、当磁盘使用率小于95%则表示状态正常(OK)，返回值为0；

说明：

server ip ：192.168.0.114

client ip ：192.168.0.115

1、客户端配置

1）编写脚本

[root@client ~]# vim /usr/lib/nagios/plugins/check_disk.sh

#!/bin/bash

row=`df -h |wc -l`
for i in `seq 2 $row`
do
      ava=`df -h |sed -n "$i"p|awk '{print $4}'`
      u_per=`df -h |sed -n "$i"p|sed -n "s/\%//"p|awk '{print $5}'`
      p_p=`df -h -P|sed -n "$i"p|awk '{print $6}'`
      if [ "$u_per" -gt "97"  ];then
            echo -n "$p_p CRITICAL $u_per% $ava  "
            sta[$i]=2
      elif [ "$u_per" -gt "95" ];then
            echo -n "$p_p WARNING! $u_per% $ava  "
            sta[$i]=1
      else
            echo -n "$p_p OK $u_per% $ava  "
            sta[$i]=0
      fi
done
n=0
for j in `seq 2 $row`
do
      if [ "${sta[$j]}" -gt $n  ];then
            n=${sta[$j]}
      fi
done
exit $n

脚本说明：

我们利用df -h命令可以查看磁盘的使用状态

[root@client ~]# df -h

Filesystem Size Used Avail Use% Mounted on

/dev/sda3 18G 2.6G 15G 16% /

tmpfs 504M 0 504M 0% /dev/shm

/dev/sda1 97M 26M 67M 29% /boot

脚本中 for i in `seq 2 $row` ：表示从df -h命令输出的第二行开始进行循环。

参数ava、u_per、p_p分别定义为剩余空间（Avail）、使用率（Use%）、挂载点（Mounted on）

数组sta[$i]，输出的是返回值，当返回0表示OK，返回1表示WARNING!，返回2表示CRITICAL。

最后我们利用输出数组的最大值来判断，只要有一个挂载点的使用率达到97%以上，在nagios网页上都会显示CRITICAL。

2）修改脚本权限

[root@client ~]# chmod +x /usr/lib/nagios/plugins/check_disk.sh

3）编辑配置文件

[root@client ~]# vim /etc/nagios/nrpe.cfg //增加一行

command[check_disk]=/usr/lib/nagios/plugins/check_disk.sh

4）重启nrpe服务

[root@client ~]# /etc/init.d/nrpe restart

2、服务端配置

1）检查刚才客户端上的脚本是否正常运行

[root@server ~]# /usr/lib/nagios/plugins/check_nrpe -H 192.168.0.115 -c check_disk

/ OK 16% 15G /dev/shm OK 0% 504M /boot OK 29% 67M

注意：

若报错：CHECK_NRPE: Error - Could not complete SSL handshake.

则说明在客户端没有添加允许server主机的ip，修改客户端nrpe配置文件，添加server的ip

[root@client ~]# vim /etc/nagios/nrpe.cfg

allowed_hosts=127.0.0.1,192.168.0.114

[root@client ~]# /etc/init.d/nrpe restart

2）添加服务

[root@server ~]# cd /etc/nagios/conf.d/

[root@server conf.d]# vim 192.168.0.115.cfg

define host{

use linux-server

host_name 192.168.0.115

alias 0.115

address 192.168.0.115

}

define service{

use generic-service

host_name 192.168.0.115

service_description check_disk

check_command check_nrpe!check_disk

max_check_attempts 5

normal_check_interval 1

}

3）编辑commands.cfg配置文件

[root@server conf.d]# vim /etc/nagios/objects/commands.cfg //末尾添加如下内容

define command{

command_name check_nrpe

command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$

}

4）重启nagios服务

[root@server conf.d]# service nagios restart

3、查看效果

浏览器输入：192.168.0.114/nagios，验证账号密码进入后可看到下图效果：

Hosts增加了一台

Services显示监控磁盘状态

本文转自 M四月天 51CTO博客，原文链接：http://blog.51cto.com/msiyuetian/1714835，如需转载请自行联系原作者

nagios自定义监控系统磁盘脚本

热门文章

最新文章

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

nagios自定义监控系统磁盘脚本

热门文章

最新文章

相关电子书

相关实验场景