老板给机房新买了个温度,湿度的感应器,问我能不能整合到Nagios里面。我的回答是No Problem.
首先看看他自带的界面
监控SNMP,首先得知道他的OID是啥,这个界面我可以直接下载MIB文件和对应的EXCEL文档。
下载以后,重命名MIB为txt文件,然后拷贝到我的nagios服务器的/usr/share/snmp/mibs 目录下,然后记得添加到配置文件中
1
2
3
4
5
6
|
[root@sydnagios mibs]
# pwd
/usr/share/snmp/mibs
[root@sydnagios mibs]
# ls g*txt
geist_mib.txt
[root@sydnagios mibs]
# more /usr/share/snmp/snmp.conf
mibfile
/usr/share/snmp/mibs/geist_mib
.txt
|
这样子,我就可以直接通过名字或者OID来查询状态了。
比如说我根据他的OID查询湿度和温度
1
2
3
4
|
snmpwalk -v2c -c public 10.3.1.142 1.3.6.1.4.1.21239.5.1.2.1.6
GEIST-V4-MIB::internalHumidity.1 = INTEGER: 29 %
[root@sydnagios mibs]
# snmpwalk -v2c -c public 10.3.1.142 1.3.6.1.4.1.21239.5.1.2.1.5
GEIST-V4-MIB::internalTemp.1 = INTEGER: 291 0.1 Degrees
|
等等,湿度是正确的,温度的Interger 是291,他还需要乘以0.1才是正确的温度。
用Nagios自带的check_snmp试试看,结果也是这样,这可不是我想要的,在输到Nagios之前,我必须把数据处理一下
1
2
|
[root@sydnagios mibs]
# /usr/local/nagios/libexec/check_snmp -H 10.3.1.142 -o 1.3.6.1.4.1.21239.5.1.2.1.5.1 -C public -P 2c
SNMP OK - 292 0.1 Degrees | GEIST-V4-MIB::internalTemp.1=292
|
写个简单的脚本,记得执行chomd +x。注意返回值,0表示正常,1表示warning,2表示critical,3表示未知异常
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
#!/bin/sh
snmp=$(
/usr/local/nagios/libexec/check_snmp
-H 10.3.1.142 -o 1.3.6.1.4.1.21239.5.1.2.1.5.1 -C public -P 2c|
cut
-b 11-14)
temp=$(( $snmp
/10
))
#echo $temp
#echo $temp
if
test
$temp -lt 30;
then
echo
"TEMP OK - $temp Degree "
exit
0
elif
test
$temp -lt 35;
then
echo
"TEMP WARNING - $temp Degree"
exit
1
else
echo
"TEMP CRITICAL - $temp Degree"
exit
2
fi
|
前段时间在学习python,试了试python的脚本也是工作的
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
#!/usr/bin/env python
import
os
result
=
os.popen(
"/usr/local/nagios/libexec/check_snmp -H 10.3.1.142 -o 1.3.6.1.4.1.21239.5.1.2.1.5.1 -C public -P 2c|cut -b 11-14"
).read()
result
=
float
(result)
value
=
result
/
10
if
value<
30
:
print
(
"Temperature is OK-%0.1f Degrees"
%
value)
exit(
0
)
elif
value<
35
:
print
(
"Temperature is Warning-%0.1f Degrees"
%
value)
exit(
1
)
else
:
print
(
"Temperature is Critical-%0.1f Degrees"
%
value)
exit(
2
)
|
command.cfg添加一条命令
1
2
3
4
|
define
command
{
command_name check_snmp_temp
command_line
/usr/local/nagios/libexec/test
.sh
}
|
network.cfg里面添加一个host和service的定义
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
define host{
use generic-ap ; Inherit default values from a template
host_name MELSENSOR ; The name we're giving to this switch
alias
MELSENSOR ; A longer name associated with the switch
address 10.3.1.142 ; IP address of the switch
parents MEL3750WIFI
}
define service{
use generic-service ; Inherit values from a template
host_name MELSENSOR
servicegroups network-services
service_description Temp
check_command check_snmp_temp
#2d_coords 100,100
}
|
这样就行了。
用类似的方式处理一下湿度,因为湿度直接获取的结果就是正确的,所以我就直接用现成的check_snmp了
最后Nagios 的界面
本文转自 beanxyz 51CTO博客,原文链接:http://blog.51cto.com/beanxyz/1840160,如需转载请自行联系原作者