昨天测试了nagios的安装,今天我进行一些简单的测试实践,来看看昨天nagios是否安装成功。
在服务端,首先我们知道nagios的主配置文件在usr/local/nagios/etc/nagios.cfg,但是,在服务端如果我们需要配置的话,还必须了解另外的一些配置文件,具体如下:
当服务端nagios安装完成时,在/usr/local/nagios/etc/objects目录下还有一些文件模板,用于定义nagios对象。
Localhost.cfg与windows.cfg 新添加监控主机要修改的配置文件linux与windows
Command.cfg 调整监控的命令,可以再在他配置文件中引用
Contacts.cfg调整联系人和联系组信息
Timelates.cfg调整监控时间
Templates.cfg 定义主机服务的一个模板配置文件,可以再在他配置文件中引用
Switch.cfg与printer.cfg 这2个是监控路由器和打印机的模板,默认是没有启用的
成功配置一台nagios监控系统,必须要清楚每个配置文件之间的依赖和被依赖关系,最主要的有4点:
1.定义哪些监控主机,主机组,服务,服务组
2.定义这个监控要用什么命令实现
3.定义监控的时间段
4.定义主机或服务出现问题需要通知的联系人和联系组
接下来我们在/usr/local/nagios/etc/nagios.cfg文件中,分别找到cfg_file和cfg_dir的关键字段,首先我们要知道cfg_file所读取的是usr/local/nagios/etc/objects中的对象
例如:usr/local/nagios/etc/objects/commands.cfg
而cfg_dir,也就是说可以告诉nagios处理所有配置文件在特定的目录使用cfg_dir指令
例如:cfg_dir=/usr/local/nagios/etc/vmtest
在服务端:
以cfg_dir=/usr/local/nagios/etc/vmtest为例,简单的测试至少需要hosts.cfg、hostgroup.cfg、services.cfg这3个配置文件。
hosts.cfg
define host{
use linux-server
host_name test_1.10
alias alca_1.10
address 192.168.1.10
}
hostgroup,cfg
define hostgroup{
hostgroup_name test
members test_1.10
}
services.cfg
define service {
host_name test_1.10
service_description check_load
check_command check_nrpe!check_load
max_check_attempts 3
normal_check_interval 5
retry_check_interval 1
check_period 24x7
notification_interval 5
notification_period 24x7
notification_options w,u,c,r
contact_groups admins
}
define service {
host_name test_1.10
service_description check_swap
check_command check_nrpe!check_swap
max_check_attempts 3
normal_check_interval 5
retry_check_interval 1
check_period 24x7
notification_interval 5
notification_period 24x7
notification_options w,u,c,r
contact_groups admins
}
define service {
hostgroup_name test
service_description check_hda1
check_command check_nrpe!check_hda1
max_check_attempts 3
normal_check_interval 5
retry_check_interval 1
check_period 24x7
notification_interval 5
notification_period 24x7
notification_options w,u,c,r
contact_groups admins
}
define service {
hostgroup_name test
service_description check_hda2
check_command check_nrpe!check_hda2
max_check_attempts 3
normal_check_interval 5
retry_check_interval 1
check_period 24x7
notification_interval 5
notification_period 24x7
notification_options w,u,c,r
contact_groups admins
}
在客户端:
在客户端的nagios中 /usr/local/nagios/etc/nrpe.cfg 配置文件中找到
allowed_host=127.0.0.1,192.168.1.123设置nagios监控服务器的IP地址,也就是我们nagios服务器地址。
其次:设置监控详细参数。也就是需要监控本机的一些服务,并给其设置报警的阀值
-c 代表的就是critical 危险级别 -w 代表是warning 警告级别
在这里我们以上面的swap load和had1、had2为例:
command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /boot
command[check_hda2]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /
command[check_swap]=/usr/local/nagios/libexec/check_swap -w 20% -c 10%
设置完成后,我们可以通过一条命令来检测下nagios,cfg是否正确,如果正确重启服务进行测试!
/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg
service nagios restart ; service xinetd restart;
**************************************************************************************************************
在测试过程中发现检测不到NRPE命令,只需要在command.cfg中写入:
#'check_nrpe‘ command definition
define command{
command_name check_nrpe
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
到此 nagios的安装以及简单配置已经完成,你成功了吗?
本文转自岁月丶倾城博客51CTO博客,原文链接http://blog.51cto.com/alca0126/1285976如需转载请自行联系原作者
laihuadongcto