监控利器Nagios之一:监控本地NFS和外部HTTP、MySQL服务

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介:

监控利器Nagios之一:监控本地NFS和外部HTTPMySQL服务

 

Nagios是一款开源的免费网络监视工具,能有效监控WindowsLinuxUnix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

Nagios的特点:

1、监控服务httpMySQLnfstcpping

2、监控主机资源cpu、负载、I/O、虚拟及内存磁盘利用率等

3、支持邮件微信等报警通信。

4、可选web见面用于查看当前的网络状态等

Nagios的组成:

Nagios监控软件是一个监控平台。Nagios监控一般由一个主程序(nagios)、一个插件程序(nagios-plugins)和一些可选的插件组成。

1NRPE组件

Nrpe组件一般工作在备监控端,朱勇用于监控本地资源,包括负载(uptime)、CPUtopSar)、磁盘(df -hi)、内存(free)、I/Oiostat)等

2NSClient++

3NDOUtils

Nagios的监控完整图:

wKioL1lJI1uxed3OAABBR53LMgA875.png 

原理如下:

通常由nagios服务端发起获取数据请求,由check_nrpe插件携带要获取的命令,传给给监控端nrpe守护进程,默认是5666端口,nrpe进程读取nrpe.Cfg里对应服务器端发送的命令信息,通过调用本地插件获取数据,然后返回给nagios服务器端的check_nrpe,进而传给nagios战术的web页面中。

 

一:实验目标

1、监控外部服务器NFS,服务端当做客户端

2、监控外部服务器的MySQL服务

3、监控外部服务器httpd

4、监控外部服务器的私有信息

二:实验环境

VMare

作用

主机名

Ip地址

安装的软件

RHEL-6.5

服务端

yu61

192.168.1.61

Nagios软件,nagios插件,nrpeLAMP环境、NFS

RHEL-6.5

客户端

yu62

192.168.1.62

nagios插件,nrpemysql-serverIO

RHEL-6.5

客户端

yu63

192.168.1.63

nagios插件,nrpeNFSHttp

 #所有服务器都需要关闭防火墙

 

三:实验步骤

安装服务端环境

1、安装LAMP环境

Nagios服务端需要有web界面用来展示监控效果,而监控的内容是属于动态的,因此使用LAMP环境,Apache用作于web展示监控效果,PHP用于展示监控动态信息。

1
2
3
4
5
6
7
8
[root@yu61 ~] # mkdir -p /home/yu/tools
[root@yu61 ~] # yum install -y httpd gccglibc glibc-common php gd gd-devel libpng libmng libjpeg zlib mysql-server 
[root@yu61 ~] # service iptables stop 
[root@yu61 ~] # service httpd restart
[root@yu61 ~] # vim /var/www/html/index.php
<?php
phpinfo();
?>


2、添加用户

Apache用户默认是存在的,属组默认daemon,需要把它改成nagios。这样它才能有权限访问安装的nagios目录,执行相关的cgi命令,如通过浏览器界面关闭nagios、停止某个故障对象发送报警信息等。

添加nagios帐户,以用来运行Nagios。当然也可以用root运行,但出于安全考虑而使用普通帐号来运行,并且不给这个账号分配shell登录权限

1
2
3
4
[root@yu61 tools] # useradd  -s /sbin/nollogin  nagios
[root@yu61 tools] # groupadd nagcmd
[root@yu61 tools] # usermod -a -G nagcmd nagios
[root@yu61 tools] # usermod -a -G nagcmd apache


3、安装nagios主程序

1
2
3
4
5
6
7
8
9
10
[root@yu61 tools] # tar jxvf nagios-cn-3.2.3.tar.bz2 
[root@yu61 tools] # cd nagios-cn-3.2.3
[root@yu61 nagios-cn-3.2.3] # ./configure --with-command-group=nagcmd
[root@yu61 nagios-cn-3.2.3] #make all
[root@yu61 nagios-cn-3.2.3] # make install
[root@yu61 nagios-cn-3.2.3] # make install-init
[root@yu61 nagios-cn-3.2.3] #make install-commandmode
[root@yu61 nagios-cn-3.2.3] # make install-config
[root@yu61 nagios-cn-3.2.3] # make install-webconf
[root@yu61 nagios-cn-3.2.3] # htpasswd -c /usr/local/nagios/etc/htpasswd.users mobanche


 

用于检测文件的完整性的方法有两种。一种是绝对路径,一种是启动检测

第一种:

1
[root@yu61 nagios] # /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg


第二种:

1
[root@yu61 nrpe-2.12] # vim /etc/init.d/nagios


#删掉启动项中178行中的“  > /dev/null 2>&1;”内容。

wKiom1lJI3HhCVOCAAAfRnEMNFQ560.png 

1
2
3
4
5
6
[root@yu61 objects] # vim /usr/local/nagios/etc/cgi.cfg
use_authentication=0  #改为0
  
[root@yu61 nrpe-2.12] # /etc/init.d/nagios checkconfig 
Total Warnings: 0
Total Errors:   0


 

4、安装nagios-plugins插件包

Nagios的插件包就是实现获取数据信息的命令或者程序,用过这些命令或程序,nagios可以获取到需要的数据,然后进行报警和展示。

1
2
3
4
5
6
[root@yu61 tools] # yum install perl-devel openssl-devel -y
[root@yu61 tools] # tar zxvf nagios-plugins-1.4.16.tar.gz
[root@yu61 tools] # cd nagios-plugins-1.4.16
[root@yu61 nagios-plugins-1.4.16] # ./configure  --with-nagios-user=nagios --with-nagios-group=nagcmd --enable-perl-modules --with-mysql
[root@yu61 nagios-plugins-1.4.16] # make -j 4
[root@yu61 nagios-plugins-1.4.16] # make install


5、安装nrpe软件包

Nrpe是通常用于安装被监控端的,这里在服务端也安装的了nrpe软件,是因为nagios服务器端需要check_nrpe插件做被动检查,如果服务端不安装nrpe插件,那么也就没有这个插件了,其次nagios服务器端本地的资源也需要被监控,因此nagios服务器端也会被认作客户端。

1
2
3
4
[root@yu61 tools] # tar zxvf nrpe-2.12.tar.gz
[root@yu61 tools] # cd nrpe-2.12
[root@yu61 nrpe-2.12] # ./configure 
[root@yu61 nrpe-2.12] # make all && make instll


6、服务端附件

1)检查登录nagios的管理账户信息

1
2
3
4
[root@yu61 nagios-cn-3.2.3] # grep AuthUserFile /etc/httpd/conf.d/nagios.conf 
    AuthUserFile  /usr/local/nagios/etc/htpasswd . users
    AuthUserFile  /usr/local/nagios/etc/htpasswd . users
    AuthUserFile  /usr/local/nagios/etc/htpasswd . users


2)设置nagios开机自启动

1
2
3
[root@yu61 nagios-cn-3.2.3] # chkconfig postfix on
[root@yu61 nagios-cn-3.2.3] # chkconfig postfix --list
postfix        0:关闭1:关闭2:启用3:启用4:启用5:启用6:关闭


3)邮件报警

1
2
3
4
5
6
7
8
9
10
11
12
13
14
[root@yu61 nagios-cn-3.2.3] # /etc/init.d/httpd reload
[root@yu61 nagios-cn-3.2.3] # sed -n '35p ' /usr/local/nagios/etc/objects/contacts.cfg 
         email                           741215208@qq.com; <<***** CHANGE THIS TO YOUR EMAIL ADDRESS ******
[root@yu61 nagios-cn-3.2.3] # /etc/init.d/postfix start 
[root@yu61 nagios-cn-3.2.3] # lsof -i :25
COMMAND  PID USER   FD   TYPE DEVICE SIZE /OFF  NODE NAME
master  2094 root   12u  IPv4  12921      0t0  TCP localhost:smtp (LISTEN)
master  2094 root   13u  IPv6  12923      0t0  TCP localhost:smtp (LISTEN)
[root@yu61 nagios-cn-3.2.3] # mail -s "test" 741215208@qq.com < /etc/hosts
[root@yu61 nagios-cn-3.2.3] # mailq
-Queue ID- --Size-- ----Arrival Time---- -Sender /Recipient-------
A1C723FFA6      599 Sun May 21 12:23:56  root@yu61.localdomain
(lost connection with mx2.qq.com[14.17.41.170]  while  performing the HELO handshake)
                                          741215208@qq.com


 

安装客户端端环境

注释:三台客户端同时安装,安装的内容一样。

1、添加用户

1
2
3
4
5
6
[root@yu62 ~] # mkdir -p /home/yu/tools
[root@yu62 ~] # cd /home/yu/tools/
[root@yu62 tools] # yum install perl-devel openssl-devel -y
[root@yu62 tools] #  useradd -s /sbin/nologin nagios
[root@yu62 tools] #  groupadd nagcmd
[root@yu62 tools] #  usermod -G nagcmd nagios


1
2
3
4
5
2、安装nagios-plugins插件包
[root@yu62 tools] # tar zxvf nagios-plugins-1.4.16.tar.gz
[root@yu62 tools] # cd nagios-plugins-1.4.16
[root@yu62 nagios-plugins-1.4.16] # ./configure  --with-nagios-user=nagios --with-nagios-group=nagcmd --enable-perl-modules --with-mysql
[root@yu62 nagios-plugins-1.4.16] # make -j 4 && make install


3、安装nrpe软件包

1
2
3
[root@yu62 tools] # tar zxvf nrpe-2.12.tar.gz
[root@yu62 tools] # cd nrpe-2.12
[root@yu62 nrpe-2.12] # ./configure &&  make all && make install


 

实战:监控外部服务器MySQL服务

1、服务端修改配置文件

1
2
3
4
5
6
7
root@yu61 ~] # cd /usr/local/nagios/etc
[root@yu61 etc] # vim nagios.cfg
改:cfg_file= /usr/local/nagios/etc/objects/localhost .cfg
为:注释localhost这一项,添加以下两行:
#cfg_file=/usr/local/nagios/etc/objects/localhost.cfg
cfg_file= /usr/local/nagios/etc/objects/hosts .cfg
cfg_file= /usr/local/nagios/etc/objects/service .cfg


2、修改配置文件、生成要检测的主机配置文件和服务配置文件:

1
2
3
4
5
6
7
8
9
10
11
12
13
[root@yu61 etc] # cd objects/
[root@yu61 objects] # vim hosts.cfg  # 添加以下内容
####################chreck_host###########################
define host{
         use                     linux-server            
         host_name               yu62
         alias                    mysql服务
         address                 192.168.1.64
         icon_image              switch.gif
         statusmap_image         switch.gd2
         2d_coords               100,200
         3d_coords               100,200,100
         }


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
[root@yu61 objects] # vim service.cfg # 添加以下内容
###################check_server_mysql#############################
define service{
                 use                      local -service
                 host_name               yu62
                 service_groups          mysql服务组
                 service_description     mysql服务
                 check_command           check_mysql
                 }
  
##########################check_server_mysql_groups#########################define servicegroup{
                 servicegroup_name       mysql服务组
                 alias                    mysql服务器
                 members                 yu62,mysql服务
}
1
2
3
4
5
6
[root@yu61 objects] # vim commands.cfg #在此文件最后添加以下内容:
define  command {
command_name check_mysql
command_line $USER1$ /check_mysql  -H$HOSTADDRESS$ -u nagdb -d nagdb
}
[root@yu61 nrpe-2.12] # /etc/init.d/nagios checkconfig


3、客户端上安装MySQL服务

1
2
3
4
5
[root@xuegod62 ~] # yum install mysql-server -y
[root@xuegod62 ~] # service mysqld restart
[root@xuegod62~] # mysql
mysql>create database nagdb; 
mysql> grant  select  on nagdb.* to yu@ '192.168.1.61' ;


4、重启mysqld、nagios服务

1
2
3
4
5
[root@yu62 ~] # /etc/init.d/httpd restart
[root@yu62 ~] # /etc/init.d/mysqld restart
[root@yu61 ~] # /etc/init.d/nagios restart
[root@yu61 objects] #/usr/local/nagios/libexec/check_mysql -H 192.168.1.64 -u nagdb -d nagdb
Uptime: 516  Threads: 1 Questions: 6  Slow queries: 0  Opens: 15 Flush tables: 1  Open tables:8  Queries per second avg: 0.11


#上述命令执行后,出现以下信息,表示正常,连接192.168.1.64mysql里面的用户是正常的

5)测试查看主机和服务:

http://192.168.1.63/nagios/

wKioL1lJI36ALgDCAAAXHQQFZMY410.png 

 

实战:监控外部服务器NFS服务

1、安装配置NFS服务器

1
2
3
4
5
6
7
8
[root@yu61 objects] # service rpcbind status
rpcbind (pid  1614) 正在运行...
[root@yu61 ~] # vim /etc/exports
/tmp  *(rw)
[root@yu61 ~] # /etc/init.d/nfs restart 
[root@yu61 ~] # showmount -e 192.168.1.61
Export list  for  192.168.1.61:
/tmp  *


2、编辑check_nfs命令脚本

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
[root@yu61 libexec] # pwd
/usr/local/nagios/libexec
[root@yu61 libexec] # cat check_nfs 
check_nfs
#!/bin/bash
/data1/server/nagios/libexec/utils .sh
CHECKNAME= "Mount NFS"
RESULT= ""
EXIT_STATUS=$STATE_OK
NFSFSTAB=`LC_ALL=C  awk  '!/^#/ && $3 ~ /^nfs/ && $3 != "nfsd" && $4 !~ /noauto/ { print $1 }'  /etc/fstab `
NFSMTAB=`LC_ALL=C  awk  '$3 ~ /^nfs/ && $3 != "nfsd" && $2 != "/" { print $1 }'  /proc/mounts `
theend() {
     echo  $RESULT
     exit  $EXIT_STATUS
}
CHECK_MOUNT(){
     LIST= ""
     for  list  in  $NFSFSTAB
     do
         NFS_MOUNT=$(LC_ALL=C  cat  /proc/mounts  | cut  -d  " "  -f 1| grep  "${list}$" )
         if  [ -z  "${NFS_MOUNT}"  ]; then
             LIST= "$LIST$list "
         fi
     done
}
if  [ -n  "${NFSMTAB}"  ]; then
     CHECK_MOUNT
     if  [ -z  "${LIST}"  ]; then
         RESULT= "$CHECKNAME OK - NFS BE MOUNTED PROPERLY"
         EXIT_STATUS=$STATE_OK
     else
         RESULT= "$CHECKNAME WARNING - ${LIST} NOT BE MOUNTED"
         EXIT_STATUS=$STATE_WARNING
     fi
else
     RESULT= "$CHECKNAME CRITICAL - ALL NFS NOT BE MOUNTED"
     EXIT_STATUS=$STATE_CRITICAL
fi
Theend


注释:为了安全起见修改权限,不修改默认为644 root

1
2
3
4
[root@yu61 libexec] # chmod 755 check_nfs 
[root@yu61 libexec] # chown nagios:nagcmd check_nfs 
[root@yu61 libexec] # ll check_nfs 
-rwxr-xr-x 1 nagios nagcmd 973 5月  22 13:27 check_nfs


3、修改配置文件

1
2
3
4
5
6
7
8
9
10
11
12
[root@yu61 objects] # cat hosts.cfg    ##末尾添加
####################chreck_host###########################
define host{
         use                     linux-server            
         host_name               yu61
         alias                    nfs服务
         address                 192.168.1.61
         icon_image              switch.gif
         statusmap_image         switch.gd2
         2d_coords               100,200
         3d_coords               100,200,100
         }


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
[root@yu61 objects] # cat service.cfg  ##末尾添加
###################check_server_mysql#############################
define service{
                 use                      local -service
                 host_name               yu61
                 service_groups          nfs服务组
                 service_description     nfs服务
                 check_command           check_nrpe!check_nfs
                 }
  
##########################check_server_mysql_groups######################
define servicegroup{
                 servicegroup_name       nfs服务组
                 alias                    nfs服务器
                 members                 yu61,nfs服务
}


1
2
3
4
5
6
7
8
9
10
11
[root@yu61 objects] # vim commands.cfg   ##末尾添加
#'check_nrpe' command definition
definecommand{
         command_name    check_nrpe
         command_line    $USER1$ /check_nrpe  -H $HOSTADDRESS$ -c$ARG1$
         }
  
define  command {
        command_name    check_nfs
        command_line    $USER1$ /check_nfs
        }


4、检测服务配置及启动服务

1
2
3
4
[root@yu61 objects] # /etc/init.d/nagios checkconfig
Total Warnings: 0
Total Errors:   0
[root@yu61 objects] # /etc/init.d/nagios reload


5、测试查看主机和服务

http://192.168.1.63/nagios/

wKiom1lJI4zT_xI4AAAu27nGztU009.png 

 

实战:监控外部服务器httpd服务

1、修改配置文件

1
2
3
4
5
6
7
8
9
10
11
[root@yu61 objects] # cat hosts.cfg   ##最后编辑
define host{
         use                     linux-server            
         host_name               yu63
         alias                    http服务
         address                 192.168.1.63
         icon_image              switch.gif
         statusmap_image         switch.gd2
         2d_coords               100,200
         3d_coords               100,200,100
         }


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
[root@yu61 objects] # cat service.cfg   ##最后添加
###################check_server_httpd-63#############################
define service{
                 use                      local -service
                 host_name                yu63
                 service_groups             http服务组
                 service_description         http服务
                 check_command           check_http
                 }
  
##########################check_server_http-63_groups######################
define servicegroup{
                 servicegroup_name         http服务组
                 alias                      http服务器
                 members                 yu63,http服务
}


 

#Check_http的命令默认就有的

 

2、检测配置文件和重启服务

1
2
3
4
5
6
7
[root@yu61 objects] # /etc/init.d/nagios checkconfig 
Total Warnings: 0
Total Errors:   0
[root@yu63 nrpe-2.12] # service iptables stop
[root@yu63 nrpe-2.12] # setenforce 1
setenforce: SELinux is disabled
[root@yu63 nrpe-2.12] # service httpd restart


3、测试查看主机和服务

wKiom1lJI5jQI8XfAAAxqs9nmR8822.png 










本文转自 于学康 51CTO博客,原文链接:http://blog.51cto.com/blxueyuan/1940319,如需转载请自行联系原作者
相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
1月前
|
Prometheus 监控 Cloud Native
使用mysqld_exporter监控所有MySQL实例
使用mysqld_exporter监控所有MySQL实例
61 2
|
1月前
|
Cloud Native 关系型数据库 MySQL
云原生数据仓库产品使用合集之如何使用ADB MySQL湖仓版声纹特征提取服务
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
2天前
|
Dubbo 前端开发 Java
Dubbo3 服务原生支持 http 访问,兼具高性能与易用性
本文展示了 Dubbo3 triple 协议是如何简化从协议规范与实现上简化开发测试、入口流量接入成本的,同时提供高性能通信、面向接口的易用性编码。
|
4天前
|
Oracle 关系型数据库 MySQL
实时计算 Flink版产品使用问题之整库从mysql同步到StarRocks里面,首次全量是否会对mysql造成大量资源消耗,导致影响业务服务
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
9天前
|
数据采集 安全
怎么筛选出好的http代理服务?
在选择好的HTTP代理服务时,关注点应包括:低重复率的IP池,确保高可用性和稳定性;完善的安全机制以保障用户信息;广泛地域覆盖,适应不同区域需求;多样化的代理类型,如共享、独享、静态和隧道代理,根据需求平衡性能与成本。考虑这些因素,可找到性价比高的HTTP代理服务。
18 5
|
9天前
|
关系型数据库 数据管理 数据库
数据管理DMS产品使用合集之如何极速恢复RDS(关系型数据库服务)中的数据表
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
|
15天前
|
Ubuntu
ubuntu搭建NFS服务 磁盘共享 nfs 搭建
ubuntu搭建NFS服务 磁盘共享 nfs 搭建
|
20天前
|
存储 网络协议 Linux
NFS(Network File System 网络文件服务)
NFS(Network File System 网络文件服务)
|
1月前
|
SQL 关系型数据库 MySQL
【简单无脑】自动化脚本一键安装虚拟机下的MySQL服务
该文章提供了在虚拟机上安装MySQL服务的简化方法,特别是针对新手。作者提供了一个自动化脚本`install_mysql.sh`,使得安装过程更简单。用户需要下载`install.rpm`资源,将其放在指定目录下,然后创建并编辑脚本文件,将提供的代码粘贴进去,通过`chmod u+x`授权,最后运行脚本`./install_mysql.sh [rpm文件路径]`来安装MySQL。文章还附有相关图片说明。
121 1
【简单无脑】自动化脚本一键安装虚拟机下的MySQL服务
|
28天前
|
SQL 关系型数据库 MySQL
MySQL服务的状态如何查看?
【5月更文挑战第23天】MySQL服务的状态如何查看?
76 1