Nagios 监控mysqlserver具体实现过程-阿里云开发者社区

开发者社区> 技术mix呢> 正文

Nagios 监控mysqlserver具体实现过程

简介:
+关注继续查看

1NRPE介绍

NRPE是Nagios的一个功能扩展,它可在远程Linux/Unix主机上执行插件程序。通过在远程服务器上安装NRPE插件及Nagios插件程序来向Nagios监控平台提供该服务器的本地情况。如CPU负载。内存使用,磁盘使用等。这里将Nagios监控端称为Nagios服务器端。而将远程被监控的主机称为Nagios客户端。

Nagios监控远程主机的方法有多种,其方式包含SNMP,NRPE,SSH,NCSA等。这里介绍其通过NRPE监控远程Linux主机的方式。

NRPE(Nagios Remote Plugin Executor)是用于在远端服务器上执行监測命令的守护进程,它用于让Nagios监控端基于安装的方式触发远端主机上的检測命令。并将检測结果返回给监控端。而其执行的开销远低于基于SSH的检測方式,并且检測过程不须要远程主机上的系统账号信息,其安全性也高于SSH的检測方式。

 

2NRPE的工作原理

NRPE有两部分组成

check_nrpe插件:位于监控主机上
 

nrpe daemon:执行在远程主机上,一般是被监控端agent

注意:nrpe daemon须要Nagios-plugins插件的支持。否则daemon不能做不论什么监控

当Nagios须要监控某个远程Linux主机的服务或者资源情况时:

首先:Nagios会执行check_nrpe这个插件,告诉它要检查什么;

其次:check_nrpe插件会连接到远程的NRPE daemon,所用的方式是SSL;

然后:NRPE daemon 会执行对应的Nagios插件来执行检查;

最后:NRPE daemon 将检查的结果返回给check_nrpe 插件。插件将其递交给nagios做处理。

 

<版权全部。文章同意转载,但必须以链接方式注明源地址,否则追究法律责任!> 
原博客地址:    http://blog.csdn.net/mchdba/article/details/46666229
原作者:黄杉 (mchdba)

 

3、被监控端安装Nagios-plugins插件和NRPE

去mysql客户端安装nrpe客户端服务

3.1、加入nagios用户

[root@localhost ~]# useradd -s/sbin/nologin nagios 

 

3.2。安装nagios插件

[root@localhost ~]# yum -yinstall gcc gcc-c++ make openssl openssl-devel

3.3,安装nrpe

tar -xvf nrpe-2.15.tar.gz

cd nrpe-2.15

./configure--with-nrpe-user=nagios --with-nrpe-group=nagios --with-nagios-user=nagios--with-nagios-group=nagios --enable-command-args --enable-ssl  

make all

make install-plugin

make install-daemon  

make install-daemon-config

 

3.4,去检查nrpe配置

grep -v '^#' /usr/local/nagios/etc/nrpe.cfg |sed '/^$/d'

[root@localhost ~]# grep -v '^#' /usr/local/nagios/etc/nrpe.cfg|sed '/^$/d'

log_facility=daemon

pid_file=/var/run/nrpe.pid

server_port=5666

nrpe_user=nagios

nrpe_group=nagios

allowed_hosts=127.0.0.1,192.168.121.211

dont_blame_nrpe=0

allow_bash_command_substitution=0

debug=0

command_timeout=60

connection_timeout=300

command[check_users]=/usr/local/nagios/libexec/check_users-w 8 -c 12

command[check_load]=/usr/local/nagios/libexec/check_load -w15,10,5 -c 30,25,20

command[check_sda1]=/usr/local/nagios/libexec/check_disk -w20% -c 10% -p /dev/sda3

command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs-w 5 -c 10 -s Z

command[check_total_procs]=/usr/local/nagios/libexec/check_procs-w 750 -c 800

command[check-host-alive]=/usr/local/nagios/libexec/check_ping-H 10.254.3.72 -w 3000.0,80% -c 5000.0,100% -p 5

command[check_mysql_status]=/usr/local/nagios/libexec/check_mysql-unagios -P3306 -s /usr/local/mysql/mysql.sock -Hlocalhost--password='nagiosq@0625' -d test -w 60 -c 100

[root@localhost ~]#

 

3.5,启动nrpe

/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe

 

 

4,制作启动脚本:

[root@localhost bin]# cat /etc/init.d/nrped

 

#chkconfig: 2345 80 90

#description:auto_run

 

NRPE=/usr/local/nagios/bin/nrpe 

NRPECONF=/usr/local/nagios/etc/nrpe.cfg  

   

case "$1" in

   start)  

       echo -n "Starting NRPE daemon..."

       $NRPE -c $NRPECONF -d  

       echo " done."

       ;;  

   stop)  

       echo -n "Stopping NRPE daemon..."

       pkill -u nagios nrpe  

       echo " done."

   ;;  

   restart)  

       $0 stop  

       sleep 2  

       $0 start  

       ;;  

   *)  

       echo "Usage: $0 start|stop|restart"

       ;;  

   esac 

exit 0  

[root@localhost bin]#

 

 

5。设置启动

chmod +x /etc/init.d/nrped  

chkconfig --add nrped 

chkconfig nrped on

 

[root@localhost bin]# ps -eaf|grep nrpe

nagios  30440     1  0 23:48 ?        00:00:00 /usr/local/nagios/bin/nrpe -c/usr/local/nagios/etc/nrpe.cfg -d

root    30442  3292  0 23:48 pts/0    00:00:00 grep nrpe

[root@localhost bin]#

[root@localhost bin]# netstat -tnlp |grepnrpe

tcp       0      0 0.0.0.0:5666                0.0.0.0:*                   LISTEN      30440/nrpe         

tcp       0      0 :::5666                     :::*                        LISTEN      30440/nrpe         

[root@localhost bin]#

 

 

6,监控端安装nrpe

tar xf nrpe-2.15.tar.gz

cd nrpe-2.15  

./configure --with-nrpe-user=nagios --with-nrpe-group=nagios --with-nagios-user=nagios --with-nagios-group=nagios  --enable-command-args --enable-ssl

make all

make install-plugin 

 

#安装完毕后。会在Nagios安装文件夹的libexec下生成check_nrpe的插件。例如以下所看到的:

[root@test_db2 nagios]#  ll /usr/local/nagios/libexec/check_nrpe

-rwxrwxr-x 1 nagios nagios 76777 Jun 2523:53 /usr/local/nagios/libexec/check_nrpe

[root@test_db2 nagios]#

 

检測报错:

[root@test_db2 libexec]# ./check_nrpe -H192.168.121.210

CHECK_NRPE: Error - Could not complete SSLhandshake.

[root@test_db2 libexec]#

 

去客户端在allowed_hosts中加入监控端IP地址

[root@localhost ~]# vim/usr/local/nagios/etc/nrpe.cfg

allowed_hosts=127.0.0.1,192.168.121.211

 

 

在mysql服务器上,报错:

[root@localhost ~]#/usr/local/nagios/libexec/check_mysql -unagios -P3306 -S -s/usr/local/mysql/mysql.sock -Hlocalhost --password='nagiosq@0512' -d test -w 60-c 100

/usr/local/nagios/libexec/check_mysql:error while loading shared libraries: libmysqlclient.so.18: cannot open sharedobject file: No such file or directory

[root@localhost ~]#

 

[root@localhost ~]# find / -namelibmysqlclient.so.18

/usr/local/mysql/lib/libmysqlclient.so.18

/root/mysql/mysql-5.6.12/libmysql/libmysqlclient.so.18

/root/mysql-5.6.12/libmysql/libmysqlclient.so.18

[root@localhost ~]# ln -s/usr/local/mysql/lib/libmysqlclient.so.18 /usr/lib64/libmysqlclient.so.18

[root@localhost ~]#

 

加入mysql账号:

mysql> GRANT PROCESS, SUPER, REPLICATIONCLIENT ON *.* TO 'nagios'@'localhost' IDENTIFIED BY 'nagiosq@0625';

Query OK, 0 rows affected (0.05 sec)

 

mysql>

 

客户端自己检測:

[root@localhost ~]#/usr/local/nagios/libexec/check_mysql -unagios -P3306  -s /usr/local/mysql/mysql.sock -Hlocalhost--password='nagiosq@0625' -d test -w 60 -c 100

Uptime: 1823238  Threads: 6 Questions: 684495  Slow queries:0  Opens: 124  Flush tables: 1  Open tables: 116  Queries per second avg:0.375|Connections=3116c;;; Open_files=19;;; Open_tables=116;;; Qcache_free_memory=61538880;;;Qcache_hits=176271c;;; Qcache_inserts=41370c;;; Qcache_lowmem_prunes=0c;;;Qcache_not_cached=331835c;;; Qcache_queries_in_cache=3373;;; Queries=684496c;;;Questions=681384c;;; Table_locks_waited=0c;;; Threads_connected=5;;;Threads_running=2;;; Uptime=1823238c;;;

[root@localhost ~]#

 

7,完好配置文件

7.1command.cfg里面加入监控command命令

将servers.cfg加入进nagios.cfg里面,将command.cfg里面的check_host_alive以及check_mysql_status补充好,然后重新启动nagios

# add by timman on 20150512

define command{

       command_name    check_mysql_status

       command_line    $USER1$/check_mysql_status-w $ARG1$ -c $ARG2$

       }

 

# 'check_nrpe' command definition,add bytimman on 20140508

define command{

       command_name    check_nrpe

       command_line    $USER1$/check_nrpe-H $HOSTADDRESS$ -c $ARG1$

       }

 

define command{

       command_name    check_host_alive

       command_line    $USER1$/check_ping-H $HOSTADDRESS$ -w 3000.0,80% -c 5000.0,100% -p 5

       }

 

7.2servers.cfg里面加入check_mysql_status check_host_alive等服务监控项

[root@test_db2 etc]# more servers.cfg

#  servicedefinition

 

define service{

         host_name               cactitest

       service_description     check_load

       check_command          check_nrpe!check_load

       max_check_attempts      5

       normal_check_interval   3

       retry_check_interval    2

       check_period            24x7

       notification_interval   10

       notification_period     24x7

       notification_options    w,u,c,r

       contact_groups          dba

       }

 

define service{

       host_name               cactitest

       service_description    check_host_alive

       check_command          check_host_alive

       max_check_attempts      5

       normal_check_interval   3

       retry_check_interval    2

       check_period            24x7

       notification_interval   10

       notification_period     24x7

       notification_options    w,u,c,r

       contact_groups          dba

       }

 

define service{

       host_name               cactitest

       service_description     Check Disksda1

       check_command          check_nrpe!check_sda1

       max_check_attempts      5

       normal_check_interval   3

       retry_check_interval    2

       check_period            24x7

       notification_interval   10

       notification_period     24x7

       notification_options    w,u,c,r

       contact_groups          dba

       }

 

define service{

       host_name               cactitest

       service_description     TotalProcesses

       check_command           check_nrpe!check_total_procs

       max_check_attempts      5

       normal_check_interval   3

       retry_check_interval    2

       check_period            24x7

       notification_interval   10

       notification_period     24x7

       notification_options    w,u,c,r

       contact_groups          dba

       }

 

define service{

       host_name               cactitest

       service_description     CurrentUsers

       check_command          check_nrpe!check_users

       max_check_attempts      5

       normal_check_interval   3

       retry_check_interval    2

       check_period            24x7

       notification_interval   10

       notification_period     24x7

       notification_options    w,u,c,r

       contact_groups          dba

       }

 

 

define service{

       host_name               cactitest

       service_description     CheckZombie Procs

       check_command          check_nrpe!check_zombie_procs

       max_check_attempts      5

       normal_check_interval   3

       retry_check_interval    2

       check_period            24x7

       notification_interval   10

       notification_period     24x7

       notification_options    w,u,c,r

       contact_groups          dba

       }

 

 

define service{

       host_name               cactitest

       service_description     CheckMysql Status

       check_command          check_nrpe!check_mysql_status

       max_check_attempts      5

       normal_check_interval   3

       retry_check_interval    2

       check_period            24x7

       notification_interval   10

       notification_period     24x7

       notification_options    w,u,c,r

       contact_groups          dba

       }

 

 

 

7.3 nagios.cfg载入servers.cfg等配置文件

在nagios.cfg里面配置

cfg_file=/usr/local/nagios/etc/servers.cfg

 

同一时候加入新的主机或者服务配置cfg文件,都须要在nagios.cfg里面配置一下,然后重新启动nagios才干生效,例如以下所看到的:

[root@test_db2 nagios]# grep -v '^#'/usr/local/nagios/etc/nagios.cfg |sed '/^$/d' |grep cfg_file

cfg_file=/usr/local/nagios/etc/objects/commands.cfg

cfg_file=/usr/local/nagios/etc/objects/contacts.cfg

cfg_file=/usr/local/nagios/etc/contactgroups.cfg

cfg_file=/usr/local/nagios/etc/objects/timeperiods.cfg

cfg_file=/usr/local/nagios/etc/objects/templates.cfg

cfg_file=/usr/local/nagios/etc/hosts.cfg

cfg_file=/usr/local/nagios/etc/servers.cfg

cfg_file=/usr/local/nagios/etc/hostgroups.cfg

cfg_file=/usr/local/nagios/etc/objects/localhost.cfg

[root@test_db2 nagios]#

 

 

8,之后在页面就能够看到监控效果了

 

 

 

參考文章:http://os.51cto.com/art/201409/452605.htm





本文转自mfrbuaa博客园博客,原文链接:http://www.cnblogs.com/mfrbuaa/p/5387418.html,如需转载请自行联系原作者   



版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
6 个 Linux 运维典型问题,大牛的分析解决思路在这里
  作为一名合格的 Linux 运维工程师,一定要有一套清晰、明确的解决故障思路,当问题出现时,才能迅速定位、解决问题,这里给出一个处理问题的一般思路:   重视报错提示信息:每个错误的出现,都是给出错误提示信息,一般情况下这个提示基本定位了问题的所在,因此一定要重视这个报错信息,如果对这些错误信息视而不见,问题永远得不到解决。查阅日志文件:有时候报错信息只是给出了问题的表面现象,要想更深入的了解问题,必须查看相应的日志文件,而日志文件又分为系统日志文件(/var/log)和应用的日志文件,结合这两个日志文件,一般就能定位问题所在。分析、定位问题:这个过程是比较复杂的,根据报错信息,结合日志
4 0
阿里云云服务使用感悟
1、如何了解到阿里云飞天加速计划·高校学生在家实践 2、ECS服务器使用心得感受 3、对阿里云平台的使用感受和自我计划
9 0
26个例子来搞懂数据库锁
  1 前言   数据库大并发操作要考虑死锁和锁的性能问题。看到网上大多语焉不详(尤其更新锁),所以这里做个简明解释,为下面描述方便,这里用T1代表一个数据库执行请求,T2代表另一个请求,也可以理解为T1为一个线程,T2 为另一个线程。T3,T4以此类推。下面以SQL Server(2005)为例。   2 锁的种类共享锁(Shared lock)。   例1:   ----------------------------------------   T1: select * from table (请想象它需要执行1个小时之久,后面的sql语句请都这么想象)   T2: upda
6 0
6个好用的开源监控工具
  监控系统是整个 IT 架构中的重中之重,小到故障排查、问题定位,大到业务预测、运营管理,都离不开监控系统,可以说一个稳定、健康的 IT 架构中必然会有一个可信赖的监控系统。本文介绍了一些好用的开源监控工具,以供开发人员参考。   1.Prometheus   这是云原生应用程序最受认可的时间序列监控解决方案,由 CNCF 托管,使用 Go 语言开发,是 Google BorgMon 监控系统的类似实现。该方案使用的是 Pull 模型,Prometheus Server 通过 HTTP 的 pull 方式到各个目标拉取监控数据。
5 0
Java-Redis笔记
  Redis   1. 概念: redis是一款高性能的NOSQL系列的非关系型数据库   1.1.什么是NOSQL   NoSQL(NoSQL=Not Only SQL),意即“不仅仅是SQL”,是一项全新的数据库理念,泛指非关系型的数据库。   随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。
6 0
SAP成都研究院非典型程序猿,菜园子小哥:当我用UI5诊断工具时我用些什么
SAP成都研究院非典型程序猿,菜园子小哥:当我用UI5诊断工具时我用些什么
4 0
ADO.Net简介 140
  ADO.NET是.Net中一组类库,通过这组类库可以让我们通过程序的方式访问数据库中数据;之前学习的都是在数据库管理器中通过设计器或者SQL语句进行增删改查等操作数据库中的数据,对于普通用户不可能每个人都必须学习SQL,才能查看使用数据库,我们使用ADO.Net中的类库通过搭建比如窗体程序,使普通用户通过窗体上的按钮就可以很方便地操作和使用数据库中的数据,比如去买火车飞机等票时,窗口的出票员他们不可能每个人都去学习过SQL的知识后才能上岗,他们也是通过窗体或者网页方式查询使用数据库的数据的   ADO.NET中最重要的两个类:1)Connection用来连接数据库 2)Command用
6 0
阿里面试官三年经验PHP知识点汇总,学会你就是下一个阿里人
  1. PHP方面的问题   什么是composer?以及composer是干什么用的?工作原理PHP如何实现静态化你了解设计模式吗?说下你最常用的设计模式观察者模式是如何实现的?工厂模式是如何实现的?适配器模式是如何实现的?……PHP的优化方案说下你了解的session和cookie如何实现不基于session和cookie的用户认证。说下你目前框架所用到的核心概念什么是CSRF攻击,XSS攻击?如何防范你了解RESTful API吗?说说干什么用的。设计的原则如果实现自动加载?不用composer如何实现?PSR-4是什么?   2. 数据库方面   你知道nosql吗?你用的n
4 0
机器人与触觉传感技术的碰撞,一文初探人类与机器人的触觉传感
本文对人类和机器人的触觉传感知识进行了简单的梳理和探讨,并以此为基础给出了两篇论文中的应用实例。
6 0
+关注
2884
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载