“nginx统一监控”意思是在一台Linux服务器上集中监控所有nginx站点的status状态。我们把这个服务器叫做“nginx监控服务器”,可以是装有zabbix agent的zabbix server,或是其他装agent的被监控客户端。

    思路:把所有nginx站点的URL写入到“nginx监控服务器”上的一个配置文件中。增加或删除nginx监控站点只需要修改这个配置文件,利用zabbix的low-level discovery动态监控这些站点。“nginx监控服务器”的zabbix-agent调用nginx监控脚本,获取nginx_status后,利用zabbix-sender把监控数据发送到zabbix服务器端。

配置步骤如下:

一、在被监控nginx站点上配置stub_status模块

    开启stub_status模块监控,在server块中加入location就行了。

    假设“nginx监控服务器”的IP地址为192.168.0.1,配置如下:

1
2
3
4
5
6
7
8
    location /nginx_status{
        stub_status on;
        access_log off;
        allow 127.0.0.1;
        # 要允许“nginx监控服务器”访问nginx status
        allow 192.168.0.1;
        deny all;
    }

    重启nginx,然后请求http://domain/nginx_status 就行了,下面是结果:

1
2
3
4
Active connections: 1 
server accepts handled requests
 16672 16672 16769 
Reading: 0 Writing: 1 Waiting: 0

二、在nginx监控服务器上配置监控脚本

    首先,在nginx监控服务器上安装好zabbix-agent和zabbix-sender,推荐yum安装。

    注意:设置zabbix_agentd.conf里Timeout=30。减少因脚本执行超时,agent获取不到数据的情况。

    然后,建立脚本文件的目录/etc/zabbix/monitor_scripts。

1
shell# mkdir -p /etc/zabbix/monitor_scripts

    把监控脚本nginx_monitor.sh放到/etc/zabbix/monitor_scripts目录下。

    nginx_monitor.sh脚本内容如下,需要修改AGENT_CONF变量的值:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
#!/bin/bash
#
# Filename:    nginx_monitor.sh
# Revision:    1.0
# Date:        2014/09/24
# Author:      Qicheng
# Email:
# Website:     http://qicheng0211.blog.51cto.com
# Description: nginx统一监控脚本
# Notes:       
#
 
# 修改AGENT_CONF的值为本地zabbix agent的配置文件路径
AGENT_CONF="/etc/zabbix/zabbix_agentd.conf "
# nginx站点的配置文件路径
NGINX_SITE_CONF="/etc/zabbix/monitor_scripts/nginx_site.conf"
# zabbix_sender的路径
ZBX_SENDER="/usr/bin/zabbix_sender"
 
FUNCTION=$1
HOST_NAME=$2
NGINX_SITE=$3
CURL="/usr/bin/curl"
TIMEOUT=30
 
# nginx site low-level discovery
function nginxSiteDiscovery()
{
    nginx_site=($(grep '^[^#]' ${NGINX_SITE_CONF}))
    max_index=$[${#nginx_site[@]}-1]
    printf '{\n'
    printf '\t"data":['
    for key in `seq -s' ' 0 $max_index`
    do
        printf '\n\t\t{'
        printf "\"{#NGINX_SITE}\":\"${nginx_site[${key}]}\"}"
        if [ $key -ne $max_index ];then
            printf ","
        fi
    done
    printf '\n\t]\n'
    printf '}\n'
}
 
# 获取nginx status,把数据发送到zabbix server
function getNginxStatus()
{
    nginx_status_url="${NGINX_SITE}/nginx_status"
    # 获取nginx_status后,保存到下面的文件里
    nginx_status_file="/tmp/nginx_status_$(echo ${NGINX_SITE} | sed 's#^http.*://##; s#/#_#g').log"
    :>"$nginx_status_file"
 
    # curl获取nginx_status
    ${CURL} -s --connect-timeout ${TIMEOUT} "$nginx_status_url" 2>&1 | tee "$nginx_status_file"
    line_num=$(cat "$nginx_status_file" wc -l)
    # 判断是否正确获取nginx_status
    [ $line_num -ne 4 ] && { echo "ERROR: $nginx_status_file is not correct."exit 1;}
 
    active=$(cat "$nginx_status_file" grep 'Active' awk '{print $NF}')
    reading=$(cat "$nginx_status_file" grep 'Reading' awk '{print $2}')
    writing=$(cat "$nginx_status_file" grep 'Writing' awk '{print $4}')
    waiting=$(cat "$nginx_status_file" grep 'Waiting' awk '{print $6}')
    accepts=$(cat "$nginx_status_file" awk NR==3 | awk '{print $1}')
    handled=$(cat "$nginx_status_file" awk NR==3 | awk '{print $2}')
    requests=$(cat "$nginx_status_file" awk NR==3 | awk '{print $3}')
    echo "Sending the data to zabbix server..."
    # 将特定格式的数据发送到zabbix server,每行的格式为:<hostname> <key> <value>
    cat << EOF | ${ZBX_SENDER} -c ${AGENT_CONF} -i -
"${HOST_NAME}" "nginx_status[$NGINX_SITE,active]" "${active}"
"${HOST_NAME}" "nginx_status[$NGINX_SITE,reading]" "${reading}"
"${HOST_NAME}" "nginx_status[$NGINX_SITE,writing]" "${writing}"
"${HOST_NAME}" "nginx_status[$NGINX_SITE,waiting]" "${waiting}"
"${HOST_NAME}" "nginx_status[$NGINX_SITE,accepts]" "${accepts}"
"${HOST_NAME}" "nginx_status[$NGINX_SITE,handled]" "${handled}"
"${HOST_NAME}" "nginx_status[$NGINX_SITE,requests]" "${requests}"
EOF
}
 
[ $# -eq 0 ] && { echo "ERROR: The script needs at least one parameter."; exit 1;}
 
case $FUNCTION in
    nginxSiteDiscovery|getNginxStatus)
        $FUNCTION
        ;;
    *)
        echo "ERROR: Bad parameters."
        exit 1
        ;;
esac

    创建nginx站点配置文件nginx_site.conf:

1
2
shell# touch /etc/zabbix/monitor_scripts/nginx_site.conf
shell# chown -R zabbix:zabbix /etc/zabbix/monitor_scripts

    把所有被监控nginx站点的URL写入到nginx_site.conf文件中,每一行一个URL,如下图:

wKiom1QiRf2RCGflAACIA9vwXvo605.jpg

    在zabbix_agentd.conf最后面添加自定义参数:

1
2
UserParameter=nginxSiteDiscovery,bash /etc/zabbix/monitor_scripts/nginx_monitor.sh nginxSiteDiscovery
UserParameter=getNginxStatus[*],bash /etc/zabbix/monitor_scripts/nginx_monitor.sh getNginxStatus "$1" "$2"

    最后重启zabbix agent。

    在zabbix server端执行zabbix_get命令测试:

wKioL1QiTd6TTqiMAAMEdIpr0fA635.jpg

    如上图所示,说明环境部署好了。

三、zabbix WEB端

    1、导入模板

    导入"Template App Nginx.xml"模板,附件有下载。

wKioL1QiVXHx-YAdAAGcPqGMVhA261.jpg

    模板的Item prototypes如下:wKiom1QiXPPijFunAAQ_V-haHlU404.jpg

    “get nginx status of {#NGINX_SITE}”监控项是Zabbix agent类型,用于调用脚本获取nginx_status。其他item是Zabbix trapper类型,用于接收zabbix-sender发来的nginx_status。

    模板配置了触发器,如果获取不到nginx_status则发出告警。

    2、创建nginx监控主机并链接模板

    “nginx监控主机”的配置中要填写Agent interfaces,并链接模板Template App Nginx。

wKioL1QiVdrSUqcTAAJOp49C1RI625.jpg

    3、数据展示

wKioL1QiV5HQQZ06AAewCq9WxeA362.jpg

wKioL1QiYXezJTIsAAanVXgwlIg508.jpg