告警系统主脚本、告警系统配置文件、告警系统监控项目

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介:

告警系统主脚本

创建监控系统的各个目录
[root@centos7 sbin]# pwd
/data/shell/sbin
[root@centos7 sbin]# ls
[root@centos7 sbin]# mkdir mon
[root@centos7 sbin]# cd mon/
[root@centos7 mon]# mkdir bin conf shares log mail

主脚本放在bin目录下
[root@centos7 mon]# cd bin/
[root@centos7 bin]# vim main.sh
#!/bin/bash
#是否发送邮件的开关(1表示所有监控项目都发送邮件)表示在当前bash定义的$send=1都生效
export send=1
#过滤ip地址(此处为本机网卡名称)$addr=192.168.3.74
export addr=/sbin/ifconfig |grep -A1 "eno16777736: "|awk '/inet/ {print $2}'
dir=pwd
#只需要最后一级目录名
last_dir=echo $dir|awk -F'/' '{print $NF}'
#下面的判断目的是,保证执行脚本的时候,我们在bin目录里,#不然监控脚本、邮件和日志很有可能找不到
if [ $last_dir == "bin" ] || [ $last_dir == "bin/" ]; then
conf_file="../conf/mon.conf"
else
echo "you shoud cd bin dir"
exit
fi
#exec 将以下执行的结果,不论错误还是正确都输入到日志里
exec 1>>../log/mon.log 2>>../log/err.log
#做时间标记,并记录当前时间系统负载
#主脚本执行子脚本shell 
/bin/bash ../shares/load.sh

if grep -q 'to_mon_502=1' $conf_file; then
export log=grep 'logfile=' $conf_file |awk -F '=' '{print $2}' |sed 's/ //g'
#找出配置文件中该监控项日志的目录
/bin/bash ../shares/502.sh
fi

告警系统配置文件

配置文件的作用:
定义一些开关、日志的路径、某应用的用户名、密码、IP、端口等等。
[root@centos7 conf]# pwd
/data/shell/sbin/mon/conf
[root@centos7 conf]# vim mon.conf
##to config the options if to monitor
##定义mysql的服务器地址、端口以及user、password
to_mon_cdb=0 
##是否监控数据库,0 or 1, default 0,0 not monitor(不监控), 1 monitor(监控)
db_ip=192.168.3.83
db_port=3306
db_user=root
db_pass=123456
##监控httpd 如果是1则监控,为0不监控
to_mon_httpd=0
##监控php 如果是1则监控,为0不监控
to_mon_php_socket=0
##监控http_code_502 需要定义访问日志的路径
to_mon_502=1
logfile=/data/logs/aaa.com/access.log
#定义日志文件路径
##监控request_count 定义日志路径以及域名
to_mon_request_count=0
req_log=/data/log/www.discuz.net/access.log
domainname=www.discuz.net

告警系统监控项目

告警系统——load.sh 子shell

监控系统负载。
[root@centos7 mon]# vim shares/load.sh

#! /bin/bash
##Writen by jacker##
load=uptime |awk -F 'average:' '{print $2}'|cut -d',' -f1|sed 's/ //g' |cut -d. -f1
#获取负载值
if [ $load -gt 10 ] && [ $send -eq "1" ]
#判断是否超负载,同时判断是否开启负载监控项
then
echo "$addr date +%T load is $load" >../log/load.tmp
/bin/bash ../mail/mail.sh jacker@163.com "$addr_load:$load" cat ../log/load.tmp
#超出设定的负载值后,发送邮件
fi
echo "date +%T load is $load"
#日志文件(定义在系统配置exec 1>> ../log中)

告警系统——502.sh

监控web服务器502错误。
[root@centos7 mon]# vi shares/502.sh

#! /bin/bash
d=date -d "-1 min" +%H:%M
#因为监控主脚本一分钟执行一次,所以监控的内容为系统一分钟之前的状态
c_502=grep :$d: $log |grep ' 502 '|wc -l
if [ $c_502 -gt 10 ] && [ $send == 1 ]; then
echo "$addr $d 502 count is $c_502">../log/502.tmp
/bin/bash ../mail/mail.sh $addr_502 $c_502 cat ../log/502.tmp
fi
echo "date +%T 502 $c_502"

告警系统——disk.sh

[root@centos7 mon]# vim shares/disk.sh

#! /bin/bash
rm -f ../log/disk.tmp
for r in df -h |awk -F '[ %]+' '{print $5}'|grep -v Use
##awk -F '[ %]+' 以一个或多个“[ %]”空格和百分号作为分隔符
##即,awk可以一次指定多种分隔符(同时生效)
do
if [ $r -gt 90 ] && [ $send -eq "1" ]
then
echo "$addr date +%T disk useage is $r" >>../log/disk.tmp
fi
if [ -f ../log/disk.tmp ]
#判断该文件是否存在
then
df -h >> ../log/disk.tmp
/bin/bash ../mail/mail.sh $addr_disk $r ../log/disk.tmp
echo "date +%T disk useage is nook"
else
echo "date +%T disk useage is ok"
fi











本文转自方向对了,就不怕路远了!51CTO博客,原文链接: http://blog.51cto.com/jacksoner/2045966,如需转载请自行联系原作者


相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
存储 监控 Cloud Native
【笔记】用户指南—监控与告警—配置告警
您可以在控制台上配置计算资源监控指标和存储资源监控指标的告警规则。本文将介绍如何配置实例的告警规则。
131 0
【笔记】用户指南—监控与告警—配置告警
|
6月前
|
运维 监控 安全
SLS相同监控规则太多?试试告警监控模板
本文主要介绍了SLS自定义告警监控模板的使用场景以及最佳实践。
140 0
SLS相同监控规则太多?试试告警监控模板
|
存储 监控 Cloud Native
用户指南—监控与告警—配置告警
您可以在控制台上配置计算资源监控指标和存储资源监控指标的告警规则。本文将介绍如何配置实例的告警规则。
181 0
用户指南—监控与告警—配置告警
|
存储 JSON 数据格式
报警系统QuickAlarm之报警规则的设定与加载
既然命名为规则,那么就需要有对应的解析器,以根据报警规则和报警类型等相关输入条件,来选择对应的报警执行器,因此本文主要包括的内容就比较清晰了 1.报警规则的定义 2.报警规则的加载 3.报警规则的解析以及报警执行器选择
255 0
报警系统QuickAlarm之报警规则的设定与加载
|
监控 API 存储
如何实现 Logtail 的状态监控与异常告警
作为日志服务的采集 agent,Logtail 一般位于业务数据链路的前段,为链路中的后续部分输送数据,因此,它的正常运行显得至关重要。经过多年的实战打磨,Logtail 在稳定性和性能上都已经比较出色,在机器、网络等环境不变的情况下,配置完成后基本不再需要进行任何运维。
2459 0
如何实现 Logtail 的状态监控与异常告警