Zabbix5.0监控ogg并自动拉起进程

简介: Zabbix5.0监控ogg并自动拉起进程

我这里通过ggsci的info all来判断Status状态是否正常,如果状态是STOPPED、ABEND则触发钉钉告警,然后让zabbix自动拉起服务,当然此处可结合自身需求进行设置,例如:不包含RUNNING的状态则触发警告,只需要grep -v "RUNNING"即可。

在配置ogg监控时,请熟悉使用zabbix,熟悉相关工作原理,避免在配置的时候导致报错!

1、在ogg服务器上安装zabbix-agent

安装zabbix-agent建议直接使用官方rpm包方式(或国内镜像的rpm包)

rpm -Uvh https://repo.zabbix.com/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm

yum install zabbix-agent

2、修改zabbix-agent配置文件

zabbix-agent默认的配置文件在/etc/zabbix/zabbix_agentd.conf

我这里只修改两处,其他配置结合自身使用情况进行调整,当然你也可以只修改两处,其他配置项不修改。

添加以下一行内容,表示允许通过zabbix执行远程命令(因为我这里要通过zabbix远程启动ogg服务,所以开启,如你不需要则无需配置)

EnableRemoteCommands=1

配置zabbix-server地址,其中10.10.10.10表示你当前zabbix-server的地址

Server=10.10.10.10

3、配置zabbix用户权限

visudo

先给zabbix用户设置免密授权,因为我这里ggsci是通过oracle用户来执行的,如果不授权zabbix用户,则无法调用oracle用户来执行ggsci

zabbix ALL=(ALL) NOPASSWD:ALL


4、自定义zabbix键值

cd /etc/zabbix/zabbix_agentd.d

新建一个自定的键,我这里定义为monitor.ogg,其中monitor.ogg名字可自行更改,后面的语句就是一个shell脚本,表示通过oracle用户来执行ggsci的info all命令,然后通过grep查看是否存在ABEND或STOPPED状态,注意:我这里监控的Group是EXTKF,你的不一定是这个名字,按需进行更改。

vi userparameter_ogg.conf

UserParameter=monitor.ogg,sudo su - oracle -c 'echo "info all" | /u01/ogg/ggsci | grep "EXTKF" | egrep "ABEND|STOPPED" | wc -l'

5、启动zabbix-agent

systemctl enable zabbix-agent

systemctl start zabbix-agent

此时zabbix-agent就配置好了,如果开启了防火墙,请注意放行相关端口

6、配置zabbix-server,创建监控模板

在zabbix-server仪表盘中,创建ogg的监控模板,当然你也可以直接创建监控项而不配置模板

注意:此处键值monitor.ogg与之前在agent中配置的键一定要一致


配置触发器

{monitor.ogg:monitor.ogg.last()}<>0表示,执行sudo su - oracle -c 'echo "info all" | /u01/ogg/ggsci | grep "EXTKF" | egrep "ABEND|STOPPED" | wc -l'结果不等于0,则触发警告


图形配置


至此ogg监控就配置完成了,一旦ogg服务状态是STOPPED或ABEND时,则触发报警。

如果你只需要一个报警监控,那么后面的内容就无需看了,我这里只是以ogg作为例子,提供一个自定义键值的思路,如果你理解其中的原理,那么便可举一反三!!!

钉钉报警设置请参考:https://blog.whsir.com/post-6090.html

7、自动启动ogg服务

在zabbix-server仪表盘中,配置→动作


告警操作

主题:故障{TRIGGER.STATUS},服务器:{HOSTNAME1}发生: {TRIGGER.NAME}故障!

消息:在消息首行添加关键词,此关键词和钉钉上的关键词需保持一致,可以使用中文名称

告警主机:{HOSTNAME1}

告警时间:{EVENT.DATE} {EVENT.TIME}

告警等级:{TRIGGER.SEVERITY}

告警信息: {TRIGGER.NAME}

告警项目:{TRIGGER.KEY1}

问题详情:{ITEM.NAME}:{ITEM.VALUE}

当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}

事件ID:{EVENT.ID}


恢复操作


恢复{TRIGGER.STATUS}, 服务器:{HOSTNAME1}: {TRIGGER.NAME}已恢复!

告警主机:{HOSTNAME1}

告警时间:{EVENT.DATE} {EVENT.TIME}

告警等级:{TRIGGER.SEVERITY}

告警信息: {TRIGGER.NAME}

告警项目:{TRIGGER.KEY1}

问题详情:{ITEM.NAME}:{ITEM.VALUE}

当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}

事件ID:{EVENT.ID}

目录
相关文章
|
26天前
|
监控 安全 Linux
在Linux中,zabbix如何监控脑裂?
在Linux中,zabbix如何监控脑裂?
|
3月前
|
监控 Linux 应用服务中间件
探索Linux中的`ps`命令:进程监控与分析的利器
探索Linux中的`ps`命令:进程监控与分析的利器
|
15天前
|
监控 关系型数据库 MySQL
zabbix agent集成percona监控MySQL的插件实战案例
这篇文章是关于如何使用Percona监控插件集成Zabbix agent来监控MySQL的实战案例。
27 2
zabbix agent集成percona监控MySQL的插件实战案例
|
2天前
|
监控 Ubuntu API
Python脚本监控Ubuntu系统进程内存的实现方式
通过这种方法,我们可以很容易地监控Ubuntu系统中进程的内存使用情况,对于性能分析和资源管理具有很大的帮助。这只是 `psutil`库功能的冰山一角,`psutil`还能够提供更多关于系统和进程的详细信息,强烈推荐进一步探索这个强大的库。
9 1
|
20天前
|
数据采集 监控 API
如何监控一个程序的运行情况,然后视情况将进程杀死并重启
这篇文章介绍了如何使用Python的psutil和subprocess库监控程序运行情况,并在程序异常时自动重启,包括多进程通信和使用日志文件进行断点重续的方法。
|
4月前
|
缓存 监控 调度
第六十一章 使用 ^PERFSAMPLE 监控进程 - 分析维度
第六十一章 使用 ^PERFSAMPLE 监控进程 - 分析维度
35 0
|
1月前
|
SQL 监控 分布式数据库
【解锁数据库监控的神秘力量!】OceanBase社区版与Zabbix的完美邂逅 —— 揭秘分布式数据库监控的终极奥秘!
【8月更文挑战第7天】随着OceanBase社区版的普及,企业广泛采用这一高性能、高可用的分布式数据库。为保障系统稳定,使用成熟的Zabbix监控工具对其进行全方位监控至关重要。本文通过实例介绍如何在Zabbix中配置监控OceanBase的方法,包括创建监控模板、添加监控项(如TPS)、设置触发器及图形展示,并提供示例脚本帮助快速上手。通过这些步骤,可以有效监控OceanBase状态,确保业务连续性。
55 0
|
3月前
|
监控 数据库 Docker
Zabbix监控神通数据库教程
**摘要:** 本文介绍了如何使用Docker安装和配置神舟通用数据库,并利用Zabbix进行监控。首先,通过Docker安装数据库镜像,启动容器并映射端口。接着,使用默认凭证连接数据库并验证安装。然后,将数据库的Python模块和库文件复制到主机,并安装Python3.5及相应模块,创建外部检查脚本以实现Zabbix的监控功能。示例展示了查询数据库版本的监控指标配置。最后,提到了监控结果的界面展示,并邀请读者探索更多Zabbix监控技巧。
50 0
Zabbix监控神通数据库教程
|
2月前
|
监控 关系型数据库 应用服务中间件
Linux zabbix监控 软件的安装
Linux zabbix监控 软件的安装
|
4月前
|
监控
第六十章 使用 ^PERFSAMPLE 监控进程 - 预定义分析示例
第六十章 使用 ^PERFSAMPLE 监控进程 - 预定义分析示例
27 0

推荐镜像

更多