10分钟帮你搞定Zabbix监控平台告警推送到钉钉群

简介: 10分钟帮你搞定Zabbix监控平台告警推送到钉钉群

10分钟搞定Zabbix监控平台告警推送到钉钉群


Zabbix的安装与部署可以参考之前的文章

以及钉钉机器人的创建不再详细描述


1、下载并安装PrometheusAlert


https://github.com/feiyu563/PrometheusAlert
mkdir /opt/PrometheusAlert
unzip PrometheusAlertLinux.zip -d /opt/PrometheusAlert/
cd /opt/PrometheusAlert/
cp zabbix /usr/lib/zabbix/alertscripts/zabbixclient
chmod 755 /usr/lib/zabbix/alertscripts/zabbixclient 
chown zabbix:zabbix /usr/lib/zabbix/alertscripts/zabbixclient
/usr/lib/zabbix/alertscripts/zabbixclient -h

640.png

设置PrometheusAlert开机自启动


vi /etc/rc.local
加入如下一行
nohup /opt/PrometheusAlert/PrometheusAlert &
chmod +x /etc/rc.d/rc.local
然后手动启动PrometheusAlert
nohup /opt/PrometheusAlert/PrometheusAlert &
firewall-cmd --permanent --zone=public --add-port=8080/tcp
firewall-cmd --reload


640.png


2、修改触发器显示选项


用表情符号显示,是为了让告警更直观

640.png



3、Zabbix上创建告警媒介类型


类型为脚本


相关参数参考PrometheusAlert官方文档进行填写


640.png

640.png


创建后可以先测试一下机器人

640.png


4、添加用户


例如yuanfan

640.png


告警媒介选上一步创建的PrometheusAlert类型


640.png


5、配置触发器动作中消息模板


  • 先配置触发器动作


640.png

640.png

  • 操作——操作细节——消息模板如下


## [Zabbix平台告警信息](https://zabbix.walkingcloud.cn)
--------------------------------------------------------
##### <font color="#FF0000">{TRIGGER.NAME} </font>
--------------------------------------------------------
##### <font color="#FF0000">【故障发生时间】</font>:{EVENT.DATE} {EVENT.TIME}
##### <font color="#FF0000">【告警级别】</font>:{TRIGGER.SEVERITY}
##### <font color="#FF0000">【故障前状态】</font>:{ITEM.LASTVALUE}
##### <font color="#FF0000">【故障事件ID】</font>:{EVENT.ID}
##### <font color="#FF0000">【故障主机IP】</font>:{HOST.IP}
##### <font color="#FF0000">【故障主机名】</font>:{HOST.NAME}
##### <font color="#FF0000">【故障时长】</font>:{EVENT.AGE}
##### <font color="#FF0000">【故障是否确认】</font>:{EVENT.ACK.STATUS}
--------------------------------------------------------
#####  <font color="#F56C6C">事件状态:{EVENT.STATUS}</font>


640.png



  • 恢复操作——操作细节——消息模板如下


## [Zabbix监控平台告警信息](https://zabbix.walkingcloud.cn)
--------------------------------------------------------
##### <font color="#67C23A">{TRIGGER.NAME} 已经恢复 </font>✅
--------------------------------------------------------
##### <font color="#02b340">【故障恢复时间】</font>:{EVENT.RECOVERY.DATE} {EVENT.RECOVERY.TIME}
##### <font color="#02b340">【告警级别】</font>:{TRIGGER.SEVERITY}
##### <font color="#02b340">【故障前状态】</font>:{ITEM.LASTVALUE}
##### <font color="#02b340">【故障主机IP】</font>:{HOST.IP}
##### <font color="#02b340">【故障主机名】</font>:{HOST.NAME}
##### <font color="#02b340">【故障时长】</font>:{EVENT.AGE}
##### <font color="#02b340">【故障是否确认】</font>:{EVENT.ACK.STATUS}
--------------------------------------------------------
#####  <font color="#F56C6C">事件状态:{EVENT.STATUS}</font>


640.png

  • 更新操作——操作细节——消息模板如下


## [Zabbix监控平台告警信息](https://zabbix.walkingcloud.cn)
--------------------------------------------------------
##### <font color="#67C23A"> {USER.FULLNAME} 已经确认故障原因 </font>
--------------------------------------------------------
##### <font color="#FF0000">【故障确认时间】</font>:{ACK.DATE} {ACK.TIME}
##### <font color="#FF0000">【告警级别】</font>:{TRIGGER.SEVERITY} 
##### <font color="#FF0000">【故障前状态】</font>:{ITEM.LASTVALUE}
##### <font color="#FF0000">【故障主机IP】</font>:{HOST.IP}
##### <font color="#FF0000">【故障主机名】</font>:{HOST.NAME}
##### <font color="#FF0000">【故障时长】</font>:{EVENT.AGE}
##### <font color="#FF0000">【故障原因】</font>:{ACK.MESSAGE}
##### <font color="#FF0000">【故障是否确认】</font>:{EVENT.ACK.STATUS}✅
--------------------------------------------------------
#####  <font color="#F56C6C">事件状态:{EVENT.STATUS}</font>


640.png


6、触发告警及效果展示


例如192.168.31.127上/boot分区写满测试


dd if=/dev/zero of=/boot/test.iso count=1 bs=1024M
df -PTh

640.png

640.png


640.png


web界面上确认故障时的效果

640.png

640.png

640.png


(图片可点击放大查看)


告警恢复时钉钉告警效果


640.png

相关实践学习
容器服务Serverless版ACK Serverless 快速入门:在线魔方应用部署和监控
通过本实验,您将了解到容器服务Serverless版ACK Serverless 的基本产品能力,即可以实现快速部署一个在线魔方应用,并借助阿里云容器服务成熟的产品生态,实现在线应用的企业级监控,提升应用稳定性。
云原生实践公开课
课程大纲 开篇:如何学习并实践云原生技术 基础篇: 5 步上手 Kubernetes 进阶篇:生产环境下的 K8s 实践 相关的阿里云产品:容器服务&nbsp;ACK 容器服务&nbsp;Kubernetes&nbsp;版(简称&nbsp;ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情:&nbsp;https://www.aliyun.com/product/kubernetes
相关文章
|
2月前
|
缓存
ecs-centos分区空间大于70时发送钉钉告警并清理
当分区空间大于70时,开始清理并发送钉钉告警。
32 1
|
3月前
|
机器人 关系型数据库 MySQL
shell脚本实现文件自动清理并推送钉钉机器人告警
shell脚本实现文件自动清理并推送钉钉机器人告警
39 0
|
3月前
|
运维 监控 安全
调用钉钉机器人API接口将堡垒机安全运维告警单发给运维人员
调用钉钉机器人API接口将堡垒机安全运维告警单发给运维人员
79 0
|
3月前
|
存储 SQL 监控
修改Zabbix源码实现监控数据双写,满足业务需求!
虽然对接Elasticsearch后有诸多好处,但是它不往数据库写历史数据了,同时还不再计算趋势数据了。有这么一个场景...
修改Zabbix源码实现监控数据双写,满足业务需求!
|
4月前
|
数据采集 监控 数据库
OceanBase社区版可以通过Zabbix监控
OceanBase社区版可以通过Zabbix监控
74 4
|
29天前
|
数据采集 监控 数据库
请问OceanBase社区版能否通过zabbix监控,然后将报错信息展现到grafana?
【2月更文挑战第25天】请问OceanBase社区版能否通过zabbix监控,然后将报错信息展现到grafana?
25 2
|
2月前
|
弹性计算 监控 Python
有趣的python脚本【监控公司出口ip变化并发送至钉钉群】
因为公司出口ip是动态的(拨号方式),重新拨号后就会变化。因此及时发现ip变化显得尤为重要(比如及时ecs安全组中的ip),另外可把py脚本打包成exe并加到办公电脑的计划任务里。
29 2
有趣的python脚本【监控公司出口ip变化并发送至钉钉群】
|
2月前
|
监控 Cloud Native 关系型数据库
使用 Grafana 统一监控展示 - 对接 Zabbix
使用 Grafana 统一监控展示 - 对接 Zabbix
|
3月前
|
安全 机器人 Shell
shell脚本实现Linux磁盘空间超过阈值自动钉钉机器人告警
shell脚本实现Linux磁盘空间超过阈值自动钉钉机器人告警
44 0
|
3月前
|
运维 监控 安全
【优化篇】调用钉钉机器人API接口将堡垒机安全运维告警单发给运维人员
【优化篇】调用钉钉机器人API接口将堡垒机安全运维告警单发给运维人员
68 0

推荐镜像

更多