报警监控平台扩展功能url回调的设计及应用[python语言]

简介:

前言:

       这个国内也有一些第三方的厂商在用,比如dnspod的url回调和监控宝的url回调!

       有人开源了一个脚本,监控宝的url回调,可以联合dnspod的api接口。可以处理当ip-A的web死掉的时候,dns记录切换到ip-B上。 当然这只是个小应用罢了,但不能不说,这个想法确实不错。 我这边也实现了类似方式。

       所谓的URL回调功能,您可以让告警通知发送到您指定的URL,使你能更加灵活处理告警消息。 打个比方,有个服务器的nginx进程死掉了,这个时候nagios监控到了这个情况,然后调用了我这边的接口,我这边接到的post数据,不仅发邮件,而且会根据注册事件的情况,进行处理。 如果注册了一个远程nginx重启的事项,我这边就远程paramiko或者是saltstack过去重启该进程 !!!


wKiom1PM0E7xhhDhAALPeslTZ0s786.jpg


怎么个灵活法:

        每个业务部门其实都想自己统计error情况,但是监控平台一般是在基础监控部门手里掌控者,又不太方便做部署,这个时候,url回调是个好方法。我会把每次告警的信息不仅推到你的mail和手机上,而且会给你的url地址做webhook。你服务端接受认证后的url地址后,会有相应的措施,比如调用saltsatck来进行处理特定的主机,比如插入到库里面,自己做报表统计,根据来着的信息做自动化处理。


关于触发式的处理:

只是个人的想法而已 ~

       在监控系统的体系下,比如有nagios,zabbix专业监控系统。 咱们还是用例子说话:  监控mysql从是否高延迟,严重不同步问题的时候,咱们一般是在nagios里加载监控获取判断从延迟的脚本,以及在某个节点上做处理脚本【脚本的内容是 while get 每个mysql从情况,高延迟的那台在负载群里面踢出去】,这样算的话是两个脚本了。

      如果利用url回调,可以用处理脚本,这个脚本也只是当触发url回调的时候,才执行才处理的。避免了处理脚本没完没了的去判断和获取状态。要是监控一些统计压力大的服务,那就有点悲催了。

     当然这样也会有些问题的,比如web死掉的话,他无法接受url回调,另一方面 开发部也不想调用系统层面的外部命令,毕竟责任是个问题。



下面是我写的url回调的demo,等有机会上线供大神们测试下。


第一版的时候,没有定义post的方式,以及回调结果的查看。


013908564.jpg

第二版做了,get和post的方式,返回结果的验证。

014152514.jpg


下面是平台的demo ~ 我想说的是,现在好多公司的告警信息都没有统计,随意的调用smtp发邮件,而不知道发送成功了没有,每个月发送了几次,发送都是啥内容。当然这些东西在nagios zabbix也大体可以看到,但是个人觉得还是综合到一个管理系统下,管理系统更加直观。


也有想这么搞的朋友直接提问题就行,我会第一时间给大家解答~


框架:

nginx  tornado  jquery  



002247107.jpg



002312670.jpg



此文接上文: http://rfyiamcool.blog.51cto.com/1030776/1332160


有后文,会补上的~


 本文转自 rfyiamcool 51CTO博客,原文链接:http://blog.51cto.com/rfyiamcool/1340937,如需转载请自行联系原作者






相关文章
|
4月前
|
存储 监控 算法
监控电脑屏幕的帧数据检索 Python 语言算法
针对监控电脑屏幕场景,本文提出基于哈希表的帧数据高效检索方案。利用时间戳作键,实现O(1)级查询与去重,结合链式地址法支持多条件检索,并通过Python实现插入、查询、删除操作。测试表明,相较传统列表,检索速度提升80%以上,存储减少15%,具备高实时性与可扩展性,适用于大规模屏幕监控系统。
172 5
|
7月前
|
存储 运维 监控
基于跳表数据结构的局域网上网记录监控时序查询优化算法研究与 Python 实现
本文探讨跳表(Skip List)在局域网上网记录监控中的应用,分析其在快速范围查询、去重与异常检测中的优势,并提供 Python 实现示例,为高效处理海量时序数据提供参考。
143 0
|
监控 算法 安全
深度洞察内网监控电脑:基于Python的流量分析算法
在当今数字化环境中,内网监控电脑作为“守城卫士”,通过流量分析算法确保内网安全、稳定运行。基于Python的流量分析算法,利用`scapy`等工具捕获和解析数据包,提取关键信息,区分正常与异常流量。结合机器学习和可视化技术,进一步提升内网监控的精准性和效率,助力企业防范潜在威胁,保障业务顺畅。本文深入探讨了Python在内网监控中的应用,展示了其实战代码及未来发展方向。
|
7月前
|
数据采集 存储 监控
Python爬虫自动化:定时监控快手热门话题
Python爬虫自动化:定时监控快手热门话题
|
11月前
|
监控 算法 安全
基于 Python 广度优先搜索算法的监控局域网电脑研究
随着局域网规模扩大,企业对高效监控计算机的需求增加。广度优先搜索(BFS)算法凭借其层次化遍历特性,在Python中可用于实现局域网内的计算机设备信息收集、网络连接状态监测及安全漏洞扫描,确保网络安全与稳定运行。通过合理选择数据结构与算法,BFS显著提升了监控效能,助力企业实现智能化的网络管理。
218 7
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
242 20
|
监控 网络协议 数据库连接
Python3 监控端口:使用 socket 库
Python3 监控端口:使用 socket 库
193 0
|
监控 网络协议 数据库连接
Python3 监控端口:使用 socket 库
Python3 监控端口:使用 socket 库
314 1
|
机器学习/深度学习 监控 TensorFlow
使用Python实现深度学习模型:智能宠物监控与管理
使用Python实现深度学习模型:智能宠物监控与管理
546 0

推荐镜像

更多