CactiEZ10.1 不出图诡异故障排查

简介:

    在公司部署了一套CactiEZ用于实时监控多个网络设备的工作状态,设置了阈值和宕机短信报警,异常发生时系统会自动给自己的手机发送短信提醒,但有一台SSG按照正常方式添加监控主机后,在图形当中始终无法出图、无数据显示。然而另外一台相同配置、相同型号的设备却能够正常出图。后来在网友“摩子”的协助下解决了这个问题,做一个记录以备以后查阅

故障主机截图:

clip_image001

Realtime插件实时数据:

clip_image002

处理过程:

1.检查cacti日志,发现该监控主机在获取数据时一直处于超时状态

clip_image004

依据日志提示修改被监控主机SNMP Timeout选项为较大数值后,故障依旧

clip_image006

2.网友提示若CactiEZ是安装在虚拟机上,虚机时间异常也可能会造成这个问题。检测虚机时间参数并未发现异常

3.检测是否获取到数据,使用snmpwalk –v 1 –c XXXX 10.108.41.1可以获取数据

clip_image008

4.检测是否生成RRD文件

clip_image010

clip_image011

5.后来网友提醒检测下主机配置参数中的snmp版本,我默认使用的是V1,依据他的建议调整为V2并修改被监控设备的设置.

clip_image012

6. 重新设置过后故障排除

clip_image014

   虽然最后故障顺利排除但却没能找出问题产生的原因,自己推测是不是不同版本的SNMP agent造成的BUG,但无法找到相关的资料佐证。如果有朋友知道问题产生的原因,还望不吝赐教


本文转自 yab109 51CTO博客,原文链接:http://blog.51cto.com/active/1153977,如需转载请自行联系原作者

相关文章
|
6月前
|
监控 安全
关于开机时瑞星实时监控启动拖后的猜想
关于开机时瑞星实时监控启动拖后的猜想
|
9月前
|
Web App开发 Linux 数据处理
深入理解Linux命令pkill:功能、原理与最佳实践
**pkill命令详解:在Linux中,pkill用于按进程名终止进程,简化了通过PID管理进程的步骤。它利用正则匹配支持模糊查找,可发送不同信号如SIGTERM或SIGKILL。常用示例包括:终止指定进程名、按用户或终端终止进程,以及使用-f进行模糊匹配。注意谨慎使用,避免误杀重要进程,先发送SIGTERM,无效再用SIGKILL。了解其权限需求和配合ps命令使用,能提升系统管理效率。**
|
运维 安全 Linux
测试理论基础--Linux故障排查思路及常用命令(上)
Linux系统与Windows系统,应急常见的问题解决方法与思路
261 0
测试理论基础--Linux故障排查思路及常用命令(上)
|
运维 监控 网络协议
测试理论基础--Linux故障排查思路及常用命令(下)
Linux系统与Windows系统,应急常见的问题解决方法与思路
261 0
测试理论基础--Linux故障排查思路及常用命令(下)
|
Java Linux
Linux常用命令 - ps命令详解(重点)
Linux常用命令 - ps命令详解(重点)
289 0
Linux常用命令 - ps命令详解(重点)
|
Arthas SQL 监控
重启大法好!线上常见问题排查手册
本文从线上实际问题和故障的排查出发,分享如何快速定位和恢复线上常见问题和故障,总结了很多实操的方法,希望对大家有用。
10357 3
重启大法好!线上常见问题排查手册
|
移动开发 网络协议 应用服务中间件