Zabbix通过SNMP监控HP服务器硬件信息

简介:

   关于Zabbix监控服务器硬的件信息,Zabbix官方网站没有提到这方面的监控思路和方法。之前我写的博文中写过关于HP服务器硬件监控的文章,大致的思路是借助HP管理工具通过脚本的方式取出硬件的信息,然后以trapper的方式通过进行监控,得到好多博友的支持,在此特别感谢。
    通过脚本的方式监控服务器硬件信息,有以下三个缺点:

    1) 通过agent的方式监控会超时,取不到值。

    2)通过trapper的方式需要每台机器添加crontab,部署起来麻烦。

    3)脚本通用性差,只适合Linux机器。

    4)G8的服务器执行管理命令非常慢。
    由于通过脚本监控硬件有以上几个缺点,因此后来研究了HP代理。通过HP代理和SNMP监控HP服务器的硬件,需要安装snmp服务和HP代理工具。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
#需要安装的软件包
yum  install  -y net-snmp net-snmp-util
hpacucli-9.40-12.0.x86_64.rpm
hp-snmp-agents-9.40-2506.37.rhel6.x86_64.rpm
hp-health-9.40-1602.44.rhel6.x86_64.rpm
#SNMP安装完成后需要修改snmpd.conf的配置文件。
dlmod cmaX  /usr/lib/libcmaX .so
rwcommunity sfzhang 127.0.0.1   #可读可写
rocommunity public 127.0.0.1  #只读
syscontact Root <root@localhost>
syslocation Shanghai China
view all    included  .1                               80
access  notConfigGroup  ""       any       noauth    exact  all none none
#启动相关的服务
/etc/init .d /hp-snmp-agents  start
/etc/init .d /hp-health  start
/etc/init .d /snmpd  start

     然后通过snmpwalk命令测试是否可以获取数据,下面获取的是HP服务器各部件的实际温度值。

wKioL1SbZLrwdTWjAAY80UDQQ0c404.jpg

    创建监控模板,通过Zabbix Low-level discovery 可以自动创建监控项,触发器和图像。Zabbix官方文档中LLD支持以下三种监控自动发现:

    1)文件系统自动发现

    2)服务器网卡的自动发现

    3)SNMP OID的自动发现

    下面通过第三种方法来监控HP服务器硬件信息,以SNMP监控HP服务器阵列卡为例子来说明一下实现原理。
    1)首先创建监控模板和Applications。

wKioL1Saerjz9jqtAAGkFPqDrnw672.jpg

    2)点击模板的discovery->Create discovery rule。

wKiom1SaaUXgB-5EAAKQxrZ5JrE446.jpg
    3)创建监控项目Create item prototype。HP代理中的MIB信息没有被解析成具体的设备名称,因此Name中的#SNMPVALUE就是为了区分多个设备名称,如HardDisk_0_status,HardDisk_1_status表示第一个硬盘和第二个硬盘的状态。wKiom1SaaqTQmTuOAANbzs8tN5w478.jpg

    4)创建触发器Create trigger prototype。HP服务器硬盘,阵列卡,逻辑磁盘等的状态正常返回值都是2,如果不是2,说明有问题,触发报警。

wKiom1Saa-LCcwZKAAGzdWK8zRQ640.jpg

    5)用同样的方法可以监控HP硬盘的状态,逻辑磁盘的状态,风扇的状态,HP各部件的温度等。

wKiom1SaeCXCXaUZAARbgbCNcCc979.jpg

    6)下面通过DDL自动发现服务器的物理硬盘的监控项和触发器,有多少个硬盘就会有多少个监控项和触发器。

wKioL1SagKXzRnLZAACxAX4vCeY719.jpg

    7)Link模板到监控主机上面,当主机整列卡有问题的时候会报警。

wKiom1SacXLg7TDfAACSED81e1c403.jpg

    总结:
       1)SNMP协议是通用的,该模板不仅可以监控HP Linux机器,还可以监控HP Windows机器。
       2)HP代理常用的OID,其它的还很多,大家去慢慢研究。
         HP阵列卡状态:1.3.6.1.4.1.232.3.2.2.1.1.6
         物理磁盘状态:1.3.6.1.4.1.232.3.2.5.1.1.6
         逻辑磁盘状态:1.3.6.1.4.1.232.3.2.3.1.1.4
         HP部件温度:1.3.6.1.4.1.232.6.2.6.8.1.4

       3)Zabbix不仅对各种操作系统,应用程序监控很好,而且对服务器硬件的监控也非常棒。

       4)hp-snmp-agents cmaperfd进程的CPU经常显示100%,可以用下面的方法禁用,编辑

/opt/hp/hp-snmp-agents/cma.conf配置文件,在最下面添加exclude cmaperfd,然后重启代理服务即可

/etc/init.d/hp-snmp-agents restart










本文转自 sfzhang 51CTO博客,原文链接:http://blog.51cto.com/sfzhang88/1595211,如需转载请自行联系原作者

目录
相关文章
|
5月前
|
弹性计算 监控 网络协议
ecs资源监控操作
监控阿里云ECS服务器资源分为7步:登录阿里云控制台,进入ECS管理界面,选择要监控的实例,查看基础监控数据,通过云监控服务获取详细图表、配置报警规则,可选安装云监控插件获取OS级数据,最后定期审查优化资源配置。通过这些步骤,确保系统稳定运行并及时处理问题。如需帮助,参考官方文档或联系阿里云支持。
101 3
|
5月前
|
Arthas 弹性计算 运维
阿里云ECS监控服务
阿里云ECS监控服务
473 2
|
5月前
|
弹性计算 监控 数据可视化
ecs自定义监控
ecs自定义监控
55 1
|
5月前
|
弹性计算 运维 监控
ECS资源监控
ECS资源监控涉及CPU、内存、磁盘I/O、网络流量、系统负载和进程的关键指标,通过云服务商控制台、监控服务、API与SDK、运维工具进行实时监控和告警设置。支持历史数据查询、事件监控,以及使用Windows资源监视器和Linux系统工具进行操作系统层面监控。全面监控确保ECS实例稳定运行、资源有效利用和问题及时处理。如需特定云服务商的指导,请询问。
122 3
|
5月前
|
存储 监控 Java
【深度挖掘Java性能调优】「底层技术原理体系」深入探索Java服务器性能监控Metrics框架的实现原理分析(Counter篇)
【深度挖掘Java性能调优】「底层技术原理体系」深入探索Java服务器性能监控Metrics框架的实现原理分析(Counter篇)
131 0
|
5月前
|
监控 算法 Java
【深度挖掘Java性能调优】「底层技术原理体系」深入探索Java服务器性能监控Metrics框架的实现原理分析(Gauge和Histogram篇)
【深度挖掘Java性能调优】「底层技术原理体系」深入探索Java服务器性能监控Metrics框架的实现原理分析(Gauge和Histogram篇)
80 0
|
28天前
|
存储 弹性计算 运维
自动化监控和响应ECS系统事件
阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。
|
1月前
|
存储 监控 Linux
监控Linux服务器
详细介绍了如何监控Linux服务器,包括监控CPU、内存、磁盘存储和带宽的使用情况,以及使用各种系统监控工具如vmstat、iostat、sar、top和dstat来分析系统性能,并推荐了一些开源监控系统。
33 0
监控Linux服务器
|
2月前
|
Prometheus 监控 Cloud Native
Web服务器的日志分析与监控
【8月更文第28天】Web服务器日志提供了关于服务器活动的重要信息,包括访问记录、错误报告以及性能数据。有效地分析这些日志可以帮助我们了解用户行为、诊断问题、优化网站性能,并确保服务的高可用性。本文将介绍如何使用日志分析和实时监控工具来监测Web服务器的状态和性能指标,并提供具体的代码示例。
170 0
|
2月前
|
监控 Linux 测试技术

推荐镜像

更多
下一篇
无影云桌面