浅谈SCOM Agent的心跳响应机制-阿里云开发者社区

浅谈SCOM Agent的心跳响应机制

2017-11-16 1347

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

前段时间在某论坛中看到有网友问SCOM能否监测到服务器宕机，是怎么样一个工作过程？今天我将给大家讲述这方面的内容，在SCOM中监测服务器宕机主要涉及心跳信号这部分内容，SCOM服务器和Agent之间是有心跳信号通讯的。默认情况下，SCOM Agent每60秒会发送一次心跳信号给SCOM Server，如果SCOM服务器端超过60秒钟没有接收到Agent端发送过来的心跳信号，就会在SCOM控制台的监控窗口中产生一个“运行状况服务检测信号失败”的告警。SCOM服务器最多允许错过3次心跳信号，假如SCOM服务器超过3次心跳周期没有接收到Agent的心跳信号，服务器会使用PING的方式来尝试能否连接到Agent，如果不能PING通，这时候会在SCOM控制台的监控窗口产生“连接到计算机失败”的告警，产生这种告警的时候，如果能够排除网络的原因，通常情况下就是我们的服务器宕机或者其它原因造成服务器不可用了。下面在测试环境中模拟一下给大家看看整个工作过程：

首先来看看SCOM关于心跳检测信号的默认配置：