开发者社区 问答 正文

ECS实例异常排查



在负载均衡服务中开启健康检查功能后,当后端某个ECS健康检查出现问题时,会将请求转发到其他健康检查正常的ECS上。当该ECS恢复正常运行时,负载均衡会将其自动恢复到对外或对内的服务中。
针对七层负载均衡服务,当监听获取到健康检查异常的信息时,可以从以下方面对ECS实例进行健康排查:


  • 确保您能够直接通过ECS访问到您的应用服务。

  • 确保后端服务器开启了相应的端口,该端口必须与您在负载均衡监听配置中配置的后端端口保持一致。

  • 检查后端ECS内部是否开启了防火墙或其他的安全类防护软件,这类软件很容易将负载均衡服务的本地 IP地址屏蔽掉,导致负载均衡服务无法跟后端服务器进行通讯。

  • 检查负载均衡健康检查参数设置是否正确,建议参照缺省提供的健康检查参数进行设置。

  • 建议使用静态页面来进行健康检查,如果您用于健康检查的页面在后端ECS应用服务器上并不是缺省首页,需要您在健康检查配置中指定该页面的URL。健康检查指定的检测文件,建议是html形式的简单页面,只用于检查返回结果,不建议用php等动态脚本语言。

  • 检查后端ECS资源是否有较高负载,降低了ECS对外提供服务的响应速度。

另外,由于七层负载均衡服务跟后端ECS之间通过内网通讯,因此需要ECS监听内网或者全网端口。您可使用以下方法进行检查:

  1. 检查监听功能是否正常。
    假设负载均衡前端端口是80,ECS 后端端口也是80,ECS 内网IP是 10.11.192.1。在服务器上运行以下命令,如果能看到10.11.192.1:80的监听信息,或者0.0.0.0:80的监听信息,说明这部分端口的监听正常。
    • Windows 服务器上运行:netstat -ano | findstr :80
    • Linux 服务器上运行:netstat -anp | grep :80

  • 检查服务器内网防火墙是否放行80端口,可以暂时关闭防火墙进行测试。输入以下命令关闭防火墙。
    • Windows:firewall.cpl
    • Linux:/etc/init.d/iptables stop

  • 检查后端端口是否正常。

    • 对于四层负载均衡,使用telnet测试有响应即为正常。本例中使用telnet 10.11.192.1 80来测试。

    • 对于七层负载均衡,HTTP状态码需要是200等代表正常的状态码,检验方法如下:Windows:直接在ECS上的浏览器内输入内网IP测试是否正常,本例是:http://10.11.192.1
    • Linux:使用curl -I命令查看状态是否为 HTTP/1.1 200 OK,本例是:curl -I 10.11.192.1。
  • 展开
    收起
    行者武松 2017-10-18 17:18:43 2363 分享 版权
    阿里云 AI 助理回答

    您已经详细概述了在阿里云负载均衡服务中,针对七层负载均衡(HTTP/HTTPS协议)后端ECS实例健康检查异常时的排查步骤。这里补充一些基于阿里云产品的具体操作和建议,帮助您更有效地解决问题:

    1. 使用云监控辅助诊断:阿里云提供了云监控服务,您可以利用该服务为ECS实例配置性能和访问监控项,如CPU使用率、内存使用率、网络流量等,以及自定义监控指标。当ECS资源负载较高时,云监控可以及时发出警报,帮助您快速定位问题。

    2. 查看负载均衡健康检查日志:在阿里云负载均衡控制台,您可以查看健康检查的日志详情,这些日志会记录每次健康检查的结果,包括响应时间、返回码等信息,这对于分析为何健康检查失败非常有帮助。

    3. 自动恢复配置:确保您的负载均衡监听规则中启用了“健康检查”,并且设置了合理的“不健康阈值”和“健康阈值”。这样,一旦ECS实例恢复正常,负载均衡会根据健康检查结果自动将其重新加入到服务中,无需手动干预。

    4. 安全组与网络ACL检查:除了ECS自身的防火墙设置,还需检查关联的安全组规则和网络ACL(访问控制列表),确认它们没有阻止来自负载均衡IP的流量。确保入方向规则允许负载均衡的健康检查请求通过。

    5. SLB健康检查高级功能:如果应用有特殊需求,可以利用阿里云负载均衡的高级健康检查功能,比如自定义检查路径、超时时间、间隔时间等,以更好地适配应用的实际情况。

    6. 利用ECS实例的系统事件:在ECS实例的管理界面,查看是否有系统事件提示,比如重启、维护、网络配置变更等,这些都可能是影响ECS健康状态的因素。

    7. 联系技术支持:如果以上步骤均未能解决问题,建议直接联系阿里云的技术支持团队。他们可以提供更深入的故障排查和解决方案,甚至协助查看后台日志,以便更快地解决您的问题。

    通过上述方法,结合阿里云平台提供的工具和服务,您可以高效地诊断并解决负载均衡后端ECS实例的健康检查问题,保障业务的稳定运行。

    有帮助
    无帮助
    AI 助理回答生成答案可能存在不准确,仅供参考
    0 条回答
    写回答
    取消 提交回答