细节决定成败2: 链路负载均衡遇到IPS

本文涉及的产品
传统型负载均衡 CLB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
应用型负载均衡 ALB,每月750个小时 15LCU
简介:

细节决定成败, 做技术的尤其如此。这里讲下另外一个遇到的真实案例:

我们采用了A10 AX系列部署在客户出口(电信+联通)作为链路负载均衡使用,采用双路冗余方式部署,如下图显示。

一次客户报障,内网用户访问个别网站时,会出现首页面可以打开,要求用户输入用户名和密码,但是然后页面无法显示的问题,如下显示:

排障过程

1) 确定目标网站无问题,其他客户可以正常访问

2) 确定从A10设备访问目标网站无问题

3) 检查是否NAT地址漂移问题:

出现用户输入用户名/密码后无响应的一个可能性是出口做NAT时,源IP客户发出的不同链接使用了不同的NAT地址,会有可能造成目标网站服务器认为连接不正常;

检查确认NAT使用同一地址,无问题

以后都无问题后,只能抓包分析:

4) 在客户端测试,A10 负载均衡设备上也抓包,分析,终于发现问题

负载均衡设备发现是客户端主动Reset

然而在客户端的抓包则显示服务器主动Reset

(注意:这2张图不是同一次测试的结果)

问题: 从客户端看,客户端并未主动发送Reset, A10设备又接收到从客户端发送的Reset报文,推测是在客户端和A10设备之间的其他设备(防火墙,IPS等安全设备)主动代理客户端Reset连接,导致客户端的连接失败。

基于这种情况,建议客户检查IPS设备,最终确认是IPS策略设置问题,对该网站的请求认为非法,主动替客户端发送Reset报文关闭连接,造成用户访问不正常。

此次监测的问题是,链路负载均衡设备作为出口设备负责全部流量的进出,在任何访问不正常的情况下都会被怀疑为故障的原因,只有认真的协调客户测试,对比结果才会发现问题的根源所在。

 

本文转自 virtualadc 51CTO博客,原文链接:http://blog.51cto.com/virtualadc/743698



相关实践学习
SLB负载均衡实践
本场景通过使用阿里云负载均衡 SLB 以及对负载均衡 SLB 后端服务器 ECS 的权重进行修改,快速解决服务器响应速度慢的问题
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
相关文章
|
负载均衡 算法 网络安全
|
负载均衡 算法 芯片
交换机链路聚合负载均衡算法原理 推荐
初衷: 在2011年初我学习交换机链路聚合技术的时候,心中一直有一个疑问: 交换机收到一个报文,到达聚合口的时候,是怎么选择成员口出去的呢? 是随机选的吗?还是按成员编号从小到大或从大到小轮循?如果选择源IP算法,是怎么实现不同源IP就走不同的端口的呢?那时网上也找不到介绍,这个疑问,直到2011年底做测试工程师时,才得到研发兄弟的回答,一直记在心里,总想找个时间发布到网上,让更多人知道,原来负载均衡算法其实是这么的简单! 链路聚合的主要作用是增加带宽,增加可靠性,防止二层环路。
1286 0
|
5月前
|
缓存 负载均衡 算法
解读 Nginx:构建高效反向代理和负载均衡的秘密
解读 Nginx:构建高效反向代理和负载均衡的秘密
116 2
|
4月前
|
负载均衡 算法 应用服务中间件
nginx自定义负载均衡及根据cpu运行自定义负载均衡
nginx自定义负载均衡及根据cpu运行自定义负载均衡
56 1
|
4月前
|
运维 负载均衡 算法
SLB与NGINX的异同是什么
SLB与NGINX的异同是什么
401 2