负载均衡CLB(下)-常见问题与解决思路
一、 访问失败
访问失败1
• 问题表现:公网所有客户端ping or telnet均不通;
• 可能的原因:CLB IP被清洗或黑洞;
• 处理方法:
清洗:解除清洗;
黑洞:迁移业务,等待黑洞结束。
访问失败2
• 问题表现:
可以ping通CLB IP;
客户端报错:Connection reset by peer或Connection refused或502状态码;
访问日志,upstream addr显示为非IP地址;
客户端抓包:SYN发出后收到了RST;
• 可能的原因:CLB全部后端服务器健康检查失败;
• 处理方法:后端ECS上排查健康检查失败的原因。
访问失败3
• 问题表现:
ping or telnet 偶发不通;
只有部分地域或部分运营商存在问题;
• 可能的原因:公网链路质量问题;
• 处理方法:获取MTR结果后请终端用户向当地运营商报障。
访问失败4
• 问题表现:
可以ping通CLB IP;
是四层监听;
访问失败概率为(n-1)/n,n为后端ECS服务器台数;
客户端抓包SYN发出后没有收到SYN ACK;
• 可能的原因:服务器作为后端ECS的同时也作为访问CLB的客户端;
• 处理方法:
更改为7层监听;
更改架构。
二、 健康检查失败
1. 四/七层监听健康检查失败原因
• 屏蔽了健康检查源IP;
• 后端ECS端口是否监听;
• 后端ECS监听队列是否溢出;
• 安全软件是否进行了拦截。
2. 七层监听健康检查失败原因
• 除了上述可能的问题,七层监听默认使用HEAD请求,需要查看后端Web Server是否允许HEAD请求;
3. 错误信息示例
• TCP监听:TCP connect time out/TCP connect error;
• UDP监听:UDP connect error;
• HTTP(s)监听:check protocol error/check time out。
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(下)-常见问题与解决思路(2) https://developer.aliyun.com/article/1230680?groupCode=supportservice