企业运维训练营之云上网络原理与实践课程 - 第二讲 负载均衡CLB(下)- 常见问题与解决思路

本文涉及的产品
性能测试 PTS,5000VUM额度
应用型负载均衡 ALB,每月750个小时 15LCU
传统型负载均衡 CLB,每月750个小时 15LCU
简介: 课程目标了解负载均衡CLB的产品功能了解负载均衡CLB的底层架构与相关技术掌握负载均衡CLB的最佳实践熟知负载均衡CLB的常见问题与解决思路

企业运维训练营之云上网络原理与实践课程

第二讲  负载均衡CLB(下)- 常见问题与解决思路

 

视频地址:

https://developer.aliyun.com/learning/course/991/detail/14970

 

 

1.  访问CLB失败

image.png

 

a.  问题表现:公网所有客户端ping or telnet 均不通。

可能的原因:SLB IP被清洗或黑洞。

处理方法:1、清洗:解除清洗 2、黑洞:迁移业务,等待黑洞结束。

 

b.  问题表现:

  • 可以pingSLB IP
  • 客户端报错:Connection reset by peerConnection refused502状态码;
  • 访问日志,upstream addr显示为非IP地址;
  • 客户端抓包:SYN发出后收到了RST

可能的原因:RS全部健康检查失败。

处理方法:后端ECS上分析排查健康检查失败的原因。

 

c.  问题表现:

  • ping or telnet 表现类似,偶发不通;
  • 只有部分地域或单个运营商存在问题;

可能的原因:公网链路质量问题。

处理方法:获取MTR结果后请终端用户向当地运营商报障。

 

d.  问题表现:

  • 可以pingSLB IP
  • 是四层监听;
  • 访问失败概率为(n-1)/nn为后端ECS服务器台数;
  • 客户端抓包SYN发出后没有收到SYN ACK

可能的原因:服务器同时作为后端ECS与客户端;

处理方法:

  • 更改为7层监听
  • 更改架构

 

2.  健康检查失败

image.png

a.  /七层监听健康检查失败原因:

 

  • 屏蔽了健康检查源IP
  • 后端ECS端口是否监听;
  • 后端ECS监听队列是否溢出;
  • 安全软件是否进行了拦截;

 

b.  七层监听健康检查失败原因:

 

除了上述可能的问题,七层监听默认使用head请求,需要查看后端WebServer是否开启head请求;

 

c.  错误信息示例:

 

TCP监听:TCP connect time out / TCP connect error

UDP监听:UDP connect error

HTTP(s)监听:check protocol error / check time out

 

3.  访问出现4xx5xx

 image.png

 

使用负载均衡后出现4xx5xx的处理思路:

 

a.  400 Bad Request

 

  • 请求头过大;
  • Cookie过大;

 

b.  500 Internal Server Error

 

  • 指定域名和url时,没有精确匹配url
  • proxy往后端ECS发送数据的过程中,后端ECS主动RSTTCP连接;

 

c.  502 Bad Gateway

 

  • proxy和后端ECS三次握手过程中,后端ECS主动回复了RST
  • proxy和后端ECS三次握手成功,但在等待响应的过程中后端ECS主动回复了RST
  • 所有后端ECS健康检查失败;

 

d.  503 Service Unavailable

 

  • proxy超出单台限定的QPSupstream_response_timeupstream_addr会填充为“_”;
  • 转发的目标集合中没有可用的RS(如虚拟服务器中没有RS,后端服务器中没有ECS)upstream_response_time一般会填充为0.000upstream_addr会填充为“127.0.0.1:503”

 

e.  504 Gateway Timeout

 

  • proxyRS三次握手建连超时(超时时间为5),如syn一直在重传,upstream_response_time填充为5(可能会有正负一点误差,如5.001)upstream_status504
  • proxyRS三次握手成功,但是等待HTTP响应超时(超时时间为60)upstream_response_time填充为60(可能会有正负一点误差,如60.001)upstream_status504

 

4.  负载不均

 image.png

a.  负载不均的原因

 

  • 四层监听:业务存在长连接;新建连接数过少;
  • 七层监听:启用了HTTP2
  • /七层监听:后端健康检查抖动;会话保持;转发规则为最小连接数。

 

b.  解决思路:

 

  • 访问日志;
  • 健康检查日志;
  • 寻求阿里云技术支持,查看底层数据。

 

5.  压测性能不符合预期

 image.png

 

a.   施压前

  • 观测指标:50x状态码(特别是503状态码);丢弃连接、丢弃流量、50x状态码、upstream_response_timeupstream_response_time
  • 施压方式:长时间的压测、施压的源IP足够多(建议10个以上)

 

b.   施压中

  • 施压工具:推荐使用PTSJmeter
  • 关闭健康检查;
  • 关闭会话保持;

 

c.   施压后

  • 查看压测报告:QPSRTTPSVU
  • 评估是否达到预期;

 

d.   可能的原因

  • TCP流压测:单个TCP链接速率峰值=CLB总带宽的1/(N-1)
  • 客户端出现瓶颈:源端口不足、带宽受限;
  • SLB本身出现瓶颈:超过实例配额;
  • 后端ECS出现瓶颈。

 

 

 

相关实践学习
SLB负载均衡实践
本场景通过使用阿里云负载均衡 SLB 以及对负载均衡 SLB 后端服务器 ECS 的权重进行修改,快速解决服务器响应速度慢的问题
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
目录
打赏
0
0
0
0
12324
分享
相关文章
云卓越架构:云上网络稳定性建设和应用稳定性治理最佳实践
本文介绍了云上网络稳定性体系建设的关键内容,包括面向失败的架构设计、可观测性与应急恢复、客户案例及阿里巴巴的核心电商架构演进。首先强调了网络稳定性的挑战及其应对策略,如责任共担模型和冗余设计。接着详细探讨了多可用区部署、弹性架构规划及跨地域容灾设计的最佳实践,特别是阿里云的产品和技术如何助力实现高可用性和快速故障恢复。最后通过具体案例展示了秒级故障转移的效果,以及同城多活架构下的实际应用。这些措施共同确保了业务在面对网络故障时的持续稳定运行。
云上防线:云计算与网络安全的协同进化
【8月更文挑战第26天】在数字时代的浪潮中,云计算如同一片沃土,孕育着无限可能。然而,随之而来的网络安全挑战也如影随形,成为制约其发展的瓶颈。本文将深入探讨云计算与网络安全的紧密关系,揭示它们如何在相互促进中共同成长。我们将从云计算的基本概念出发,逐步剖析网络安全的重要性,并结合真实案例,展现云计算平台如何应对安全威胁,以及网络安全技术如何助力云服务的稳定性和可靠性。最后,我们将展望未来,探索云计算与网络安全的发展趋势,为读者提供一场思想的盛宴。
云上防线:云计算时代的网络安全策略
云上防线:云计算时代的网络安全策略
61 4
阿里云国际CloudOps的优势和云上运维的特点
阿里云国际CloudOps的优势和云上运维的特点
云上防线:云计算时代的网络安全策略
【10月更文挑战第1天】云上防线:云计算时代的网络安全策略
55 2
云上的守护:探索云计算与网络安全的融合之道
在这个数字时代,云计算已成为推动技术创新和服务模式变革的重要力量,但同时也伴随着日益严峻的网络安全挑战。本文深入探讨了云计算环境中的网络安全问题,包括云服务的安全性、信息保护机制以及防御策略,旨在揭示如何通过技术手段和管理措施,构建一个既高效又安全的云计算生态系统。我们将从云服务的架构出发,分析潜在的安全风险,探讨加密技术、访问控制、行为监控等信息安全技术的应用,并提出一套综合的网络安全防护框架,以期为企业和个人用户提供有价值的参考和指导。
75 2
云上防线:云计算时代的网络安全新策略
在数字化浪潮的推动下,云计算技术已成为企业信息技术架构的核心。然而,随之而来的网络安全挑战也日益严峻。本文旨在探讨云计算环境下的网络安全问题,并提出相应的安全策略。我们将从基础的云服务安全措施出发,深入到高级的信息保护技术,最后讨论如何通过合理的策略规划和人员培训,构建一道坚固的“云上防线”。
云上防线:云计算时代的网络安全策略
在数字化浪潮的推动下,云计算已成为企业IT架构的核心。然而,随着数据和应用的云端迁移,网络安全威胁亦步亦趋。本文将探讨云计算环境下的网络安全挑战,分析云服务模型的安全特性,并提出有效的信息安全管理策略,旨在为企业构建一道坚固的云上防线。
云上防御:云计算中的网络安全实践与策略
【8月更文挑战第31天】在数字时代的浪潮中,云计算已成为企业信息技术架构的心脏。随之而来的网络安全挑战也日益严峻,如何在云端构建坚不可摧的安全防线成为业界关注的焦点。本文将深入探讨云计算环境下的网络安全措施,从基础的数据加密到复杂的入侵检测系统,提供代码示例和实践策略,旨在为读者揭开云计算安全的神秘面纱,并提供实用的安全工具和解决方案。

热门文章

最新文章