企业运维训练营之云上网络原理与实践课程 - 第二讲 负载均衡CLB(下)- 常见问题与解决思路

本文涉及的产品
云服务器 ECS,每月免费额度280元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 课程目标了解负载均衡CLB的产品功能了解负载均衡CLB的底层架构与相关技术掌握负载均衡CLB的最佳实践熟知负载均衡CLB的常见问题与解决思路

企业运维训练营之云上网络原理与实践课程

第二讲  负载均衡CLB(下)- 常见问题与解决思路

 

视频地址:

https://developer.aliyun.com/learning/course/991/detail/14970

 

 

1.  访问CLB失败

image.png

 

a.  问题表现:公网所有客户端ping or telnet 均不通。

可能的原因:SLB IP被清洗或黑洞。

处理方法:1、清洗:解除清洗 2、黑洞:迁移业务,等待黑洞结束。

 

b.  问题表现:

  • 可以pingSLB IP
  • 客户端报错:Connection reset by peerConnection refused502状态码;
  • 访问日志,upstream addr显示为非IP地址;
  • 客户端抓包:SYN发出后收到了RST

可能的原因:RS全部健康检查失败。

处理方法:后端ECS上分析排查健康检查失败的原因。

 

c.  问题表现:

  • ping or telnet 表现类似,偶发不通;
  • 只有部分地域或单个运营商存在问题;

可能的原因:公网链路质量问题。

处理方法:获取MTR结果后请终端用户向当地运营商报障。

 

d.  问题表现:

  • 可以pingSLB IP
  • 是四层监听;
  • 访问失败概率为(n-1)/nn为后端ECS服务器台数;
  • 客户端抓包SYN发出后没有收到SYN ACK

可能的原因:服务器同时作为后端ECS与客户端;

处理方法:

  • 更改为7层监听
  • 更改架构

 

2.  健康检查失败

image.png

a.  /七层监听健康检查失败原因:

 

  • 屏蔽了健康检查源IP
  • 后端ECS端口是否监听;
  • 后端ECS监听队列是否溢出;
  • 安全软件是否进行了拦截;

 

b.  七层监听健康检查失败原因:

 

除了上述可能的问题,七层监听默认使用head请求,需要查看后端WebServer是否开启head请求;

 

c.  错误信息示例:

 

TCP监听:TCP connect time out / TCP connect error

UDP监听:UDP connect error

HTTP(s)监听:check protocol error / check time out

 

3.  访问出现4xx5xx

 image.png

 

使用负载均衡后出现4xx5xx的处理思路:

 

a.  400 Bad Request

 

  • 请求头过大;
  • Cookie过大;

 

b.  500 Internal Server Error

 

  • 指定域名和url时,没有精确匹配url
  • proxy往后端ECS发送数据的过程中,后端ECS主动RSTTCP连接;

 

c.  502 Bad Gateway

 

  • proxy和后端ECS三次握手过程中,后端ECS主动回复了RST
  • proxy和后端ECS三次握手成功,但在等待响应的过程中后端ECS主动回复了RST
  • 所有后端ECS健康检查失败;

 

d.  503 Service Unavailable

 

  • proxy超出单台限定的QPSupstream_response_timeupstream_addr会填充为“_”;
  • 转发的目标集合中没有可用的RS(如虚拟服务器中没有RS,后端服务器中没有ECS)upstream_response_time一般会填充为0.000upstream_addr会填充为“127.0.0.1:503”

 

e.  504 Gateway Timeout

 

  • proxyRS三次握手建连超时(超时时间为5),如syn一直在重传,upstream_response_time填充为5(可能会有正负一点误差,如5.001)upstream_status504
  • proxyRS三次握手成功,但是等待HTTP响应超时(超时时间为60)upstream_response_time填充为60(可能会有正负一点误差,如60.001)upstream_status504

 

4.  负载不均

 image.png

a.  负载不均的原因

 

  • 四层监听:业务存在长连接;新建连接数过少;
  • 七层监听:启用了HTTP2
  • /七层监听:后端健康检查抖动;会话保持;转发规则为最小连接数。

 

b.  解决思路:

 

  • 访问日志;
  • 健康检查日志;
  • 寻求阿里云技术支持,查看底层数据。

 

5.  压测性能不符合预期

 image.png

 

a.   施压前

  • 观测指标:50x状态码(特别是503状态码);丢弃连接、丢弃流量、50x状态码、upstream_response_timeupstream_response_time
  • 施压方式:长时间的压测、施压的源IP足够多(建议10个以上)

 

b.   施压中

  • 施压工具:推荐使用PTSJmeter
  • 关闭健康检查;
  • 关闭会话保持;

 

c.   施压后

  • 查看压测报告:QPSRTTPSVU
  • 评估是否达到预期;

 

d.   可能的原因

  • TCP流压测:单个TCP链接速率峰值=CLB总带宽的1/(N-1)
  • 客户端出现瓶颈:源端口不足、带宽受限;
  • SLB本身出现瓶颈:超过实例配额;
  • 后端ECS出现瓶颈。

 

 

 

相关实践学习
部署高可用架构
本场景主要介绍如何使用云服务器ECS、负载均衡SLB、云数据库RDS和数据传输服务产品来部署多可用区高可用架构。
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
相关文章
|
4天前
|
运维 监控 安全
等保合规:保护企业网络安全的必要性与优势
等保,全称为“信息安全等级保护”,是国家强制性标准,要求特定行业和企业通过安全评估确保网络安全。等保涉及物理安全(如门禁、人员管理、设备保护等)、网络安全、主机安全、应用与数据安全、制度与人员安全、系统建设管理及系统运维管理等七个方面,确保信息系统的安全和可靠性。企业进行等保合规是为了满足《网络安全法》等法律法规要求,防止网络数据泄露,避免罚款。等保工作包括定级备案、安全测评、建设整改等,企业需建立良好的安全保护生态,确保网络安全。通过等保,企业能构建有效的安全保障体系,防御系统入侵,保障用户信息,提升故障修复效率,并符合法律义务。
|
4天前
|
安全 数据建模 网络安全
深入理解SSL数字证书:定义、工作原理与网络安全的重要性
本文阐述了SSL数字证书在网络安全中的关键作用,定义了其作为验证服务器身份的数字凭证,基于PKI体系保障数据传输安全。文章介绍了三种类型的证书,包括DV、OV和EV,适用于不同安全需求的网站。获取和安装证书涉及向证书颁发机构申请并部署到服务器。在网络安全挑战下,正确使用和管理SSL证书对于保护用户数据和提升信任度至关重要。
|
8天前
|
运维 Kubernetes Devops
构建高效自动化运维体系:DevOps与容器技术融合实践
【4月更文挑战第15天】 在当今快速发展的信息技术时代,传统的IT运维模式已难以满足业务敏捷性的需求。本文旨在探讨如何通过整合DevOps理念和容器技术来构建一个高效的自动化运维体系。文章将详细阐述DevOps的核心原则、容器技术的基础知识,以及两者结合的优势。此外,文中还将分享一系列实践经验,包括持续集成/持续部署(CI/CD)流程的搭建、微服务架构的应用,以及监控和日志管理策略的优化,以期帮助企业实现快速、可靠且安全的软件交付过程。
|
9天前
|
人工智能 运维 监控
构建高效自动化运维体系的实践与思考
【4月更文挑战第14天】在数字化转型的浪潮中,自动化运维作为提升系统稳定性和效率的关键手段,受到了企业的广泛关注。本文将深入探讨如何构建一个高效的自动化运维体系,涵盖从基础设施的搭建到流程的优化等多个方面。通过分析当前自动化运维的挑战及解决方案,文章旨在为读者提供一套实用的策略框架,帮助企业实现运维工作的高效化、标准化和智能化。
|
11天前
|
安全 网络协议 网络安全
网络原理(5)--HTTPS是如何进行加密的
网络原理(5)--HTTPS是如何进行加密的
7 0
|
11天前
|
存储 JSON 前端开发
网络原理(4)HTTP协议(下)
网络原理(4)HTTP协议
25 0
|
14天前
|
传感器 监控 安全
|
14天前
|
负载均衡 算法 应用服务中间件
面试题:Nginx有哪些负载均衡算法?Nginx位于七层网络结构中的哪一层?
字节跳动面试题:Nginx有哪些负载均衡算法?Nginx位于七层网络结构中的哪一层?
31 0
|
3月前
|
负载均衡 应用服务中间件 nginx
百度搜索:蓝易云【Nginx和tomcat实现负载均衡教程】
至此,你已经成功地使用Nginx和Tomcat实现了负载均衡。Nginx将根据配置的负载均衡策略将客户端请求分发到多个Tomcat服务器上,以提高系统的性能和可用性。请注意,在实际生产环境中,还需要进行其他配置和优化,如健康检查、会话保持等,以满足具体的需求。
34 0
|
4天前
|
负载均衡 应用服务中间件 nginx
Nginx 负载均衡
Nginx 负载均衡
19 2