负载均衡SLB压测为何不符合预期?-阿里云开发者社区

开发者社区> 开发与运维> 正文

负载均衡SLB压测为何不符合预期?

简介: 负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务。负载均衡可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。大多数公司购买SLB后会进行压测来检测其性能是否达标,经常会发现压测不符合预期的情况,此文针对SLB7层监听部分压测场景进行分析。

负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务。负载均衡可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。
大多数公司购买SLB后会进行压测来检测其性能是否达标,经常会发现压测不符合预期的情况,此文针对SLB7层监听部分压测场景进行分析。

压测环境准备

  • 压测客户端(使用 Apache Benchmark(简称ab) 压测)
  • 性能保障型SLB
  • 压测服务端(Nginx web server)

为什么HTTPS压测性能不及HTTP?

如下图所示,使用HTTP压测1000请求5个并发的时候qps是331.7,但是使用HTTPS压测的时候qps只有34qps,很多人认为是SLB对HTTPS的处理性能不及HTTP。
_

首先可以在SLB控制台监控界面查看是否有丢弃连接和丢弃流量,如果没有丢弃连接和丢弃流量说明并未达到SLB的性能上限。
接着可以查看SLB 7层访问日志,看下request_time,通过下图可以看到不管是HTTP还是HTTPS,SLB的响应时间都非常快,且request_time并没有明显增大的情况,响应的状态码也都是200,从此可以判断SLB后端服务器没有达到瓶颈,SLB本身也没达到瓶颈.
requestt
那为什么会出现HTTPS压测性能不及HTTP的感觉呢?是因为AB压测的时候其实是串行进行的,当完成一个请求后才会进行下一个请求,HTTPS因为要进行SSL握手且是加密交互的,所以在SSL握手阶段耗时的时间会导致总体的QPS下降。下面通过抓包分析。可以看到HTTP的单个请求总的交互时间只有十几毫秒,但是HTTPS单个请求总的交互时间需要200多毫秒,这就导致客户端每秒发送的请求数量变少,所以这种情况并非是SLB处理不过来导致性能不行。
80_jpeg
443
如果遇到这种情况可以使用HTTP长连接压测或者增加多个客户端来压测,这时候SLB的QPS可以进一步提升。

为什么SLB并发上不去?

压测客户端压测发现SLB并发始终上不去。当客户端发送5000个请求,5个并发的时候总的qps在280左右。5个并发相当于模拟5个用户并发请求,但是每个用户自己的请求都是串行的,只有完成一个请求后才会发第二个请求。
通过netstat可以查看同一时刻差不多会有5个TCP连接发生请求
ab
1
如果SLB并未发生丢包,丢弃连接,没有响应异常状态码且7层访问日志查看request_time和upstream_request_time均比较小,那么可以增加客户端并发来提升qps,也可以增加多个客户端。

总结

如果压测SLB的时候感觉SLB性能不及预期可以通过下面几个信息判断

  1. 控制台SLB监控界面查看SLB是否有丢弃流量,丢弃连接
  2. 如果是7层监听,可以开通7层访问日志,查看压测时候状态码是否都是200,是否有异常状态码,例如5xx,4xx等
  3. 可以在7层访问日志里面查看upstream_request_time和request_times 是否有比较大的情况。

如果以上情况均没有发现异常,那可以增加压测客户端来提升qps,笔者多次遇到因为压测客户端(使用ab,jmeter等)问题,导致压测时候SLB的性能不及预期。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
开发与运维
使用钉钉扫一扫加入圈子
+ 订阅

集结各类场景实战经验,助你开发运维畅行无忧

其他文章