负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务。负载均衡可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。
大多数公司购买SLB后会进行压测来检测其性能是否达标,经常会发现压测不符合预期的情况,此文针对SLB7层监听部分压测场景进行分析。
压测环境准备
- 压测客户端(使用 Apache Benchmark(简称ab) 压测)
- 性能保障型SLB
- 压测服务端(Nginx web server)
为什么HTTPS压测性能不及HTTP?
如下图所示,使用HTTP压测1000请求5个并发的时候qps是331.7,但是使用HTTPS压测的时候qps只有34qps,很多人认为是SLB对HTTPS的处理性能不及HTTP。
首先可以在SLB控制台监控界面查看是否有丢弃连接和丢弃流量,如果没有丢弃连接和丢弃流量说明并未达到SLB的性能上限。
接着可以查看SLB 7层访问日志,看下request_time,通过下图可以看到不管是HTTP还是HTTPS,SLB的响应时间都非常快,且request_time并没有明显增大的情况,响应的状态码也都是200,从此可以判断SLB后端服务器没有达到瓶颈,SLB本身也没达到瓶颈.
那为什么会出现HTTPS压测性能不及HTTP的感觉呢?是因为AB压测的时候其实是串行进行的,当完成一个请求后才会进行下一个请求,HTTPS因为要进行SSL握手且是加密交互的,所以在SSL握手阶段耗时的时间会导致总体的QPS下降。下面通过抓包分析。可以看到HTTP的单个请求总的交互时间只有十几毫秒,但是HTTPS单个请求总的交互时间需要200多毫秒,这就导致客户端每秒发送的请求数量变少,所以这种情况并非是SLB处理不过来导致性能不行。
如果遇到这种情况可以使用HTTP长连接压测或者增加多个客户端来压测,这时候SLB的QPS可以进一步提升。
为什么SLB并发上不去?
压测客户端压测发现SLB并发始终上不去。当客户端发送5000个请求,5个并发的时候总的qps在280左右。5个并发相当于模拟5个用户并发请求,但是每个用户自己的请求都是串行的,只有完成一个请求后才会发第二个请求。
通过netstat可以查看同一时刻差不多会有5个TCP连接发生请求
如果SLB并未发生丢包,丢弃连接,没有响应异常状态码且7层访问日志查看request_time和upstream_request_time均比较小,那么可以增加客户端并发来提升qps,也可以增加多个客户端。
总结
如果压测SLB的时候感觉SLB性能不及预期可以通过下面几个信息判断
- 控制台SLB监控界面查看SLB是否有丢弃流量,丢弃连接
- 如果是7层监听,可以开通7层访问日志,查看压测时候状态码是否都是200,是否有异常状态码,例如5xx,4xx等
- 可以在7层访问日志里面查看upstream_request_time和request_times 是否有比较大的情况。
如果以上情况均没有发现异常,那可以增加压测客户端来提升qps,笔者多次遇到因为压测客户端(使用ab,jmeter等)问题,导致压测时候SLB的性能不及预期。