性能测试常见瓶颈分析及调优方法总结

本文涉及的产品
应用型负载均衡 ALB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
传统型负载均衡 CLB,每月750个小时 15LCU
简介: 性能测试常见瓶颈分析及调优方法总结

01

引言


在软件开发过程中,性能测试是至关重要的一个环节


在完成开发之后,对系统进行性能测试可以帮助发现系统存在的性能问题从而及时进行优化提高系统的响应速度、吞吐量、并发性等指标



性能测试瓶颈分析及调优方案是性能测试的重要步骤之一,下面我们将详细介绍其步骤和方案。


如今谈起http协议,想必IT人都懂,无论基于Web端还是App端应用、游戏开发等领域,应用非常广泛。



如何才能让http协议让不懂计算机的人也能明白它的重要性?


这个案例主要讲解如何通过http协议的细节来判断cookie、session、会话保持等相关知识点。

02

一、内容简介


在此先大概介绍下整个请求链路JMeter→nginx集群→k8s集群(应用服务部署在容器里,2个pod分别在不同的node上)→数据库接口使用的是http协议

03

二、寻找问题的本质根源


果在压测过程中发现所有的请求只打1个pod中,这个pod的资源利用率达到80%以上,而另外一个pod无压力,通过查看应用日志,发现没有任何请求打到这个pod上,判断是负载不均衡带来的问题

04

三、分析定位问题


根据应用的请求链路信息,通常看到这个现象脑海里想到的第一个想法首先是查看k8s的负载均衡策略,这里简单介绍一下,目前kubernetes提供了两种负载分发策略:


①如果不定义,默认使用kube-proxy的策略,比如随机、轮询


②基于客户端地址的会话保持模式,即来自同一个客户端发起的所有请求都会转发到固定的一个Pod上。



通过查看service的yaml配置,发现service没有配任何IPVS的分发策略

细想还会是什么原因影响请求的转发呢?



大胆假设很可能是另外一个pod所在的node设置网络策略比如限速等引起的,这可以通过最简单的方式进行快速验证,即将pod驱逐到其它node上进行验证可惜的是问题并没有解决。


由此证明此问题不是k8s和node引起的



通过前面的链路判断,只能再往前分析前一个组件了,即nginx集群配置负载均衡策略导致。


Nginx常见的负载均衡策略有,随机、轮询、ip_hash、weight等,其中可能会引起负载不均衡的有ip_hash和weight



通常在企业内,测试并没有很高的权限,而且每个组件都会有对应的负责人,想到这只能联系nginx的负责人帮忙查看了,很遗憾获得的回馈是nginx配置是轮询策略,也就是不是nginx配置引起的



再往前思考一步莫非是JMeter了,但是这次压测使用了5台不同的压力机进行发压,即使有1台压力机有问题,也不会引起后端服务负载不均衡。


此时我已无策可施,下面只能考虑应用层相关配置引起的问题,一层层深入分析


从协议的角度来看,常见的有四层负载均衡和七层负载均衡,这次的应用使用的是七层负载均衡



由于缺乏对http协议的深度理解,大脑中只知道接口协议包含哪些内容如请求头、响应头、cookie、session、URL、地址、参数等信息,实在想不出哪里会导致后端负载不均衡。

05

四、寻找问题解决方案


时和开发还有k8s的负责人,大家在一起讨论原因,开发预估是配置session会话保持引起的


次阐述,会话保持是指在负载均衡器上的一种机制,可以识别客户端与服务器之间交互过程的关联性,负载均衡的同时还保证一系列相关联的访问请求都会分配到一台机器上。



再次查看应用层的确开启了session会话保持功能


如果仅开启session保持这个功能并不会引起负载不均衡问题



因为JMeter使用了不同的压力机,后来通过分析可能是JMeter脚本参数化数据问题,结果发现Cookie中将jsessionid给写成唯一值了,这就导致了所有的请求都只会到同一台服务器上。

06

五、解决问题


最后我通过模拟不同的jssessionid解决了此问题。

07

六、结

 

综上所述,通过这次性能测试案例分析与调优。


从中获得了一些心得与感悟,要实施好性能测试,不但需要一定的知识的深度与广度,而且要让性能测试人员站在一定的高度才能快速分析出问题的瓶颈



后需要开发配合一起排查解决问题,才能从根本上提升系统的性能,满足性能测试需求目标。

相关实践学习
通过性能测试PTS对云服务器ECS进行规格选择与性能压测
本文为您介绍如何利用性能测试PTS对云服务器ECS进行规格选择与性能压测。
相关文章
|
6月前
|
数据采集 监控 机器人
浅谈网页端IM技术及相关测试方法实践(包括WebSocket性能测试)
最开始转转的客服系统体系如IM、工单以及机器人等都是使用第三方的产品。但第三方产品对于转转的业务,以及客服的效率等都产生了诸多限制,所以我们决定自研替换第三方系统。下面主要分享一下网页端IM技术及相关测试方法,我们先从了解IM系统和WebSocket开始。
120 4
|
16天前
|
负载均衡 测试技术
|
6天前
|
测试技术
软考软件评测师——可靠性测试测试方法
软件可靠性是指软件在规定条件和时间内完成预定功能的能力,受运行环境、软件规模、内部结构、开发方法及可靠性投入等因素影响。失效概率指软件运行中出现失效的可能性,可靠度为不发生失效的概率,平均无失效时间(MTTF)体现软件可靠程度。案例分析显示,嵌入式软件需满足高可靠性要求,如机载软件的可靠度需达99.99%以上,通过定量指标评估其是否达标。
|
6天前
|
测试技术
软考软件评测师——黑盒测试测试方法
本内容系统介绍了黑盒测试的核心方法与实践技巧。主要包括:等价类划分法(有效/无效输入及划分原则)、边界值分析法(聚焦边界点选取测试数据)、决策表法(规则计算与表格优化)、边界值设计七原则(涵盖输入输出与隐藏边界)以及黑盒测试方法体系(多种测试方法概述)。特别详细讲解了场景法实践指南,通过模拟用户操作流程,区分基本流与备选流,并生成优化的测试用例矩阵,为全面覆盖功能测试提供指导。
|
6天前
|
消息中间件 缓存 监控
性能测试怎么做?方法、流程与核心要点解析
本文系统阐述了性能测试的核心方法论、实施流程、问题定位优化及报告编写规范。涵盖五大测试类型(负载验证、极限压力、基准比对、持续稳定性、弹性扩展)与七项关键指标,详解各阶段任务如需求分析、场景设计和环境搭建,并提供常见瓶颈识别与优化实战案例。最后规范测试报告内容框架与数据可视化建议,为企业级实践提出建立基线库、自动化回归和全链路压测体系等建议,助力高效开展性能测试工作。
|
4月前
|
编解码 缓存 Prometheus
「ximagine」业余爱好者的非专业显示器测试流程规范,同时也是本账号输出内容的数据来源!如何测试显示器?荒岛整理总结出多种测试方法和注意事项,以及粗浅的原理解析!
本期内容为「ximagine」频道《显示器测试流程》的规范及标准,我们主要使用Calman、DisplayCAL、i1Profiler等软件及CA410、Spyder X、i1Pro 2等设备,是我们目前制作内容数据的重要来源,我们深知所做的仍是比较表面的活儿,和工程师、科研人员相比有着不小的差距,测试并不复杂,但是相当繁琐,收集整理测试无不花费大量时间精力,内容不完善或者有错误的地方,希望大佬指出我们好改进!
282 16
「ximagine」业余爱好者的非专业显示器测试流程规范,同时也是本账号输出内容的数据来源!如何测试显示器?荒岛整理总结出多种测试方法和注意事项,以及粗浅的原理解析!
|
4月前
|
人工智能 自然语言处理 测试技术
AxBench:斯坦福大学推出评估语言模型控制方法的基准测试框架
AxBench 是由斯坦福大学推出,用于评估语言模型可解释性方法的基准测试框架,支持概念检测和模型转向任务,帮助研究者系统地比较不同控制技术的有效性。
108 5
AxBench:斯坦福大学推出评估语言模型控制方法的基准测试框架
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
MarS:微软开源金融市场模拟预测引擎,支持策略测试、风险管理和市场分析
MarS 是微软亚洲研究院推出的金融市场模拟预测引擎,基于生成型基础模型 LMM,支持无风险环境下的交易策略测试、风险管理和市场分析。
185 8
MarS:微软开源金融市场模拟预测引擎,支持策略测试、风险管理和市场分析
|
6月前
|
开发框架 .NET Java
C#集合数据去重的5种方式及其性能对比测试分析
C#集合数据去重的5种方式及其性能对比测试分析
73 11
|
6月前
|
开发框架 .NET Java
C#集合数据去重的5种方式及其性能对比测试分析
C#集合数据去重的5种方式及其性能对比测试分析
98 10