关于jmeter分布式压测如何搭建网上的文章很多,搭建过程本文不再赘述,主要讨论可能的报错以及解决方案,下面的内容可能查阅的频率很高,强烈建议收藏。
问题1
报错:
Created the tree successfully using test.jmx Configuring remote engine: 192.157.20.1 Connection refused to host: 192.157.20.1; nested exception is: java.net.ConnectException: Connection refused Failed to configure 192.157.20.1 Stopping remote engines Remote engines have been stopped Error in NonGUIDriver java.lang.RuntimeException: Following remote engines could not be configured:[192.157.20.1] An error occurred: Error in NonGUIDriver Following remote engines could not be configured:[192.157.20.1]
解决方案1:这个其实是你从压力机的jmeter-server没有开启,提供一条后台启动方式,如果不使用后台启动,进程可能随着你操作shell的关闭而关闭
nohup ~/apache-jmeter-5.2.1/bin/jmeter-server > Log.log 2>&1 &
问题2
报错:
Created the tree successfully using myaccount.jmx Configuring remote engine: 192.157.20.1 Starting distributed test with remote engines: [192.157.20.1] @ Tue May 12 10:38:06 CST 2020 (1589251086882) Remote engines have been started:[192.157.20.1] Waiting for possible Shutdown/StopTestNow/HeapDump/ThreadDump message on port 4445 summary = 0 in 00:00:00 = ******/s Avg: 0 Min: 9223372036854775807 Max: -9223372036854775808 Err: 0 (0.00%) Tidying up remote @ Tue May 12 10:38:09 CST 2020 (1589251089904)
解决方案2:
出现以上情况原因及解决办法:1、jmeter脚本和测试数据(如果有的话)主机和从机两边都要存放。且controller中jmeter脚本、测试数据的存放路径和agent中jmeter脚本、测试数据的存放路径一致。
2、在原因1的基础上,controller的测试数据地址要用绝对路径(参数化文件),agent的测试数据绝对路径或相对路径均可。
问题3:
连接slave,connect refuse
解决方案3:
防火墙状态查询,如果开了请关闭;
controller和agent在同一网段,先进行网络测试。
问题4:
master、slave的时间要同步,否则tps结果误差较大。
问题5:
报错rmi-keystore.jks(系统找不到指定文件);
解决方案5:
JMeter/bin中的jmeter.properties文件中修改 server.rmi.ssl.disable=true
问题6:
压力无法上去或者qps波动很大 压力无法上去涉及到的方方面面很多,我仅从压力机本身举两个例子 ;
解决方案6
确认master和slave在同一个网段,并监控相关数据 ;
发起压力的同时查看服务网络连接状态,可以用这个命令:
netstat -ant|awk '/^tcp/ {++S[$NF]} END {for(a in S) print (a,S[a])}'
当我们看到timewait数值很高时,可以做一些内核参数优化
vi /etc/sysctl.conf net.ipv4.tcp_keepalive_time = 1200 #表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为20分钟。 net.ipv4.ip_local_port_range = 1024 65000 #表示用于向外连接的端口范围。缺省情况下很小:32768到61000,改为1024到65000。 net.ipv4.tcp_max_syn_backlog = 8192 #表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。 net.ipv4.tcp_max_tw_buckets = 5000 #表示系统同时保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立刻被清除并打印警告信息。 默认为180000,改为5000。对于Apache、Nginx等服务器,上几行的参数可以很好地减少TIME_WAIT套接字数量,但是对于 Squid,效果却不大。此项参数可以控制TIME_WAIT套接字的最大数量,避免Squid服务器被大量的TIME_WAIT套接字拖死。
然后执行 /sbin/sysctl -p 让参数生效
问题7:
报错:
Couldn't flush user prefs: java.util.prefs.BackingStoreException: Couldn't get file lock
解决方案7:
这个原因是linux中限制了默认打开文件的数量 ulimit -n 100000
问题8:
很多同学使用命令行会动态传入线程数等,分布式是失效的;