背景
今天有同事反馈客户的环境在 TCP
建链时偶现超时导致握手失败,希望我能帮助测试定位。那我们可以使用 netperf
工具进行时延测试,如果能够触发问题,我们就可以抓包进行分析了。
分析
前面我们已经介绍过使用 netperf
进行网络性能测试,那 netperf
其实也能够进行网络时延的测试,今天我们就结合实际问题进行 TCP
协议下的网络时延测试。
通常这种情况一般发生在数据包转发点,根据网络拓扑即可知道数据包在哪些地方进行了转发。在这些地方我们都需要进行抓包。比如客户端到外部路由器,路由器到交换机,交换机到服务器,服务器到虚机。
netperf 测试
关于 netperf
的安装我们就不再赘述,有需要的同学点这里:xxx。
首先我们在客户端和服务段都安装好 netperf
,然后再服务端启动 netserver
,最后在客户端发起测试即可。
启动 netserver
命令:netserver
网络异常,图片无法展示
|
12865
端口监听成功,说明 netserver
启动成功。
客户端发起测试
命令:
netperf -H $(对端IP) -t omni -- -d rr -O "THROUGHPUT, THROUGHPUT_UNITS, MIN_LATENCY, MAX_LATENCY, MEAN_LATENCY" 复制代码
网络异常,图片无法展示
|
测试结果分析
从测试结果我们可以知道,最大的时延为 697us
,并没有复现开始提到的问题,但是我们可以使用-t
参数增加测试时间观察能否复现,同时结合抓包工具进行深度分析。
多说一句
网络问题相比其他问题而言,存在定位难度大,不确定性高,运维监控难等问题,但是我们可以结合业务场景,利用相关测试工具,再根据自己的经验来一步一步分析,是问题总能搞清楚的。