同事牛逼啊,写了个隐藏 bug,我排查了 3 天才解决问题!

简介: 最近线上监控 SFTP 连接频繁爆表,通过重启某个系统,连接数迅速下降,系统就能恢复正常,初步判断是应用程序连接未关闭的问题导致的。

最近线上监控 SFTP 连接频繁爆表,通过重启某个系统,连接数迅速下降,系统就能恢复正常,初步判断是应用程序连接未关闭的问题导致的。


栈长通过 IDE 全局搜索排查,SFTP 连接使用了 jsch 包,确实有一些功能点使用了 SFTP 连接而未关闭的情况,或者不在 finally 语句块中正常关闭。


整改上线后,SFTP 还是爆表……


事后运维心态都要崩了,运维主动写了个 SFTP 连接监控,当连接超过 5 分钟空闲时就主动断开。


但这只是临时的处理,真正的原因肯定还是应用程序没有正常关闭导致的,于是再认真排查下程序,终于找出了元凶。。


下面是示例代码:

Session session = null;
ChannelSftp channel = null;
try{
    for(...){
        ...
        // 创建会话
        JSch jsch = new JSch();
        jsch.getSession(host, username);
        session = jsch.getSession(username, host, port);
        session.setPassword(password);
        session.connect();
        // 创建sftp连接
        channel = session.openChannel("sftp");
        channel.connect();
        ...
    }
} catch(...){
    ...
} finally{
    if (null != channel && channel.isConnected()) {
        channel.disconnect();
    }
    if (null != session && session.isConnected()) {
        session.disconnect();
    }
}

大家都看出问题了吗?


这程序我检查了 2 遍,排查了 3 天才解决了这个问题。


写出这代码,同事真是个人才啊!!!


乍一看,连接确实是关闭了啊,也确实是在 finally 语句块关闭,为什么还会有问题?


原因就是在该死的 for 循环中创建连接的,虽然在 finally 中进行了关闭,但是连接变量在循环中进行重建和替换,所以关闭的永远只是最后一个连接。


而且,这还是个下载 Excel 明细的功能,数据很多的时候,一个操作就能导致连接瞬间爆表。


解决方案肯定是要把创建连接的部分拿到 for 循环前面去,连接创建一次就好了,可以反复使用。


另外,知道 JDK 7+ 中的 try-with-resources 语法的朋友可能会问,可以省略 finally 语句块吧,可以直接在 try(...) 中定义,它会自动关闭。


Really?建议还是仔细阅读下 try-with-resources 这篇文章吧,没看过的可以关注公众号Java技术栈进行搜索阅读。


这个 jsch 连接包还真不行,我们来看它的源码吧,不然又是一个坑你没商量的坑。


com.jcraft.jsch.Session:


image.png


com.jcraft.jsch.Channel:


image.png


这两个类只实现了 Runnable 接口,没有实现 java.lang.AutoCloseable 接口,所以,它并不符合 try-with-resources 自动关闭的原则。关于流关闭具体演进可以参考Java技术栈公众号 "简化流关闭新姿势" 这篇文章。


至此,线上 SFTP 连接爆表的问题终于解决了,可以安心睡个好觉了,同时,我也感觉我们的同事太牛逼了,又让我涨知识了。


大家引以为戒吧,也欢迎在看、转发!


相关文章
|
9月前
|
程序员
面试高频题:开发人员说不是bug,测试如何答复?
面试高频题:开发人员说不是bug,测试如何答复?
150 0
|
测试技术
解决Bug应有的心态和解决方法的一些思路、方法和心得
永远要相信程序是不会骗你的,是自己在处理理逻辑中出问题,而在特定的环境中才会出现或者是自己压根就想不到情况下出现。 前几天在处理一个接口任务时,在测试环境跑是一点都没有,但在正式环境却没有将数据拉下来。没有报任何错误,一度怀疑、抱怨! 还好最后找到问题解决了!
112 0
|
9月前
|
人工智能 网络安全 Python
一篇普通的bug日志——bug的尽头是next吗?
[bug 1] TypeError: ‘method’ object is not subscriptable 问题代码:
144 0
一篇普通的bug日志——bug的尽头是next吗?
|
缓存 JavaScript 小程序
接手前同事代码,特别烂,各种BUG,看麻了。。。
接手前同事代码,特别烂,各种BUG,看麻了。。。
|
开发框架 Java 测试技术
【测试基础】五、这样提bug单,开发小哥还会怼你么?
【测试基础】五、这样提bug单,开发小哥还会怼你么?
【测试基础】五、这样提bug单,开发小哥还会怼你么?
|
测试技术
如何处理不能复现的bug?软件测试工程师避坑指南
软件测试工作中常常会遇到不能复现的bug,遇到这种情况其实很正常,但是很多测试新手都按照自己的想法处理,没有提交bug,或者匆匆关闭bug。线上出现问题,就只能自己背锅了。
598 0
|
Java 中间件 程序员
最网最全bug定位套路,遇见bug再也不慌了
最网最全bug定位套路,遇见bug再也不慌了
367 0
|
Arthas 监控 Java
看了这篇文章,比同事更快找到bug!
你以为程序员只是闷着头疯狂写bug,写好了发布到服务器就完了? 不,你还要修bug!但在那之前,你还要找bug!
224 0
|
网络虚拟化
【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug
【以及经过脱敏处理,无重要信息泄露】本人在校大学生,网络水平还行,是学校信息中心常驻外援工程师,hhhhhhhhhhhhh。 某次在食堂吃晚饭的时候一个电话把我call过去,说新配置一新机房网络,网联不通,弄了一下午了看不出问题。
1675 0
【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug
|
小程序 Android开发 容器
为何小程序上线了,他们的内心却留下遗憾?
你的小程序还是那么卡卡卡卡么?
7755 0
为何小程序上线了,他们的内心却留下遗憾?

相关实验场景

更多