【JAVA】-排查线程卡死问题

简介: 排查线程卡死问题

WX20220610-163441@2x.png

我们系统的二维码是通过jna调用dll文件生成的,最近碰到二维码使用几次过后就无法重新生成。在dump出线程资源后,发现调用dll的时候会卡死。

dump线程

jstack -l 线程pid > dump.txt
  • -l 长列表,打印关于锁的附加信息
  • -m 打印java和jni框架的所有栈信息

-m 打印的信息是这个样子

----------------- 1 -----------------
0x7713f8e1    ntdll!ZwWaitForSingleObject + 0x15
0x769b1194    kernel32!WaitForSingleObjectEx + 0x43
0x769b1148    kernel32!WaitForSingleObject + 0x12
0x710825b9    jvm!_JVM_FindSignal@4 + 0x2979
0x7101dfc1    jvm!JVM_GetThreadStateNames + 0x4f381
0x7101e356    jvm!JVM_GetThreadStateNames + 0x4f716
0x7103f3d1    jvm!JVM_GetThreadStateNames + 0x70791
0x70f9c505    jvm!JNI_GetCreatedJavaVMs + 0x59c5
0x01242165    java + 0x2165
0x0124b03f    java + 0xb03f
0x0124b0c9    java + 0xb0c9
0x769b336a    kernel32!BaseThreadInitThunk + 0x12
0x77159902    ntdll!RtlInitializeExceptionChain + 0x63
0x771598d5    ntdll!RtlInitializeExceptionChain + 0x36

-l 是这样子的

"Executor-3" #152 prio=5 os_prio=0 tid=0x16438000 nid=0xe08 runnable [0x2128f000]
   java.lang.Thread.State: RUNNABLE
 at com.sun.jna.Native.invokeLong(Native Method)
 at com.sun.jna.Function.invoke(Function.java:421)
 at com.sun.jna.Function.invoke(Function.java:354)
 at com.sun.jna.Library$Handler.invoke(Library.java:244)
 at com.sun.proxy.$Proxy120.WXSnsUpload(Unknown Source)
 at com.zhiplusyun.wxapi.xxx.xxx(FriendshipApi.java:146)
 at com.zhiplusyun.wxapi.xxx.xxx(FriendshipApi.java:117)
 at com.zhiplusyun.wxapi.xxx.xxx(FriendshipApi.java:86)
 at com.zhijiayun.zhituicenter.service.asyncTask.xxx.xxx(LoginSuccessAsyncTask.java:196)
 at com.zhijiayun.zhituicenter.service.asyncTask.xxx.xxx(LoginSuccessAsyncTask.java:73)
 at com.zhijiayun.zhituicenter.service.asyncTask.xxx.xxx(CheckQrcodeStatusAsyncTask.java:57)
 at com.zhijiayun.zhituicenter.service.xxx.xxx$$FastClassBySpringCGLIB$$c3165a3b.invoke(<generated>)
 at org.springframework.cglib.proxy.MethodProxy.invoke(MethodProxy.java:204)
 at org.springframework.aop.framework.CglibAopProxy$CglibMethodInvocation.invokeJoinpoint(CglibAopProxy.java:747)
 at org.springframework.aop.framework.ReflectiveMethodInvocation.proceed(ReflectiveMethodInvocation.java:163)
 at org.springframework.aop.interceptor.AsyncExecutionInterceptor.lambda$invoke$0(AsyncExecutionInterceptor.java:115)
 at org.springframework.aop.interceptor.AsyncExecutionInterceptor$$Lambda$465/27605255.call(Unknown Source)
 at java.util.concurrent.FutureTask.run(Unknown Source)
 at java.util.concurrent.ThreadPoolExecutor.runWorker(Unknown Source)
 at java.util.concurrent.ThreadPoolExecutor$Worker.run(Unknown Source)
 at java.lang.Thread.run(Unknown Source)
   Locked ownable synchronizers:
 - <0x0b523168> (a java.util.concurrent.ThreadPoolExecutor$Worker)

这一部分也是需要分析的部分,这个线程一直处于 java.lang.Thread.State: RUNNABLE状态,线程卡死在com.sun.jna.Native.invokeLong(Native Method)这里,这里就是调用了dll的WXSnsUpload函数,一个线程一直被占用,后面的线程再进来同样被卡住,直到沾满线程池。

在dump文件中,会看到这几个状态:

Deadlock 死锁

Runnable 执行中

Waiting on condition 等待资源

Waiting on monitor entry 等待获取监视器

Object.wait() 或 TIMED_WAITING 对象等待中

Suspended 暂停

Blocked 阻塞

文章参考:http://java.jr-jr.com/2015/12/09/jstack-state/

继续上面的分析,既然在调用dll的时候线程一直被占用,应该是这个dll里面发生了什么,一直在等待某个资源返回,而dll的函数里又没有写超时机制,那就自己在外面写个调用超时,我用了FutureTask来实现

以为这样就能解决了,然而下午又报二维码无法生成了,没办法,只能再dump线程分析,发现还是在调用dll的时候的问题,只不过换了一个dll的函数,这难道调用dll的不同函数都有卡住的可能,难道我要给没个方法加超时吗,这治标不治本啊。

聪明的我并没有这么去做,有个线程的状态Waiting on condition提醒了我,这个状态就说明线程一直等待某个资源,有可能是请求第三方,但第三方一直没返回。由于我们项目发起http请求,使用了http代理,怀疑是不是http代理出了问题。

那么网上找个http代理来试下,啊呀,果然如此,用了他们的代理就不会用问题,怎么点都行。

自己用ngrok搭的就不行吗,查看日志再调式,请求明明过去了,但ngrok要过一会才有日志,并且发出了警告

[09:45:05 CST 2019/04/14] [WARN] (ngrok/log.(*PrefixLogger).Warn:87) [pub:65f06d8f] [tcp://xxxx.com:8881] Copied 69719 bytes to pxy:60de645e before failing with error read tcp 888.16.204.4:8881->888.888.888.99:8888: read: connection reset by peer

ngrok在copy数据的时候发生了错误,那就应该是ngrok的锅了,但本人对ngrok不是非常了解,源码也是go,网上资料很少

最后换了一个使用frp来做内网穿透,正好之前就搭过frp服务器,马上跑起来测试了一下,效果不错,二维码再怎么点也不会有卡死的情况了。

frp项目地址

https://github.com/fatedier/frp/blob/master/README_zh.md

相关文章
|
1天前
|
安全 Java 程序员
Java多线程基础-17:简单介绍一下JUC中的 ReentrantLock
ReentrantLock是Java并发包中的可重入互斥锁,与`synchronized`类似但更灵活。
19 0
|
1天前
|
Java 程序员
Java多线程基础-16:简述Java并发编程JUC中的Callable接口
Callable接口是Java中用于描述带有返回值任务的接口,与Runnable相对,后者无返回值。Callable的call()方法用于执行具体任务并返回结果。
11 0
|
1天前
|
安全 算法 Java
Java多线程基础-15:Java 中 synchronized 的优化操作 -- 锁升级、锁消除、锁粗化
`synchronized`在Java并发编程中具有以下特性:开始时是乐观锁,竞争激烈时转为悲观锁;从轻量级锁升级至重量级锁;常使用自旋锁策略;是不公平且可重入的;不支持读写锁。
10 0
|
1天前
|
安全 Java 调度
Java多线程基础-14:并发编程中常见的锁策略(二)
这段内容介绍了互斥锁和读写锁的概念以及它们在多线程环境中的应用。互斥锁仅允许进入和退出代码块时加锁和解锁,而读写锁则区分读和写操作,允许多个线程同时读但写时互斥。
13 0
|
1天前
|
算法 安全 Java
Java多线程基础-14:并发编程中常见的锁策略(一)
乐观锁和悲观锁是并发控制的两种策略。悲观锁假设数据容易产生冲突,因此在读取时即加锁,防止其他线程修改,可能导致效率较低。
11 0
|
1天前
|
算法 Java
Java多线程基础-13:一文阐明死锁的成因及解决方案
死锁是指多个线程相互等待对方释放资源而造成的一种僵局,导致程序无法正常结束。发生死锁需满足四个条件:互斥、请求与保持、不可抢占和循环等待。避免死锁的方法包括设定加锁顺序、使用银行家算法、设置超时机制、检测与恢复死锁以及减少共享资源。面试中可能会问及死锁的概念、避免策略以及实际经验。
7 1
|
1天前
|
算法 安全 Java
Java多线程基础-12:详解CAS算法
CAS(Compare and Swap)算法是一种无锁同步原语,用于在多线程环境中更新内存位置的值。
9 0
|
1天前
|
Java
Java中如何定义一个线程工厂?
在Java中,线程工厂(ThreadFactory)用于自定义线程的创建,通过实现ThreadFactory接口可定义线程的属性和命名规则。示例代码展示了如何创建一个自定义线程工厂,如设置线程名称和优先级。使用时,通过线程工厂的`newThread()`方法创建并启动线程,便于统一管理和配置线程,满足特定需求。
7 0
|
1天前
|
存储 Java 调度
Java多线程基础-11:工厂模式及代码案例之线程池(二)
这篇内容介绍了Java多线程基础,特别是线程池中的定时器和拒绝策略。
11 0
|
1天前
|
设计模式 监控 Java
Java多线程基础-11:工厂模式及代码案例之线程池(一)
本文介绍了Java并发框架中的线程池工具,特别是`java.util.concurrent`包中的`Executors`和`ThreadPoolExecutor`类。线程池通过预先创建并管理一组线程,可以提高多线程任务的效率和响应速度,减少线程创建和销毁的开销。
15 2