导言
Java服务,有时候会遇到CPU 100%的问题,对于这样的问题,我们如何快速定位并解决呢?一般会有如下三个步骤:
- 找到最耗CPU的进程
- 找到这个进程中最耗CPU的线程
- 使用jdk自带工具jstack 查看堆栈信息,定位线程的什么操作消耗了大量CPU,定位对应代码
一、找到最耗CPU的进程
通过top
命令查看进程的cpu占用情况,运行top命令后再键入P(大写p)(或者是 shift + p ),进程会按照CPU使用率排序,如下图:
由上图可以看到,最耗CPU的进程PID为2601,CPU使用率达到了100%
二、找到这个进程中最耗CPU的线程
可以使用top命令:top -Hp ${进程的PID}
也可以使用ps命令:ps -mp ${进程的PID} -o THREAD,tid,time
-p
:指定特定的pid进程号进行观察-H
:
我们以top命令为例:top -Hp 2601
运行以上命令后再键入P(大写p)
,线程会按照CPU使用率排序
,如下图:
可以看到进程2601的最耗CPU的线程PID为2611,CPU使用率达到了99.9%
三、查看堆栈信息,定位线程的什么操作消耗了大量CPU,定位对应代码
堆栈里,线程id是用16进制表示的,所以需要将线程PID转化为16进制
(也可以用在线进制转换的网站直接转换):
printf "%x" 2611
输出:a33
打印进程堆栈信息(注意2601是进程的PID),通过线程id,过滤得到线程堆栈:jstack 2601 | grep a33 -A 20
输出的信息如下:
由此可以看到,最耗CPU的代码为CpuUseTest.java代码中的第9行,也就是执行无限循环的代码块所在的位置。
直此导致该应用CPU偏高的问题,被成功定位。
四、查看堆栈信息中遇到的问题
刚开始查看堆栈信息的时候,使用了如下命令(请跟上面的命令对比一下,看看有什么不同):jstack 2611 | grep a33 -A 20
结果报错:
是的,我把该写进程PID的地方,写成了线程PID,找了一圈,才解决这个问题,也耗费了不少时间。