因死循环导致CPU飙升到100%的问题排查记录

简介: 因死循环导致CPU飙升到100%的问题排查记录

背景

突然收到运维告警邮件,线上的一台负责处理定时任务的服务器CPU飙升到了100%,立马放下手头工作开始了紧张的排查工作。

之前也写过一篇文章JVM调优之Java进程消耗CPU过高

过程

1、确定Java应用进程编号

使用 jpsps -ef|grep java 命令确定想要分析的应用的进程编号

2、查看Java应用中线程CPU占比

使用top -p 109023 -H 命令查看指定进程下的线程cpu占用比例,分析是具体哪个线程占用率过高,其中 109023 就是通过第一步确定下来的进程编号

从top命令列出来的线程信息中找出对应占用cpu很高的线程,并将线程号转化为十六进制的形式

printf "%x\n" 201106 得到对应的十六进制31192

3、查看线程信息

从中选择占比较高的线程的编号(PID),并将该PID转换为16进制。通过jstack 109023 |grep 31192

通过该命令可以分析出线程的具体信息,再通过相应的解决方法来解决cpu占用过高的问题。

结果

最终排查发现是之前有个人在定时任务这里埋了一个坑,导致了死循环而引发的问题,代码大致如下

public static void main(String[] args) {
        int beginId = 1;
        // 1.查出来所有需要处理的流水信息
        List<Phone> needHandlePhoneList = listNeedHandlePhone(beginId);
        if (needHandlePhoneList.size() == 0){
            return;
        }
        // 2.开始处理
        while (needHandlePhoneList.size() > 0){
            // 执行逻辑...
            // bug:总数数据库中只有3条待处理记录,第一次查出3条,最后一条的id是3,那么此处的beginId便为3
            beginId = needHandlePhoneList.get(needHandlePhoneList.size()-1).getId();
            // bug:上面查出来的beginId是3,在按照>=3去是数据库中查询,还是会查到一条记录,如此needHandlePhoneList始终不为空,产生死循环
            needHandlePhoneList = listNeedHandlePhone(beginId);
        }
    }
    private static List<Phone> listNeedHandlePhone(int beginId) {
        /**
         * select * from phone where id >= #{beginId} order by id limit 100
         *
         * >= 存在问题,与外部逻辑配合会产生死循环,需改成>
         */
        return initPhoneList();
    }

 

本篇文章如有帮助到您,请给「翎野君」点个赞,感谢您的支持。

目录
相关文章
|
8月前
|
设计模式 监控 安全
如何定位当生产环境CPU飙升的时候的问题
在当今的信息化时代,计算机系统在各行各业都发挥着重要的作用。然而,当生产环境中的CPU飙升时,系统性能会受到影响,甚至导致整个系统瘫痪。这不仅会对企业造成经济损失,还会对用户体验造成严重影响。因此,如何定位并解决生产环境中CPU飙升的问题,已成为众多企业和开发人员亟待解决的问题之一。本文旨在探讨如何定位生产环境中CPU飙升的问题,并提供相应的解决方案。通过了解CPU飙升的原因、定位方法以及解决方案,企业和开发人员可以更好地应对生产环境中出现的CPU飙升问题,提高系统性能和用户体验。
150 1
|
8月前
|
监控 Java 索引
cpu使用率过高和jvm old占用过高排查过程
cpu使用率过高和jvm old占用过高排查过程
185 2
|
5月前
|
小程序 JavaScript Java
【Java】服务CPU占用率100%,教你用jstack排查定位
本文详细讲解如何使用jstack排查定位CPU高占用问题。首先介绍jstack的基本概念:它是诊断Java应用程序线程问题的工具,能生成线程堆栈快照,帮助找出程序中的瓶颈。接着,文章通过具体步骤演示如何使用`top`命令找到高CPU占用的Java进程及线程,再结合`jstack`命令获取堆栈信息并进行分析,最终定位问题代码。
452 1
【Java】服务CPU占用率100%,教你用jstack排查定位
|
5月前
|
监控 安全 算法
在Linux中,cpu使用率过高可能是什么原因引起的?排查思路是什么?
在Linux中,cpu使用率过高可能是什么原因引起的?排查思路是什么?
|
5月前
|
消息中间件 Java 调度
一次线上服务CPU100%的排查过程
文章记录了一次线上服务CPU使用率达到100%的排查过程,通过使用top命令和jstack工具确定了导致高CPU使用的线程,并分析了Disruptor组件的不当配置是问题原因,通过修改组件的策略成功解决了问题。
110 0
|
5月前
|
Java
靠这三步就能排查CPU占用100%?
靠这三步就能排查CPU占用100%?
191 0
|
6月前
|
Java
手把手教你java CPU飙升300%如何优化
手把手教你java CPU飙升300%如何优化
70 0
|
6月前
|
监控 Java 中间件
FGC频繁导致CPU 飙升定位及JVM配置优化总结
FGC频繁导致CPU 飙升定位及JVM配置优化总结
207 0
|
6月前
|
缓存 弹性计算 监控
云服务器 CPU 使用率高的问题排查与优化
云服务器 CPU 使用率高的问题排查与优化
466 0
|
8月前
|
监控 数据可视化 Java
Elasitcsearch CPU 使用率突然飙升,怎么办?
Elasitcsearch CPU 使用率突然飙升,怎么办?
156 1

相关实验场景

更多