【线上问题排查】内存泄漏排查(模拟真实环境)

简介: 【线上问题排查】内存泄漏排查(模拟真实环境)

内存泄漏

什么是内存泄漏?

内存泄露 Memory Leak,是指程序在申请内存后,无法释放已申请的内存空间,一次内存泄露危害可以忽略,但内存泄露堆积后果很严重,无论多少内存,迟早会被占光。

Memory Leak会最终会导致Out Of Memory!

模拟内存泄漏

写一段 ThreadLocal 模拟内存泄漏的代码。

/**
 * <p>
 *  模拟ThreadLocal内存泄露导致OOM
 *  JVM启动参数 -Xms20M -Xmx20M -Xmn10M
 * </p>
 */
    @GetMapping("/memoryLeak")
    public void memoryLeak() {
        // 是否调用remove方法
        boolean doRemove = false;
        // 加锁,让多个线程串行执行,避免多个线程同时占用内存导致的内存溢出问题
        final Object lockObj = new Object();
        // 开启20个线程
        ExecutorService executorService = Executors.newFixedThreadPool(20);
        // 为了不重复使用线程,用Map标记一下已经已使用过的线程,
        Map<Long, Integer> threadIdMap = new ConcurrentHashMap<>();
        // 循环向线程变量中设置数据 1024 * 1024 = 1M
        for (int i = 0; i < 20; i++) {
            executorService.execute(() -> {
                synchronized (lockObj) {
                    Integer num = threadIdMap.putIfAbsent(Thread.currentThread().getId(), 1);
                    if (num == null) {
                        ThreadLocal<Byte[]> threadLocal = new ThreadLocal<>();
                        threadLocal.set(new Byte[1024 * 1024]);
                        // 手工回收
                        System.gc();
                        try {
                            // 调用GC后不一定会马上回收
                            Thread.sleep(500);
                        } catch (InterruptedException e) {
                            e.printStackTrace();
                        }
                    }
                    System.out.println(Thread.currentThread().getName());
                }
            });
        }
    }
}

打包部署到服务器。并使用

nohup java -jar -Xms20M -Xmx20M -Xmn10M -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=./heapdump.hprof & 运行。

XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=./heapdump.hprof 参数

是为了发生OOM的时候会自动导出Dump文件


部署之后请求一下接口: http://localhost:8080/memoryLeak

服务器上出现报错信息

f4cb7cda9f29471388586d66018bce04.png

使用 jstat -gcutil 线程ID 1000 查看,FGC比较频繁,多半是有问题。

接下来我们开始排查

排查过程

打开 heapdump.hprof 文件


2ff817d1b2bc4182a2ec38a8da049ef1.png

文件还是有点大的

我们可以使用JDK自带的 Jvisualvm 打开文件

或者执行 jmap -histo:live 进程ID 查看内存中的存活对象

Byte[] 占用了空间的 46.7%,基本可以断定为是 Byte[] 没有被回收导致的内存泄漏

然后查看代码中使用到 Byte[] 地方的代码即可定位。

IDEA中可以使用 Ctrl + Shift +R 实现全局搜索

目录
相关文章
|
15天前
|
SQL 存储 监控
实用技巧:排查数据异常/数据波动问题,该如何下手?
在我做开发的这些年,让我很头痛的一类问题,不是线上故障,而是数据异常,不知道有没有程序员跟我感同身受。大多数的服务故障都有较为直观的异常日志,再结合产品表象,相对排查起来还有迹可循,但数据异常的原因就太多了,很多时候连报错日志都没有,排查起来简直无从下手。
实用技巧:排查数据异常/数据波动问题,该如何下手?
|
3月前
|
测试技术
线上环境漏测问题根因分析
线上环境漏测问题根因分析
|
3月前
|
监控 JavaScript C++
监控游戏c/c++的崩溃的解决方案
监控游戏c/c++的崩溃的解决方案
47 0
|
8月前
|
SQL 前端开发 测试技术
一次纯线上接口异常的排查过程
一次纯线上接口异常的排查过程
81 0
|
9月前
|
运维 监控 前端开发
记一次线上 bug 的排查分析过程及总结
记一次线上 bug 的排查分析过程及总结
记一次线上 bug 的排查分析过程及总结
|
消息中间件 运维 监控
线上踩坑记:项目中一次OOM的分析定位排查过程!
线上踩坑记:项目中一次OOM的分析定位排查过程!
|
消息中间件 监控 算法
JVM技术之旅-线上分析排查问题
JVM技术之旅-线上分析排查问题
265 0
JVM技术之旅-线上分析排查问题
|
SQL Java 数据库连接
线上运行的项目突然变得很卡如何排查?
线上运行的项目突然变得很卡如何排查?
|
SQL 存储 NoSQL
系统性能瓶颈排查技术总结
系统性能瓶颈排查技术总结
164 0
|
运维 监控 NoSQL
排查线上问题的9种方式
排查线上问题的9种方式
 排查线上问题的9种方式