MAT工具定位分析Java堆内存泄漏问题方法

简介: MAT,全称Memory Analysis Tools,是一款分析Java堆内存的工具,可以快速定位到堆内泄漏问题。该工具提供了两种使用方式,一种是插件版,可以安装到Eclipse使用,另一种是独立版,可以直接解压使用。

一、MAT概述与安装

MAT,全称Memory Analysis Tools,是一款分析Java堆内存的工具,可以快速定位到堆内泄漏问题。该工具提供了两种使用方式,一种是插件版,可以安装到Eclipse使用,另一种是独立版,可以直接解压使用。

我把独立版MAT安装包放到了网盘上,方便直接下载————

链接:https://pan.baidu.com/s/1CG887mHBcnVq3RxOzmxRvA

提取码:rhb5

独立版解压后,其内部文件是这样的——

这里有一个MemoryAnalyzer.ini文件,里面有一个Xmx参数,默认是-Xmx1024m,这代表MAT的最大内存大小,根据具体分析的dump文件大小来做适当调整。

点击MemoryAnalyzer.exe,启动完成后,即可以使用它来检查定位内存泄漏相关的问题了。


二、内存泄漏案例分析

下面,我会结合一个小案例来分享MAT的使用。

首先,用IDEA建立一个测试类——

public class example {
    public static void main(String[] args)  {
        List<User> list=new ArrayList<>();
        while (true){
            list.add(new User());
        }
    }
}
class User {
    private String name="demo";
    public User() {
    }
}

给这个测试类设置虚拟机参数,设置如:-Xms2m -Xmx2m -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=D:/local_system/git/demo/heapdump.hprof

这几个参数的意义是:

-Xms2m -Xmx2m:堆最小内存为2M,最大内存为2M。这里没有显示设置新生代大小,它会自动分配新生代大小,分配完剩下的,就是老年代大小了。

-XX:+HeapDumpOnOutOfMemoryError:指发生内存溢出的时候,会自动生成一个二进制的堆快照文件,这个快照文件以.hprof后缀结尾。用MAT分析堆内存信息,就是利用这个.hprof文件。除了可以设置相应的虚拟机参数外,还可以通过jmap指令来获取到某个进程的堆快照文件,执行指令格式是:

jmap -dump:format=b,file=<dumpfile.hprof> <pid>

例如:jmap -dump:format=b,file=20210618.dump 7132,那么,这里20210618.dump就是自定义的dump堆转储文件名字,而7132是进程ID。只是使用jmap指令可能有一点不好的地方是,内存溢出是某个时间点发生的事情,jmap指令去获取到dump文件,存在时间差问题。而HeapDumpOnOutOfMemoryError则是在发生内存溢出时,同时生成的,故而会更准确些。

-XX:HeapDumpPath=D:/local_system/git/demo/heapdump.hprof:内存溢出产生的堆快照自动存储路径,可以自定义指定路径。

其实,在实际生产环境里,除了这些基本参数外,还有其他的JVM参数,这些参数都是用来调优的重点所在。

这里暂且以这些参数做实验,在运行IDEA时,可以将这些参数设置在IDEA的“Run/Debug Configurations”弹出框的VM options输入框里,如下截图所示——

按照以上方式设置好后,就可以运行该案例代码了,运行一会儿后,就会出现以下提示——

这表明,该代码已经发生内存溢出了,即ArrayList存储的对象大小已经超过堆内存,导致无法进行垃圾回收,也就是出现内存泄漏,进而导致内存溢出。当然,在本地是可以看到这么简单的异常提示的,但是在线上服务器上,就没有那么明显的内存溢出提示,就需要获取到产生的堆快照dump文件,然后再进一步分析堆快照信息。


三、使用MAT分析堆转储dump文件

我们将这个heapdump.hprof文件导入到MAT里。启动MAT,点击File,选择Open Heap Dump,然后选择对应的hprof文件。 ![image](https://img2020.cnblogs.com/blog/1545382/202106/1545382-20210624185815985-572998625.png)

在弹出框处,选择Leak Suspects Report,这是指内存泄漏报告——

点击Finish后,展示Overview主页面如下——

Overview主页面显示应用程序内存使用情况的概览,中间的饼图按retained size来显示最大的对象。注意一点是,在MAT中,会有两种大小表示,一个是Retained size,还有一个是Shallow Size,那么,两者有什么区别呢?

  • Shallow Size:表示对象自身占用的内存大小,不包括它引用的对象。
  • Retained size:当前对象内存大小+当前对象直接或间接引用的对象大小,全部的总和,简单理解,就是当前对象被GC后,总共能释放的内存大小。

1.Details显示的是dump文件的情况,表示堆大小为1.1MB,有516个class,40.2k个Object,3个类加载器等;

2.功能视图模块;

3.报表模块;

我比较喜欢用Actions的Histogram视图和Reports的Leak Suspects报表,Histogram视图是以类为维度来显示其实例数和每个类的使用内存量,可以协助我们查询哪些类对象占用较大内存;Leak Suspects则可以协助分析内存泄漏的原因所在。

- Histogram视图

以Class Name为维度,分别展示各个类的对象数量,Shallow Size,Retained size。这里有一个疑惑是,Shallow Size和Retained size没有显示是以什么为单位的,它默认是以byte为单位的,若要显示地让单位展示出来,可以这样设置,点击Window->Preferences

选择最后一项,点击Apply and Close——

再重新打开Histogram视图,就会生效了,单位就显示出来了——

根据这个Histogram视图,我们可以发现,com.example.demo.User数量和占用内存大小都比较高,同时说明了该User对象一直没有被GC回收掉,这时,可以右击,弹出框有以下一些菜单选项——

  • List objects使用List Object可以查看对象引用关系,这里查看引用功能,包括本对象引用外部对象with outgoing references与外部对象引用本对象with incoming references。
  1. with outgoing references
    使用该功能,可以查看对象内部都引用了哪些外部对象,例如,这里的User,其引用外部对象情况如下:

    对照这个案例的代码,可见,在创建这个User对象时,内部属性name就会指向一个字符串地址,换言之,该User对象内部有个引用指向了一个name字符串地址。

  2. with incoming references
  • 使用该功能,可以查看该对象都被哪些外部所引用了——

在案例代码当中,是以list.add(User)来不断存储User对象的,如截图所示,通过MAT可确定,存在一个ArrayList集合一直引用该User对象。

在实际开发当中,一个对象可能引用了诸多其他外部对象或者被诸多外部对象所引用,若一直引用着,说明某个对象一直存在GC ROOT可达的情况,反过来就意味着,该被引用的对象一直无法被GC回收处理,那么就可能会一直存在堆内存里,进而造成内存泄漏的情况。

  • Merge Shortest Paths to GC Roots->exclude all phantom/weak/soft etc. references

排除其他引用,只观察GC路径上强引用的对象,所观察到的,都是仍存活的对象。

除此之外,Histogram视图仍有其他功能,后期在学习过程当中,不断进行完善。

- Leak Suspects报表

Leak Suspects报表很直观地展现了一个饼图,图中颜色深的部分表示可能存在内存泄漏的嫌疑。每一个模块都有对应的详情信息。

这里拿模块a来讲解,其详情部分有一句话很关键:The memory is accumulated in one instance of "java.lang.Object[]", loaded by "", which occupies 617.55 KB (52.54%) bytes.The stacktrace of this Thread is available. See stacktrace. See stacktrace with involved local variables.

这句话翻译过来就是,内存累积在一个“java.lang.Object[]”实例中,由“”加载,占用617.55 KB(52.54%)字节。此线程的堆栈跟踪可用。请参见stacktrace。请参阅包含局部变量的stacktrace。

点击stacktrace,进入到一个页面,可以看到日志信息——

在这里,从下往上看异常信息,可以快速定位内存泄漏地方出现在哪个类方法里的哪行代码。

我很喜欢使用这个功能,通过获取线上堆转储文件,便可以通过Leak Suspects定位到内存泄漏快速定位在哪一行代码。

目录
相关文章
|
9月前
|
人工智能 缓存 监控
使用LangChain4j构建Java AI智能体:让大模型学会使用工具
AI智能体是大模型技术的重要演进方向,它使模型能够主动使用工具、与环境交互,以完成复杂任务。本文详细介绍如何在Java应用中,借助LangChain4j框架构建一个具备工具使用能力的AI智能体。我们将创建一个能够进行数学计算和实时信息查询的智能体,涵盖工具定义、智能体组装、记忆管理以及Spring Boot集成等关键步骤,并展示如何通过简单的对话界面与智能体交互。
3429 1
|
10月前
|
安全 Java 编译器
new出来的对象,不一定在堆上?聊聊Java虚拟机的优化技术:逃逸分析
逃逸分析是一种静态程序分析技术,用于判断对象的可见性与生命周期。它帮助即时编译器优化内存使用、降低同步开销。根据对象是否逃逸出方法或线程,分析结果分为未逃逸、方法逃逸和线程逃逸三种。基于分析结果,编译器可进行同步锁消除、标量替换和栈上分配等优化,从而提升程序性能。尽管逃逸分析计算复杂度较高,但其在热点代码中的应用为Java虚拟机带来了显著的优化效果。
311 4
|
8月前
|
人工智能 监控 Java
Java与AI智能体:构建自主决策与工具调用的智能系统
随着AI智能体技术的快速发展,构建能够自主理解任务、制定计划并执行复杂操作的智能系统已成为新的技术前沿。本文深入探讨如何在Java生态中构建具备工具调用、记忆管理和自主决策能力的AI智能体系统。我们将完整展示从智能体架构设计、工具生态系统、记忆机制到多智能体协作的全流程,为Java开发者提供构建下一代自主智能系统的完整技术方案。
1031 4
|
9月前
|
人工智能 Java API
Java AI智能体实战:使用LangChain4j构建能使用工具的AI助手
随着AI技术的发展,AI智能体(Agent)能够通过使用工具来执行复杂任务,从而大幅扩展其能力边界。本文介绍如何在Java中使用LangChain4j框架构建一个能够使用外部工具的AI智能体。我们将通过一个具体示例——一个能获取天气信息和执行数学计算的AI助手,详细讲解如何定义工具、创建智能体并处理执行流程。本文包含完整的代码示例和架构说明,帮助Java开发者快速上手AI智能体的开发。
3384 8
|
8月前
|
存储 Java Go
【Java】(3)8种基本数据类型的分析、数据类型转换规则、转义字符的列举
牢记类型转换规则在脑海中将编译和运行两个阶段分开,这是两个不同的阶段,不要弄混!
363 2
|
8月前
|
设计模式 缓存 Java
【JUC】(4)从JMM内存模型的角度来分析CAS并发性问题
本篇文章将从JMM内存模型的角度来分析CAS并发性问题; 内容包含:介绍JMM、CAS、balking犹豫模式、二次检查锁、指令重排问题
213 1
|
8月前
|
Java Go 开发工具
【Java】(9)抽象类、接口、内部的运用与作用分析,枚举类型的使用
抽象类必须使用abstract修饰符来修饰,抽象方法也必须使用abstract修饰符来修饰,抽象方法不能有方法体。抽象类不能被实例化,无法使用new关键字来调用抽象类的构造器创建抽象类的实例。抽象类可以包含成员变量、方法(普通方法和抽象方法都可以)、构造器、初始化块、内部类(接 口、枚举)5种成分。抽象类的构造器不能用于创建实例,主要是用于被其子类调用。抽象类中不一定包含抽象方法,但是有抽象方法的类必定是抽象类abstract static不能同时修饰一个方法。
335 1
|
9月前
|
数据采集 存储 弹性计算
高并发Java爬虫的瓶颈分析与动态线程优化方案
高并发Java爬虫的瓶颈分析与动态线程优化方案
|
11月前
|
存储
阿里云轻量应用服务器收费标准价格表:200Mbps带宽、CPU内存及存储配置详解
阿里云香港轻量应用服务器,200Mbps带宽,免备案,支持多IP及国际线路,月租25元起,年付享8.5折优惠,适用于网站、应用等多种场景。
3248 0
|
11月前
|
存储 缓存 NoSQL
内存管理基础:数据结构的存储方式
数据结构在内存中的存储方式主要包括连续存储、链式存储、索引存储和散列存储。连续存储如数组,数据元素按顺序连续存放,访问速度快但扩展性差;链式存储如链表,通过指针连接分散的节点,便于插入删除但访问效率低;索引存储通过索引表提高查找效率,常用于数据库系统;散列存储如哈希表,通过哈希函数实现快速存取,但需处理冲突。不同场景下应根据访问模式、数据规模和操作频率选择合适的存储结构,甚至结合多种方式以达到最优性能。掌握这些存储机制是构建高效程序和理解高级数据结构的基础。
1061 1