JVM是如何判定对象为垃圾的(可达性分析算法)

简介: 被判定为垃圾的对象或者内存区域会被垃圾收集器回收。那么什么样的对象或者内存区域会被判定为垃圾呢?下面就要说起经常作为垃圾判定依据的可达性分析算法与引用计数法了。这两种算法,都是经常被用作垃圾判定的算法,下面说下这两种算法。

前言:被判定为垃圾的对象或者内存区域会被垃圾收集器回收。那么什么样的对象或者内存区域会被判定为垃圾呢?下面就要说起经常作为垃圾判定依据的可达性分析算法引用计数法了。这两种算法,都是经常被用作垃圾判定的算法,下面说下这两种算法。


一.引用计数法


为对象添加一个引用计数器,当有一个对象引用了该对象时,引用计数器就加一,当引用失效时引用计数器就减一,当引用计数器的值为零时,就说明该对象变成了垃圾。


二.可达性分析算法


从一系列被称为“GC Roots”的节点集根据引用关系向下搜索,搜索过程所走过的路径被称为引用链(Reference Chain),如果某个对象到GC Roots之间没有任何引用链,或者用图论的方式来说GC Roots到这个对象不可达时,则证明该对象是不可达的,但此时并不能判定该对象是垃圾,只能说该对象不可达。判定一个对象为垃圾,要经过以下步骤:


20210220170210751.png


如上图①:第一步使用可达性分析算法判断GC Roots到对象之间是否还有引用链,有则存活,没有引用链则对对象进行第一次标记。


如上图②:第二步判断被标记的对象是否有重写finalize()方法,若该方法已经重写过且被执行过或者未重写该方法则对象判断为死亡,否则将对象放入F-Queue队列中,稍后JVM会启动一个低调度优先级的Finalize线程去执行F-Queue队列中的各个对象的finalize()方法。


如上图③:第三步在执行各个对象的finalize()方法时,是各个对象完成自我救赎,不被判定为垃圾的最后机会,如果在finalize()方法中当前对象成功与GC Roots建立了引用链。则会判定为存活,否则会被进行第二次标记,被两次标记的对象就是被判定为死亡的对象,在下次垃圾回收时,会被垃圾收集器回收掉。


三.看到这里肯定大部分都是这个疑问?GC Roots是什么?凭什么用他判定对象是否可达?

1.GC Roots是什么?


GC Roots就是一组可以作为访问根节点的一组对象集,常见的GC Roots有以下这些
①在虚拟机栈(局部变量表)中引用的对象。

②方法区中静态属性引用的对象(JDK8之后静态变量在堆中)。

③方法区中常量引用的对象(这里指运行时常量池中的常量)。

④本地方法中JNI(Native方法)引用的变量。

⑤JVM内部的引用,如基本数据类型对应的Class对象等。


2.凭什么用他们判定对象是否可达?


分析前四种可以作为GC Roots的对象可以发现,他们都有一个特征,这些对象的引用都存在堆内存以外,那为什么不是只存在堆中的对象作为GC Roots呢?因为只存在堆中的对象,比如实例变量,他的最终调用者肯定还是前四种对象(这里可以仔细思考下之前写过的代码)。那这四种常见的可以作为GC Roots的对象,其实就是最常见的引用调用的最外层结构。所以他们作为根节点,向下搜索引用关系是合理的。


四. 我们使用的虚拟机使用哪种算法判定垃圾?


我们最常用的虚拟机HotSpot一直使用的都是可达性分析算法,那为什么HotSpot不使用引用计数法呢?分析下这两种算法的优缺点。


引用计数法


优点是判定效率高,缺点是占用一定内存,最重要的缺点就是无法解决相互引用的问题,当对象相互引用时,引用计数器的值最少也是1.如下方代码所示

objA.instance = objB;
objB.instance = objA;
objA = null;
objB = null;


当我们使用objA=null;objB=null;以后分别各有1个引用指向objA,objB。采用引用计数法这两个引用是无法消除的,因为 objA.instance失效需要先让objA失效,objA失效需先让objB.instance失效(因为objB.instance指向objA),objB.instance想要失效需要objB失效,objB失效需要先让objA.instance失效(因为objA.instance指向objB),所以这样就陷入了死循环,导致objA、objB的引用计数器一直都是1,便无法被虚拟机回收,这也就是引用计数法的最大弊端。 如下图:


20210224100343239.png



1.可达性分析算法:
优点是不必为每个对象都分配一小块内存用以存储引用计数,能轻松解决相互引用等其他场景。缺点也是相对于引用计数来说的,判定效率不如引用计数法


五.说引用必须说下java中的强引用、软引用、弱引用、虚引用(从左到右引用关系由强到弱)。


强、软、弱、虚出现的背景:如果栈中的reference中存储的是代表另一块内存或对象的起始地址,我们称reference代表某个内存或某个对象的引用,这种对对象的定义并没有什么不对,只是随着JDK版本的不断更新,这种定义已经有些狭义了,比如对于那些比较鸡肋的对象只使用这种方式定义就显得不足,因此引入了强引用、软引用、弱引用、虚引用等用来描述不同场景下的对象引用。


1.强引用:强引用指的是最传统的引用定义,指的是我们在写java代码时最常用的一种引用赋值,如Object obj = new Object();这也是强、软、弱、虚定义之前定义引用的方式。


何时回收强引用?


强引用的引用本身就是可以作为GC Root的存在,所以只要引用关系存在,那么强引用就一直不会被回收,所以在不使用时置null即可。


2.软引用:软引用用来描述那些还有用,但是非必须的对象,使用SoftReference来修饰对象,使用get方法可以获得被弱软引用引用的对象,定义时如下:


Object obj = new Object();
String str = "abc";
SoftReference<String> sf = new SoftReference<String>(str);
String strRefe =  sf.get();
System.out.println(strRefe);
输出结果:
abc
Process finished with exit code 0


何时回收软引用?


jvm会在内存吃紧时,会尝试去清理软引用,但是不一定会能回收的了软引用的对象,jvm只是在即将OOM时会去尝试清理堆中的软引用对象,如果清除不了还是会报OOM的。如果有人看到过这种说法“jvm会在内存溢出前,清空软引用引用的对象”,请知晓,这是错误的,下面验证下这种错误的说法(因为很多人这么说),代码如下:


import java.lang.ref.SoftReference;
import java.util.ArrayList;
import java.util.List;
public class TestHeapOom {
  static class OOMObject{
      String name;
      public OOMObject(String name){
          this.name = name;
      }
  }
  // 虚拟机配置:-Xmx10M -Xms10M
  public static void main(String[] args){
      int n =0;
      List<OOMObject> list = new ArrayList<OOMObject>();
      SoftReference<List<OOMObject>> sr = new SoftReference<List<OOMObject>>(list);
      System.out.println(sr.get().size());
      while (true){
            list.add(new OOMObject("a"+n));
          System.out.println(sr.get().size());
      }
  }
}


上方程序是用软引用关联一个list,然后建立一个循环不断的往list中加入对象,这种情况10M的堆内存很快会用光,正常情况下内存溢出,会报OOM:Java heap space,这里输出如下展示:


106280
106281
106282
106283
106284
106285
Exception in thread "main" java.lang.OutOfMemoryError: GC overhead limit exceeded
   at java.lang.AbstractStringBuilder.<init>(AbstractStringBuilder.java:68)
   at java.lang.StringBuilder.<init>(StringBuilder.java:89)
   at sgcc.supplier.pojo.model.queues.TestHeapOom.main(TestHeapOom.java:23)
Process finished with exit code 1


很显然这里并没有抛出OOM:Java heap space,而是抛出的OOM:GC overhead limit exceeded(不是必现),为什么抛出的是这个呢?首先解释下这个错误的意思,该错误表示cpu98%的时间都在做内存回收,但是回收到的内存依然很小,不足以支撑系统使用,系统即将崩溃。就会报这种问题,介绍软引用时已经说明了,软引用会在内存溢出之前被尝试回收,因为在上面的例子中内存即将溢出,jvm便在一直尝试回收软引用list,但是list仍是可达状态,回收不了,但系统又一直尝试软引用,便出现了这个错误:OOM:GC overhead limit exceeded。所以说“jvm会在内存溢出前,清空软引用引用的对象”这种说法是错误的,回不回收软引用对象最终依据还是可达性分析算法,jvm只是会在内存紧张时尝试回收软引用的对象。,换一种说法“jvm会在内存溢出前,清空只被软引用引用的对象”这种说法就是正确的。验证代码如下:


import java.lang.ref.SoftReference;
import java.util.ArrayList;
import java.util.List;
public class TestHeapOom {
  static class OOMObject{
      String name;
      public OOMObject(String name){
          this.name = name;
      }
  }
  // 虚拟机配置:-Xmx10M -Xms10M -XX:+UseSerialGC
  public static void main(String[] args){
      int n =0;
      //List<OOMObject> list = new ArrayList<OOMObject>();
      SoftReference<List<OOMObject>> sr = new SoftReference<List<OOMObject>>(new ArrayList<OOMObject>());
      while (true){
          sr.get().add(new OOMObject("a"+n));
          System.out.println(sr.get().size());
      }
  }
}

从上方的程序中,可以轻易的看出新创建出的ArrayList对象只被软引用关联了,除了软引用没有其他的引用关联,运行结束产生如下日志,报出的是空指针,所以在垃圾回收时,这个只被软引用关联的对象是被清空了的。另外从另一个角度也可以解释为什么只被软引用关联的对象会被清空:判定对象是否是垃圾的依据是可达性分析算法,可达性分析算法中的要求GC Roots到对象之间有引用链才说明对象可达,而软引用是不能作为GC Roots的。


132782
132783
132784
132785
132786
132787
132788
132789
132790
132791
132792
132793
Exception in thread "main" java.lang.NullPointerException
  at sgcc.supplier.pojo.model.queues.TestHeapOom.main(TestHeapOom.java:22)
Process finished with exit code 1


3.弱引用:弱引用被用来描述那些非必须的对象,java中使用WeakReference来描述弱引用,使用get方法可以获得被弱引用引用的对象。弱引用的使用方法如下:


String str = "abc";
WeakReference<String> wf = new WeakReference<String>(str);
String strRew = wf.get();
System.out.println(strRew);


何时回收弱引用?


弱引用对象在下次垃圾回收时系统会尝试进行回收,如果对象不可达就会被回收掉,对象如果是可达状态依然不会回收,验证代码如下:


import java.lang.ref.WeakReference;
import java.util.ArrayList;
import java.util.List;
public class TestHeapOomWeak {
  static class OOMObject{
      String name;
      public OOMObject(String name){
          this.name = name;
      }
  }
  // 虚拟机配置:-Xmx10M -Xms10M
  public static void main(String[] args){
      int n =0;
      List<OOMObject> list = new ArrayList<OOMObject>();
      WeakReference<List<OOMObject>> wr = new WeakReference<List<OOMObject>>(list);
      System.out.println(wr.get().size());
      while (true){
          list.add(new OOMObject("a"+n));
          System.out.println(wr.get().size());
      }
  }
}


输出结果如下,可见系统一直在进行垃圾回收,即将崩溃,但是引用却没有失效,所以弱引用并不在垃圾回收时一定被回收(这里这么解释是因为很多人说会在下一次垃圾回收时回收掉)回不回收弱引用对象最终依据还是可达性分析算法,jvm只是会在下一次GC时尝试回收弱引用


106273
106274
106275
106276
106277
106278
106279
106280
106281
Exception in thread "main" java.lang.OutOfMemoryError: GC overhead limit exceeded
   at java.lang.Integer.toString(Integer.java:401)
   at java.lang.String.valueOf(String.java:3099)
   at java.io.PrintStream.print(PrintStream.java:597)
   at java.io.PrintStream.println(PrintStream.java:736)
   at sgcc.supplier.pojo.model.queues.TestHeapOomWeak.main(TestHeapOomWeak.java:25)
Process finished with exit code 1


但是如果某个对象只被弱引用引用了,那下一次垃圾回收就会把该对象回收掉。验证代码如下:


import java.lang.ref.WeakReference;
import java.util.ArrayList;
import java.util.List;
public class TestHeapOomWeak {
  static class OOMObject{
      String name;
      public OOMObject(String name){
          this.name = name;
      }
  }
  public static void main(String[] args){
      int n =0;
      //List<OOMObject> list = new ArrayList<OOMObject>();
      WeakReference<List<OOMObject>> wr = new WeakReference<List<OOMObject>>(new ArrayList<OOMObject>());
      System.out.println(wr.get().size());
      while (true){
          wr.get().add(new OOMObject("a"+n));
          System.out.println(wr.get().size());
      }
  }
}


如下方所示,输出变成了空指针,而不是OOM,因为在GC后只被弱引用关联的对象被回收了,后面通过弱引用get的对象就成了null,便报了空指针。


28532
28533
28534
28535
Exception in thread "main" java.lang.NullPointerException
   at sgcc.supplier.pojo.model.queues.TestHeapOomWeak.main(TestHeapOomWeak.java:24)
Process finished with exit code 1


4.虚引用:又被称为灵幻引用,使用PhantomReference定义虚引用,使用get方法得到的永远是null,同时虚引用定义时必须传入一个ReferenceQueue 队列,对象被清理时,该对象的引用会被放入该队列中,被虚引用关联的对象无法通过get方法获得该对象的实例(软引用,弱引用都可以)所以只被虚引用关联的对象其实立马就会被回收掉,虚引用的声明方式如下


String str = "abc";
ReferenceQueue rq = new ReferenceQueue();
PhantomReference<String> pf = new PhantomReference<String>(str,rq);
System.out.println(pf.get());


相关文章
|
6天前
|
存储 算法 安全
基于哈希表的文件共享平台 C++ 算法实现与分析
在数字化时代,文件共享平台不可或缺。本文探讨哈希表在文件共享中的应用,包括原理、优势及C++实现。哈希表通过键值对快速访问文件元数据(如文件名、大小、位置等),查找时间复杂度为O(1),显著提升查找速度和用户体验。代码示例展示了文件上传和搜索功能,实际应用中需解决哈希冲突、动态扩容和线程安全等问题,以优化性能。
|
15天前
|
缓存 算法 搜索推荐
Java中的算法优化与复杂度分析
在Java开发中,理解和优化算法的时间复杂度和空间复杂度是提升程序性能的关键。通过合理选择数据结构、避免重复计算、应用分治法等策略,可以显著提高算法效率。在实际开发中,应该根据具体需求和场景,选择合适的优化方法,从而编写出高效、可靠的代码。
26 6
|
2月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
68 1
|
2月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
97 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
|
3月前
|
并行计算 算法 IDE
【灵码助力Cuda算法分析】分析共享内存的矩阵乘法优化
本文介绍了如何利用通义灵码在Visual Studio 2022中对基于CUDA的共享内存矩阵乘法优化代码进行深入分析。文章从整体程序结构入手,逐步深入到线程调度、矩阵分块、循环展开等关键细节,最后通过带入具体值的方式进一步解析复杂循环逻辑,展示了通义灵码在辅助理解和优化CUDA编程中的强大功能。
|
3月前
|
算法
PID算法原理分析
【10月更文挑战第12天】PID控制方法从提出至今已有百余年历史,其由于结构简单、易于实现、鲁棒性好、可靠性高等特点,在机电、冶金、机械、化工等行业中应用广泛。
|
1天前
|
算法 数据安全/隐私保护
室内障碍物射线追踪算法matlab模拟仿真
### 简介 本项目展示了室内障碍物射线追踪算法在无线通信中的应用。通过Matlab 2022a实现,包含完整程序运行效果(无水印),支持增加发射点和室内墙壁设置。核心代码配有详细中文注释及操作视频。该算法基于几何光学原理,模拟信号在复杂室内环境中的传播路径与强度,涵盖场景建模、射线发射、传播及接收点场强计算等步骤,为无线网络规划提供重要依据。
|
14天前
|
机器学习/深度学习 算法
基于改进遗传优化的BP神经网络金融序列预测算法matlab仿真
本项目基于改进遗传优化的BP神经网络进行金融序列预测,使用MATLAB2022A实现。通过对比BP神经网络、遗传优化BP神经网络及改进遗传优化BP神经网络,展示了三者的误差和预测曲线差异。核心程序结合遗传算法(GA)与BP神经网络,利用GA优化BP网络的初始权重和阈值,提高预测精度。GA通过选择、交叉、变异操作迭代优化,防止局部收敛,增强模型对金融市场复杂性和不确定性的适应能力。
149 80
|
2天前
|
机器学习/深度学习 数据采集 算法
基于GA遗传优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
本项目基于MATLAB2022a实现时间序列预测,采用CNN-GRU-SAM网络结构。卷积层提取局部特征,GRU层处理长期依赖,自注意力机制捕捉全局特征。完整代码含中文注释和操作视频,运行效果无水印展示。算法通过数据归一化、种群初始化、适应度计算、个体更新等步骤优化网络参数,最终输出预测结果。适用于金融市场、气象预报等领域。
基于GA遗传优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
|
2天前
|
算法
基于龙格库塔算法的锅炉单相受热管建模与matlab数值仿真
本设计基于龙格库塔算法对锅炉单相受热管进行建模与MATLAB数值仿真,简化为喷水减温器和末级过热器组合,考虑均匀传热及静态烟气处理。使用MATLAB2022A版本运行,展示自编与内置四阶龙格库塔法的精度对比及误差分析。模型涉及热传递和流体动力学原理,适用于优化锅炉效率。