V8 —— 你需要知道的垃圾回收机制

简介: V8 blog近日发布了文章描述了“并发标记”的新技术,提升标记过程的效率。 并发标记是一个主要用新的平行和并发的垃圾收集器替换旧的垃圾回收器的项目,现在Chrome 64和Node.js v10已经默认启用并发标记。讲解之前我们先回顾一下基本知识点。

前言

V8 blog近日发布了文章描述了“并发标记”的新技术,提升标记过程的效率。
并发标记是一个主要用新的平行和并发的垃圾收集器替换旧的垃圾回收器的项目,现在Chrome 64和Node.js v10已经默认启用并发标记。讲解之前我们先回顾一下基本知识点。


基本概念

弱分代假设(The Weak Generational Hypothesis)

  1. 多数对象的生命周期短
  2. 生命周期长的对象,一般是常驻对象
V8的GC也是基于假设将对象分为两代: 新生代和老生代。
对不同的分代执行不同的算法可以更有效的执行垃圾回收。


新生代与老生代

新生代包括一个New Space,老生代包括: Old Space, Code Space和Map Space,Large Object Space。
64位环境下的V8引擎的新生代内存大小32MB、老生代内存大小为1400MB,而32位则减半,分别为16MB和700MB。
对于新生代的对象,采用空间换取时间的Scavenge算法, 尽可能快的回收内存。如果对象经历了2次GC还依然坚挺,就会在第二次回收时晋升为老生代(准确的说是保存在Old Space中)。
而老生代的GC采取Mark-Sweep的算法,并使用Mark-Sweep解决内存碎片的问题。


Scavenge算法


对于新生代对象,采用Scavenge算法来回收。
简单来说,将内存的空间分为两个semispace,同一时刻只有一个空间处于使用中。使用中的叫做 to space,不被使用的叫做 from space。
分配对象时,先在From空间分配,垃圾回收时检查(宽度优先)From空间的存活对象,将存活对象复制到To空间,清理非存活对象,复制后,空间身份发生对调。


Mark-Sweep算法




处理老生代对象时,采用深度优先扫描,用三色标记的算法。
V8使用每个对象的两个mark-bits和一个标记工作栈来实现标记。
两个mark-bits编码三种颜色:白色(00),灰色(10)和黑色(11)。
白色表示对象可以回收,黑色表示对象不能回收,并且他的所有引用都被便利完毕了,灰色表示不可回收,他的引用对象没有扫描完毕。
扫描过程:
  1. 从已知对象开始,即roots(全局对象和激活函数), 将所有非root对象标记置为白色
  2. 将root对象的所有直接引用对象入栈(marking worklist)
  3. 依次pop出对象,出栈的对象标记为黑,同时将他的直接引用对象标记为灰色并push入栈
  4. 栈空的时候,仍然为白色的对象可以回收
  5. 回收白色的对象
在清除阶段,只清除没被标记的对象。
但是进行清除后,内存会出现不连续的状态,对后续的大对象分配地址造成无意义的回收(因为可用内存的不足),这时就需要Mark-Compact来处理内存碎片了。


Mark-Compact算法

在对象标记死亡后,在整理的过程中,将活着的对象向另一个内存页移动,移动完后内存页就可以还给操作系统,但如果这一页的活动对象被很多其他页的对象引用,就不会compact,因为移动完后更新其他引用的指针开销大。


全暂停与增量标记

垃圾回收的3种基本算法需要应用逻辑暂停下来,垃圾回收完后恢复应用程序逻辑,即“全暂停”,过长的停顿会让用户感到卡顿,所以为了降低全堆的垃圾回收,当堆的大小到一定程度后,开始增量GC,V8在标记阶段将标记的动作分为很多小“步进”,应用逻辑与垃圾回收交替进行直到标记阶段完成。
但是,对于过大的堆,GC在试图跟上应用程序分配速度的过程中,仍有长时间的停顿,并且应用程序需要通知GC对象图的所有变化,这些都是需要成本的(写保障 write-barrier)。
V8使用Dijkstra-style 的写屏障(write-barrier)来实现通知。
当object.field = value in JavaScript时,V8会插入以下代码:


// Called after `object.field = value`.
write_barrier(object, field_offset, value) {
  if (color(object) == black && color(value) == white) {
    set_color(value, grey);
    marking_worklist.push(value);
  }
}

write-barrier可以保障不会出现黑色对象指向了白色对象的现象发生(强三色不变形 strong tri-color invariant),这样应用程序不会在GC时误删活动对象。在GC完成后所有白色对象都是可安全删除的。
但是,由于write-barrier的损耗,降低了应用程序的吞吐量,所以需用其他的worker threads提高吞吐量,使worker threads也可以进行标记的工作。这就是下面要讲的平行标记和并发标记。


平行标记 parallel marking

平行标记期间,应用程序暂停,main thread和worker thread共同执行标记操作,下图显示了平行标记所涉及的数据结构。箭头指示数据流的方向。
其中,对象图是只读的,不允许去修改他,Mark-bits和Marking worklist是可以读和写的。
Marking worklist负责决定分给其他worker thread的工作量,决定了性能与保持本地线程的均衡,所以如何高效地完成工作的分配至关重要。
如下图所示,V8使用基于内存段的方式去平衡各个线程的工作量,避免线程同步的耗时与尽可能的工作。


并发标记 concurrent marking

并发标记允许标记行为与应用程序同时进行。这就需要解决数据竞争的问题,比如JS代码在更改一个对象的字段,而worker thread又在标记字段,就可能导致错误的垃圾回收。
所以main thread需要与worker threads在发生数据竞争时进行同步,大多数的数据竞争行为通过轻量级的原子级内存访问就可以同步,但是一些特殊的场景需要独占整个对象的访问。


优化的结果

有了平行标记与并发标记后,对比上面讲的流程,GC的流程变为:
  1. 从root对象开始扫描,填充对象到marking worklist
  2. 分布并发标记任务到worker threads
  3. worker threads帮助main thread去更快地消费marking worklist中的对象
  4. main thread 偶尔会通过执行bailout worklist 和 marking worklist来marking
  5. 一旦marking worklists为空,main thread 就完成GC行为
  6. 在结束之前,main thread重新扫描roots,可能会发现其他的白色节点,这些白色节点会在worker threads的帮助下,被平行标记


参考文献:


原文发布时间为:2018年07月02日
本文作者: nanchenk
本文来源:掘金  如需转载请联系原作者
相关文章
|
8月前
|
算法 Java
JVM垃圾回收机制
JVM垃圾回收机制
48 0
|
8月前
|
Java 程序员
探讨JVM垃圾回收机制与内存泄漏
探讨JVM垃圾回收机制与内存泄漏
|
8月前
|
存储 缓存 算法
JVM的垃圾回收机制
JVM的垃圾回收机制
|
2月前
|
JavaScript 前端开发 Java
垃圾回收机制会导致内存泄漏吗?
【10月更文挑战第29天】虽然JavaScript的垃圾回收机制本身是为了有效地管理内存,但开发者在编写代码时需要注意上述这些可能导致内存泄漏的情况,遵循良好的编程习惯,及时释放不再使用的资源,以确保程序能够高效地利用内存资源,避免出现内存泄漏问题。
|
8月前
|
人工智能 Java 数据库连接
【C#】浅谈C#中垃圾回收机制
【C#】浅谈C#中垃圾回收机制
|
4月前
|
监控 算法 Java
深入理解Java中的垃圾回收机制(GC)
本文将探讨Java的自动内存管理核心——垃圾回收机制。通过详细解析标记-清除算法、复制算法和标记-整理算法等常用垃圾回收算法,以及CMS、G1等常见垃圾回收器,帮助读者更好地理解Java应用的性能优化和内存管理。同时,探讨分代收集、分区收集等策略在实际项目中的应用。结语部分总结了垃圾回收机制在Java开发中的重要性,并展望了未来可能的发展。
100 0
|
8月前
|
算法 Java
垃圾回收机制
垃圾回收是自动内存管理机制,用于检测和回收不再使用的内存资源,防止泄漏和浪费。主要算法包括:标记-清除、引用计数(难以处理循环引用)、分代回收(基于对象生命周期)、增量回收(减少应用停顿时间)和并发回收(同时执行回收和应用)。不同语言和环境选择不同策略,垃圾回收性能直接影响程序内存管理和执行效率。
|
8月前
|
存储 缓存 监控
Java内存管理:垃圾回收与内存泄漏
【4月更文挑战第16天】本文探讨了Java的内存管理机制,重点在于垃圾回收和内存泄漏。垃圾回收通过标记-清除过程回收无用对象,Java提供了多种GC类型,如Serial、Parallel、CMS和G1。内存泄漏导致内存无法释放,常见原因包括静态集合、监听器、内部类、未关闭资源和缓存。内存泄漏影响性能,可能导致应用崩溃。避免内存泄漏的策略包括代码审查、使用分析工具、合理设计和及时释放资源。理解这些原理对开发高性能Java应用至关重要。
111 5
|
8月前
|
算法 Java PHP
JVM 的垃圾回收机制以及垃圾回收算法的详解
JVM 的垃圾回收机制以及垃圾回收算法的详解
59 0
|
8月前
|
存储 算法 Java
了解Java内存管理与垃圾回收机制
了解Java内存管理与垃圾回收机制
57 0