JVM工作原理与实战(三十八):JIT即时编译器原理

简介: JVM作为Java程序的运行环境,其负责解释和执行字节码,管理内存,确保安全,支持多线程和提供性能监控工具,以及确保程序的跨平台运行。本文主要介绍了JIT即时编译器、HotSpot中的JIT编译器、JIT优化技术、JIT优化建议等内容。

一、JIT即时编译器

在Java编程环境中,即时编译器(JIT, Just-In-Time Compiler)是一项核心技术,旨在显著提高应用程序代码的执行效率。Java虚拟机(JVM)通常首先解释执行字节码指令,但随着时间的推移,它会识别出那些频繁执行的代码段,这些被称为“热点代码”。JIT编译器会针对这些热点代码进行优化编译,将它们从字节码形式转换为高效的本地机器码。这一转换过程还包括一系列优化步骤,以进一步提高代码的性能。一旦编译完成,这些优化后的机器码就会被保存在内存中,以便在未来执行时能够直接从内存中读取并运行在计算机的硬件上,从而避免了解释执行带来的额外开销。这种即时编译和优化的方式使得Java应用程序能够在运行时达到接近原生代码的性能水平。

image.gif

二、HotSpot中的JIT编译器

在 HotSpot 虚拟机中,C1、C2 和 Graal 是三款不同的即时(Just-In-Time, JIT)编译器。它们的主要目标是提高代码的运行效率,但每个编译器在实现这一目标时采用了不同的策略和优化级别。

C1 编译器

  • 特点:C1 编译器的主要特点是编译速度快,但优化程度相对较低。
  • 适用场景:因此,它更适合执行时间较短、对编译速度要求较高的代码段,例如启动时的类加载和初始化过程。
  • 优化与取消优化:C1 的优化策略相对简单,它主要关注基本的性能提升,如方法内联、类型检查消除等。由于它更注重编译速度,所以在某些情况下,它可能会编译一些不那么优化的代码,以便尽快完成编译任务。取消优化的概念在这里并不明显,因为 C1 的主要目标是快速编译而不是深度优化。

C2 编译器

  • 特点:C2 编译器与 C1 相反,它更注重深度优化,以提高代码的长期运行性能。
  • 适用场景:因此,它更适合处理服务端程序中那些长期运行且需要更高性能的代码。
  • 优化与取消优化:C2 编译器采用了更为复杂的优化策略,包括高级方法内联、逃逸分析、循环展开、类型剖析等。这些优化可以显著提高代码的运行效率,尤其是在长期运行的程序中。然而,在某些情况下,过度的优化可能会导致代码膨胀(即编译后的代码体积增大),从而影响性能。因此,C2 编译器也会根据代码的运行情况和性能反馈来进行“取消优化”,即撤销一些不太必要或导致性能下降的优化。

C1 和 C2 编译器在优化和取消优化方面有着不同的侧重点。C1 更注重编译速度,而 C2 更注重深度优化。在实际运行中,HotSpot 虚拟机还会根据代码的运行情况和性能反馈来动态选择使用哪个编译器或进行哪些优化。

image.gif

自JDK 7版本起,HotSpot引入了分层编译机制,该机制使得C1和C2编译器能够协同工作,共同提升代码性能。在分层编译中,整个优化过程被划分为五个不同的等级,每个等级对应着不同的编译策略和优化级别。

等级 使用的组件 描述 保存的内容 性能分数(1 - 5)
0 解释器 解释执行记录方法调用次数及循环次数 1
1 C1即时编译器 C1完整优化 优化后的机器码 4
2 C1即时编译器 C1完整优化,记录方法调用次数及循环次数

优化后的机器码;

部分额外信息:方法调用次数及循环次数

3
3 C1即时编译器 C1完整优化,记录所有额外信息

优化后的机器码;

所有额外信息:分支跳转次数、类型转换等等

2
4 C2即时编译器 C2完整优化 优化后的机器码 5

C1和C2编译器各自拥有独立的线程来处理编译任务,这些线程内部维护了一个任务队列,用于存放待编译的代码。通常情况下,即时编译器主要针对方法进行优化,不过在某些情况下,也会对代码中的循环结构进行优化。

image.gif

在HotSpot虚拟机中,C1和C2编译器的协作机制是实现高效代码编译和优化的关键。它们之间的协作主要体现在以下几个方面:

  • 信息收集和触发阈值:首先,C1编译器在执行代码的过程中会负责收集运行时的各种信息,如方法执行次数、循环执行次数、分支执行次数等。这些信息对于后续的优化至关重要。当这些执行次数达到一个由JVM动态计算的触发阈值时,代码会进入C2编译器进行更深层次的优化。这种触发机制确保了只有经过充分运行和验证的代码才会被进一步优化,从而提高了优化的针对性和效率。

image.gif

  • 优化策略选择:在某些情况下,如果方法的字节码执行次数较少,JVM会评估C1和C2的优化性能。如果认为两者的优化效果相近,那么JVM将停止收集信息,并直接由C1编译器进行优化。这种策略选择机制避免了不必要的开销,确保了编译过程的效率。

image.gif

  • 线程忙碌时的处理:当C1的线程资源紧张,无法及时处理编译任务时,C2编译器会接管这些任务。C2以其强大的优化能力来处理这些代码,确保了程序在忙碌场景下的性能表现。这种机制确保了在高负载情况下,代码仍然能够得到有效的编译和优化。

image.gif

  • 分层编译和协作流程:在C2线程忙碌时,为了保持编译流程的连续性,会先由2层C1编译器进行初步的信息收集和优化。这一阶段的目的是快速积累运行时的基本信息。随后,这些信息会传递给3层C1进行处理。然而,由于3层C1的优化效率相对较低,因此会尽量减少在这一层的停留时间。这种分层编译和协作流程确保了即使在C2忙碌时,代码仍然能够得到一定程度的优化,而不会造成过多的延迟。一旦C2线程空闲,它会接手这些任务,并进行更为深入的优化,从而确保代码的最终性能。

image.gif

三、JIT优化技术

JIT编译器主要通过方法内联逃逸分析两种技术来优化代码。

1.方法内联

这是一种将方法体中的字节码指令直接复制到调用方的字节码指令中的技术,它有助于减少栈帧的创建开销,提高代码的执行效率。但并非所有的方法都适合内联,它受到一定的限制,如方法的大小、热点度等。

案例(实际上,涉及的是字节码指令,但为了简化理解和说明,此处采用了源代码进行展示)

int result = add(a, b);
    public int add(int a, int b) {
        return a + b;
    }
image.gif

方法内联结果:

int result = a+ b;
image.gif

方法内联的限制:在Java虚拟机(JVM)的即时编译器(JIT)中,方法内联是一项重要的优化技术,但并非所有方法都可以或应该被内联。内联的应用受到一系列限制和条件的约束,以确保优化的有效性和代码的性能。以下是方法内联的一些主要限制:

  • 字节码指令大小限制:如果一个方法编译后的字节码指令总大小小于35字节,则JIT编译器通常会将其视为轻量级方法,并可能直接进行内联。这个限制可以通过JVM参数-XX:MaxInlineSize=值进行调整,允许更大的字节码大小进行内联。
  • 热方法的字节码大小限制:对于编译后的字节码指令总大小在35字节到325字节之间的方法,如果它们被频繁调用(即热方法),JIT编译器也可能会选择进行内联。这个限制可以通过-XX:FreqInlineSize=值参数进行配置,允许根据实际需求调整热方法的内联大小阈值。
  • 机器码大小限制:即使一个方法的字节码大小满足上述条件,其编译生成的机器码大小也不能超过1000字节。这是为了确保内联后的代码不会过于庞大,影响执行效率。这个限制可以通过-XX:InlineSmallCode=值参数进行调整。
  • 接口实现数量的限制:如果一个接口的实现方法数量超过3个,那么这些方法通常不会被内联。这是因为接口的实现通常具有多态性,内联过多的接口实现方法可能导致代码膨胀和性能下降。

这些限制确保了方法内联的针对性和有效性,避免了不必要的内联操作,从而提高了代码的执行效率和性能。在实际应用中,开发者可以通过调整JVM参数来平衡内联的积极程度和性能表现。

2.逃逸分析

逃逸分析是JIT(Just-In-Time)编译器中的一种高级优化技术,其核心在于判断方法内部创建的对象是否会被方法外部引用。如果JIT编译器确定一个对象不会“逃逸”到方法外部,即该对象的生命周期仅限于当前方法内,那么就可以应用一系列优化策略,如锁消除和标量替换,以提升程序性能。

锁消除:

锁消除是一种针对同步锁的优化手段。在逃逸分析的指导下,如果JIT编译器判断某个对象不会逃逸出当前方法,那么该对象就不会面临多线程并发访问的问题。因此,编译器可以选择消除该对象上的所有锁操作,包括锁的获取、释放以及等待锁的代码。这样可以有效减少线程间的竞争和同步开销,提高程序的执行效率。需要注意的是,锁消除优化在实际应用中并不常见,因为通常情况下,加锁的对象都是设计用来支持多线程并发访问的。

案例:

public void nonEscapingMethod() {  
    synchronized(new Object()) {  
        // ... 锁内的代码逻辑  
    }  
}
image.gif

在上述代码中,由于新创建的对象只在nonEscapingMethod方法内部使用,并没有逃逸出去,因此理论上是可以进行锁消除的。

标量替换:

标量替换是逃逸分析中另一种重要的优化手段。在Java虚拟机中,对象内部的基本数据类型成员被称为标量,而对象引用的其他对象则被称为聚合量。当JIT编译器确定一个对象不会逃逸时,它可以选择将该对象拆分成若干个标量,并将这些标量直接在栈上分配而不是在堆上。这样做的好处是可以减少堆内存的分配和垃圾回收的压力,同时还能消除因对象访问带来的间接引用开销,从而提升程序的执行性能。

案例:

public class Point {  
    private int x, y;  
    ...
}  
  
public void nonEscapingMethod() {  
    Point point = new Point(1, 2);  
    // 仅使用point的x和y属性,不逃逸  
    ...
}
image.gif

在上述代码中,如果Point对象被确定不会逃逸出nonEscapingMethod方法,那么JIT编译器可能会选择将point对象的x和y属性直接作为局部变量处理,而不是在堆上分配一个完整的Point对象。这种优化就是标量替换。

四、JIT优化建议

针对JIT(Just-In-Time)编译器在优化Java代码时的特性,为了确保代码执行时能够获得卓越的性能,建议在编写代码时遵循以下几个关键指导原则:

  • 编写小型方法:为了最大化方法内联的效果,应尽可能编写小型且专一的方法。小型方法更有可能被JIT编译器识别为内联候选,从而消除方法调用的开销,提高执行效率。
  • 优化高频代码:对于频繁执行的代码段,特别是那些来自第三方依赖库或JDK本身的代码,如果其内部实现过于复杂,可能无法被内联。在这种情况下,可以考虑自行实现一个定制化的、更简洁的版本,以便JIT编译器能够更有效地对其进行优化。
  • 控制接口实现数量:接口的实现数量对JIT的内联处理有显著影响。为了促进内联,建议将接口的实现数量限制在最低必要水平,通常不应超过两个。这样可以降低内联的复杂性,提高编译器的优化能力。
  • 避免对象逃逸:在高频调用的方法中,如果创建了仅供临时使用的对象,应尽量避免这些对象逃逸到方法外部。对象逃逸可能导致额外的性能开销,如垃圾回收压力增加和可能的锁竞争。通过局部变量的使用或对象池技术,可以有效减少对象逃逸的情况。

总结

JVM是Java程序的运行环境,负责字节码解释、内存管理、安全保障、多线程支持、性能监控和跨平台运行。本文主要介绍了JIT即时编译器、HotSpot中的JIT编译器、JIT优化技术、JIT优化建议等内容,希望对大家有所帮助。

相关文章
|
4月前
|
Java 编译器 Linux
JVM/编译器/CPU,究竟谁是卧底?一个曾经困扰我一个月的 bug
任何复杂的系统都可能因为一个小小的疏漏而无法运转,本文记录了一个困扰作者一个月的 bug 最终拨云见日的过程。
|
8天前
|
NoSQL Java Redis
秒杀抢购场景下实战JVM级别锁与分布式锁
在电商系统中,秒杀抢购活动是一种常见的营销手段。它通过设定极低的价格和有限的商品数量,吸引大量用户在特定时间点抢购,从而迅速增加销量、提升品牌曝光度和用户活跃度。然而,这种活动也对系统的性能和稳定性提出了极高的要求。特别是在秒杀开始的瞬间,系统需要处理海量的并发请求,同时确保数据的准确性和一致性。 为了解决这些问题,系统开发者们引入了锁机制。锁机制是一种用于控制对共享资源的并发访问的技术,它能够确保在同一时间只有一个进程或线程能够操作某个资源,从而避免数据不一致或冲突。在秒杀抢购场景下,锁机制显得尤为重要,它能够保证商品库存的扣减操作是原子性的,避免出现超卖或数据不一致的情况。
40 10
|
24天前
|
存储 IDE Java
实战优化公司线上系统JVM:从基础到高级
【11月更文挑战第28天】Java虚拟机(JVM)是Java语言的核心组件,它使得Java程序能够实现“一次编写,到处运行”的跨平台特性。在现代应用程序中,JVM的性能和稳定性直接影响到系统的整体表现。本文将深入探讨JVM的基础知识、基本特点、定义、发展历史、主要概念、调试工具、内存管理、垃圾回收、性能调优等方面,并提供一个实际的问题demo,使用IntelliJ IDEA工具进行调试演示。
24 0
|
2月前
|
监控 架构师 Java
JVM进阶调优系列(6)一文详解JVM参数与大厂实战调优模板推荐
本文详述了JVM参数的分类及使用方法,包括标准参数、非标准参数和不稳定参数的定义及其应用场景。特别介绍了JVM调优中的关键参数,如堆内存、垃圾回收器和GC日志等配置,并提供了大厂生产环境中常用的调优模板,帮助开发者优化Java应用程序的性能。
|
2月前
|
存储 监控 算法
JVM调优深度剖析:内存模型、垃圾收集、工具与实战
【10月更文挑战第9天】在Java开发领域,Java虚拟机(JVM)的性能调优是构建高性能、高并发系统不可或缺的一部分。作为一名资深架构师,深入理解JVM的内存模型、垃圾收集机制、调优工具及其实现原理,对于提升系统的整体性能和稳定性至关重要。本文将深入探讨这些内容,并提供针对单机几十万并发系统的JVM调优策略和Java代码示例。
60 2
|
2月前
|
缓存 前端开发 Java
JVM知识体系学习二:ClassLoader 类加载器、类加载器层次、类过载过程之双亲委派机制、类加载范围、自定义类加载器、编译器、懒加载模式、打破双亲委派机制
这篇文章详细介绍了JVM中ClassLoader的工作原理,包括类加载器的层次结构、双亲委派机制、类加载过程、自定义类加载器的实现,以及如何打破双亲委派机制来实现热部署等功能。
66 3
|
2月前
|
存储 缓存 监控
聊聊JIT是如何影响JVM性能的!
聊聊JIT是如何影响JVM性能的!
|
4月前
|
缓存 Java 编译器
JRE、JDK、JVM 和 JIT 之间的区别详解
【8月更文挑战第22天】
192 0
|
4月前
|
存储 监控 算法
深入解析JVM内部结构及GC机制的实战应用
深入解析JVM内部结构及GC机制的实战应用
|
27天前
|
缓存 Prometheus 监控
Elasticsearch集群JVM调优设置合适的堆内存大小
Elasticsearch集群JVM调优设置合适的堆内存大小
211 1