看了这篇【JIT编译器】,你也能说你会java性能优化了!

简介: 本文主要介绍 java性能分析 之 JIT编译器

参考书籍:《Java性能权威指南》


作为Java开发人员,也许在工作中最经常用到的只是 CRUD解决性能问题 也许不经常接触到,但是也是需要了解一二的!这篇文章小菜带你一起探究 Java中的JIT编译器



前情概览


即时 JIT(JUst-In-Time)编译器是Java虚拟机的核心,对 JVM性能 影响最大的也就是编译器。


CPU 是计算机的核心,到时只能执行相对少而且特定的指令,例如 汇编码二进制码 ,因此 CPU 所执行的程序都必须翻译成这种指令。



语言结构


  • 编译型语言:会编译成二进制形式 交付,先写程序,然后用编译器静态生成二进制文件。


  • 解释型语言:只要机器上有合适的解释器,相同的程序代码可以在任何 CPU 上执行,执行程序时,解释器会将相应代码转换为二进制代码。


Java试图走一条中间路线,Java应用会被编译——但不是编译成特定 CPU 所专用的二进制编码,而是被编译成一种理想化的汇编语言。然后该汇编语言(Java字节码)可以用Java运行。因此 Java 是一门 平台独立性解释型语言


热点编译


JVM 执行代码时,只会编译经常被调用的。因此被编译的代码需要具备以下特性:


  • 代码是经常被调用的代码


  • 运行很多次迭代的循环


而这些关键代码段被称为应用的热点,代码执行得越多就被认为是越热的。因此编译器会先解释执行代码,然后找出哪个方法被调用的足够频繁,才进行编译。这也是为了***优化***:JVM 执行特定方法或者循环的次数越多,它就会越了解这段代码,这样可以使 JVM 在编译代码时进行大量优化。


小结


  • Java的设计结合了脚本语言的平台独立性和编译型语言的本地性能


  • Java文件被编译成中间语言(Java字节码),然后在运行时被JVM进一步编译成汇编语言


  • 字节码编译成汇编语言的过程中有大量的优化,极大地改善了性能


调优入门


一、两种 “口味”


  • Client 编译器


  • Server编译器


命令行上选择编译器类型则采用以上两个名字:-client-server。通常这两个编译器也称为 c1 编译器(client编译器)c2  编译器(server编译器)


分层编译器:分层编译意味着必须使用 server 编译器


关闭分层编译: java -client -XX:+TieredCompilation other_args


两者的主要区别:


在于编译代码的时机不同。client编译器开启编译比server编译器要早。这意味着;在代码执行的开始阶段,client编译器比server编译器要快,因为他编译代码相比server编译器而言要多。


问题来了:


JVM 能不能在启动的时候用 client 编译器,然后随着代码变热使用 server 编译器?

方案:


分层编译:代码先由 client 编译器编译,随着代码变热, 由 server 编译器重新编译。在 Java 1.8 中,分层编译是默认开启的。


二、优化启动


当快速启动时间是首要目标时了,最常使用 client 编译器。


当整体性能比启动性能更重要时,更适合使用 server 编译器。


小结:


  1. 如果应用的启动时间是首要的性能考量,那 client 编译器就是最有用的。


  1. 分层编译的启动时间可以非常接近于 client 编译器所获得的启动时间。


三、优化批处理


处理过程


归根结底取决于哪种编译器使得应用运行的时间最优。


  • 分层编译是批处理任务合理的默认选择


  • 分层编译是适合所有情况的很好的备选方案


  • 分层编译总是比标准的 server 编译器好一些


  • 即便应用永远运行,server 编译器也不可能编译它的所有代码


  • 对于计算量固定的任务来说,应该选择实际执行任务最快的编译器


四、优化长时间运行的应用


通常来说,在应用 “热身” 之后,意味着它已经运行了足够长的时间,重要的代码都已经被编译,这个时候便可以测试它处理的吞吐量。一个应用测试结果:


热身期 (秒) - client - server -XX:+TieredCompilation
0 15.87 23.72 24.23
60 16.00 23.73 24.26
300 16.85 24.42 24.43


相比单独的 server 编译器,分层编译可以编译更多代码,提供更多的性能。

对于长时间运行的应用来说,应该一直使用 server 编译器,最好配合分层编译。


编译器中级调优


大多数情况下,所谓编译器调优,其实就只是为目标机器上的 Java 选择正确的 JVM和编译器开关(-client-server-XX:+TieredCompilation)而已。分层编译通常是长期运行应用的最佳选择,而对于运行时间短的应用来说,分层编译与 client 编译器的性能差别也微乎其微。


一、代码缓存


JVM  编译代码时,会在代码缓存中保留编译之后的汇编语言指令集。代码缓存的大小固定,所以一旦填满,JVM 就不能编译更多代码了。代码缓存过小会导致只有部分热点编译,而应用的大部分代码都只是解释运行 —> 运行慢

代码缓存填满时,JVM会发出以下警告:


JAVA HotSpot(TM) 64-Bit Server VM warning:CodeCache is full
     Compiler has been disabled
JAVA HotSpot(TM) 64-Bit Server VM warning:Try increasing the
     code cache size using -XX:ReservedCodeCacheSize=


JVM 类型 代码缓存的默认大小
32 位 client,Java 8 32 MB
32 位 server,分层编译,Java 8 240 MB
64 位 server,分层编译,Java 8 240 MB
32 位 client,Java 7 32 MB
32 位 server,Java 7 32 MB
64 位 server,Java 7 48 MB
64 位 server,分层编译,Java 7 96 MB


设置代码缓存最大值

-XX:ReservedCodeCacheSize=N


设置代码缓存初始大小

-XX:InitialCodeCacheSize=N


小结


  1. 代码缓存是一种有最大值的资源,它会影响 JVM 可运行的编译代码总量。


  1. 分层编译很容易达到代码缓存默认配置的上限(特别是在 Java 7)。使用分层编译时,应该监控代码缓存,必要时应该增加它的大小。


二、编译阈值


编译阈值和 代码执行的频度 有关,一旦代码执行达到一定次数,并且达到了编译阈值,编译器就可以获得足够多的信息来进行代码的编译。


编译是基于两种 JVM 计数器


  • 方法调用计数器


  • 方法中的循环回边计数器(回边可以看做是循环完成执行的次数,所谓循环完成执行,包括达到循环自身的末尾,也包括执行了像 continue 这样的分支语句)


1. 标准编译


JVM 执行了某个 Java 方法时,会检查该方法的两种计数器总数,然后判定该方法是否适合编译,如果适合,该方法就会进入编译队列。


更改编译阈值


-XX:CompileThreshold=N标志触发,使用 client 编译器时,N 的默认值是 1500,使用 server 编译器时,N 的默认值是 10 000,更改 CompileThreshold 将会使编译器提高(或延迟)编译。


问题:


如果循环很长或者永远不会退出,怎么计数?


这种情况下,JVM 不等方法调用完成就会编译循环,所以循环每完成一轮,回边计数器就会增加并被检测。


2. 栈上编译 (OSR)


由于仅仅编译循环还不够,JVM 必须在循环进行的时候还能编译循环,在循环代码编译结束后,JVM 就会替换还在栈上的代码,循环的下一次迭代就会执行快得多的编译代码。


实际上会出现有些重要的方法永远不会被编译。因为并不是还没达到编译阈值,而是永远都达不到编译阈值


这是因为虽然计数器随着方法和循环的执行而增加,但是它们也会随时间而减少。这种方法也称为 温热方法


小结:


  1. 当方法和循环执行次数达到某个阈值的时候,就会发生编译


  1. 改变阈值会导致代码提早或推后编译


  1. 由于计数器会随着时间而减少,以至于 "温热方法" 可能永远都打不到编译的阈值(特别是对 server 编译器来说)


三、编译过程


如果我们想要看到编译器是如何工作的,可以使用 -XX:+PrintCompilation 命令来开启,默认是 false


如果程序启动时没有开启这个标志,可以用 jstat 了解编译器内部的部分工作情况。


例如:jstat -compiler 25jstat -printcompilation 25 1000


  • -compiler:提供了关于多少方法被编译的概要信息


  • -printcompilation:获取最近被编译的方法


  • 25:是被检测进程的 ID


  • 1000:每 1 秒(1000毫秒)输出一次


小结:


  1. 观察代码如何被编译的最好方法是开启 PrintCompilation


  1. PrintCompilation 开启后所输出的信息可用来确认编译是否和预期一样


编译器高级调优


一、编译线程


当方法(或循环)适合编译时,就会进入到编译队列。然后队列中的任务则由一个或多个后台线程处理,这意味着编译过程是异步的。这样的好处便是:即便代码正在编译的时候,程序也能持续执行。


如果是用标准编译所编译的方法,那下次调用该方法时就会执行编译后的方法;如果是用OSR编译的循环,那下次循环迭代时就会执行编译后的代码。


编译队列并不严格遵守先进先出的原则:调用计数次数多的方法有更高的优先级。所以即便在程序开始执行并有大量代码需要编译时,这样的优先顺序仍然有助于确保最重要的代码优先编译。


使用client编译器时,JVM会开启一个编译线程;使用server编译器时,则会开启两个线程。而分层编译器则是一个略复杂的等式而定,如下:


CPU数量 C1的线程数 C2的线程数
1 1 1
2 1 1
4 1 1
8 1 2
16 2 6
32 3 7
64 4 8
128 4 10

小结:


  1. 放置在编译队列中的方法的编译会被异步执行。


  1. 队列并不是严格按照先后顺序的;队列中的热点方法会在其他方法之前编译,这是编译输出日志中的 ID 为乱序的另一个原因。


二、内联 可好?


有了解过final的小伙伴应该都知道被final修饰的方法,编译时JVM会尝试找与其内联的方法。这是因为编译器所做的最重要的优化是方法内联。内联默认是开启的。可以通过-XX:-Inline关闭。


如果你从源代码编译 JVM,那可以用 -XX:+PrintInling生成带调试信息的版本。方法是否 内联 取决于它有多热以及它的大小。JVM 依据内部计算来判定方法是否热点(譬如:调用很频繁);是否是热点并不直接与任何调优参数相关。


小结:


  1. 内联是编译器所能做的最有利的优化,特别是对属性封装良好的面向对象的代码来说。


  1. 几乎用不着调节内联参数,且提倡这样做的建议往往忽略了常规内联和频繁调用内联之间的关系。当考察内联效应时,确保考虑这两种情况。


三、逃逸分析


我们可以通过-XX:+DoEscapeAnalysis来开启逃逸分析,默认是true。逃逸分析可以决定哪些优化是可能的,并决定编译后的代码中哪些是必要的改变。


逃逸分析默认开启,极少数情况下,它会出错。在此类情况下关闭它会变得更快或更稳定。如果你发现了这种情况,最好的应对行为就是简化相关代码:代码越简单越好。


小结:


  1. 逃逸分析是编译器能做得最复杂的优化,此类优化常常会导致微基准测试失败。


  1. 逃逸分析常常会给不正确的同步代码引入 bug


何为逆优化


逆优化意味着编译器不得不 “撤销” 之前的某些编译;结果是应用的性能降低——至少是直到编译器重新编译相应代码为止。有两种逆优化的情形:


  • 代码被丢弃(made not entrant)


  • 产生僵尸代码(made zombie)


一、代码被丢弃了?


有两种原因导致代码被丢弃


  • 与类与接口的工作方式有关


  • 与分层编译的细节有关


server编译器编译好代码之后,JVM 必须替换 client 编译器所编译的代码。它会将老弟阿玛标记为废弃。也用同样的方法替换新编译(和更有效)的代码。


二、“僵尸” 代码出现


何为僵尸代码:当编译后的代码,因为后续没有用到而被GC回收,全部回收之后,编译器就会注意到,这些代码现在适合标记为僵尸代码了。


从性能角度上看,这是好事。上面我们提到过代码缓存,编译后的代码会保存在大小固定的代码缓存中。如果发现僵尸代码,这意味着这些有问题的代码可以从代码缓存中移除,腾出空间给其他将被编译的代码(或者限制 JVM 之后需要分配的内存量)。


可能产生不足的是,如果代码被僵尸化以后再次加载并且频繁使用,JVM 就需要重新编译和重新优化代码,那么这将会影响到性能。


小结:


  1. 逆优化使得编译器可以回到之前版本的编译代码


  1. 先前的优化不再有效时(例如,所涉及到的对象类型发生了更改),才会发生代码逆优化。


  1. 代码逆优化时,会对性能产生一些小而短暂的影响,不过新编译的代码会尽快地再次热身。


  1. 分层编译时,如果代码之前由 client 编译器编译而现在 server 编译器优化,就会发生逆优化。


分层编译级别


程序使用分层编译时,编译日志会输出所编译的分层级别。


其中 client 编译器有 3 种级别,server 编译器有 2 种编译级别,因此,编译级别有以下几种:


  • 0:解释代码


  • 1:简单 C1 编译代码


  • 2:受限的 C1 编译代码


  • 3:完全 C1 编译代码


  • 4:C2 编译代码


多数方法第一次编译的级别是3 ,即完全 C1 编译(不过所有方法都从级别0开始)。如果方法运行得足够频繁,它就会编译成级别4(级别3的代码就会被丢弃)。


如果 server 编译器队列满了,就会从 server 队列中取出方法, 以级别2进行编译,在这个级别中,C1编译器使用方法调用计数器和回边计数器。这会让方法编译得更快,而方法也将在 C1 编译器收集分析信息之后被编译为级别3,最终当 server 编译器队列不太忙的时候被编译为级别4。


小结:


  1. 分层编译可以在两种编译器和 5 种级别之间进行。


  1. 不建议人为更改级别。


小菜与你小结


  1. 不用担心小方法,特别是gettersetter,因为它们很容易内联。


  1. 需要编译的代码在编译队列中,队列中的代码越多,程序达到最佳性能的时间越久。


  1. 虽然代码缓存的大小可以(也应该)调整,但它仍然是有限的资源。


  1. 代码越简单,优化越多,分析反馈和逃逸分析可以使代码更快,但复杂的循环结构和大方法限制了它的有效性。


目录
相关文章
|
6月前
|
消息中间件 缓存 Java
Spring框架优化:提高Java应用的性能与适应性
以上方法均旨在综合考虑Java Spring 应该程序设计原则, 数据库交互, 编码实践和系统架构布局等多角度因素, 旨在达到高效稳定运转目标同时也易于未来扩展.
469 8
|
7月前
|
Java Spring
如何优化Java异步任务的性能?
本文介绍了Java中四种异步任务实现方式:基础Thread、线程池、CompletableFuture及虚拟线程。涵盖多场景代码示例,展示从简单异步到复杂流程编排的演进,适用于不同版本与业务需求,助你掌握高效并发编程实践。(239字)
372 6
|
7月前
|
数据采集 存储 弹性计算
高并发Java爬虫的瓶颈分析与动态线程优化方案
高并发Java爬虫的瓶颈分析与动态线程优化方案
|
8月前
|
安全 Java 编译器
new出来的对象,不一定在堆上?聊聊Java虚拟机的优化技术:逃逸分析
逃逸分析是一种静态程序分析技术,用于判断对象的可见性与生命周期。它帮助即时编译器优化内存使用、降低同步开销。根据对象是否逃逸出方法或线程,分析结果分为未逃逸、方法逃逸和线程逃逸三种。基于分析结果,编译器可进行同步锁消除、标量替换和栈上分配等优化,从而提升程序性能。尽管逃逸分析计算复杂度较高,但其在热点代码中的应用为Java虚拟机带来了显著的优化效果。
250 4
|
8月前
|
存储 人工智能 算法
Java 大视界 -- Java 大数据在智能医疗影像数据压缩与传输优化中的技术应用(227)
本文探讨 Java 大数据在智能医疗影像压缩与传输中的关键技术应用,分析其如何解决医疗影像数据存储、传输与压缩三大难题,并结合实际案例展示技术落地效果。
|
8月前
|
机器学习/深度学习 算法 Java
Java 大视界 -- Java 大数据机器学习模型在生物信息学基因功能预测中的优化与应用(223)
本文探讨了Java大数据与机器学习模型在生物信息学中基因功能预测的优化与应用。通过高效的数据处理能力和智能算法,提升基因功能预测的准确性与效率,助力医学与农业发展。
|
8月前
|
数据采集 搜索推荐 Java
Java 大视界 -- Java 大数据在智能教育虚拟学习环境构建与用户体验优化中的应用(221)
本文探讨 Java 大数据在智能教育虚拟学习环境中的应用,涵盖多源数据采集、个性化推荐、实时互动优化等核心技术,结合实际案例分析其在提升学习体验与教学质量中的成效,并展望未来发展方向与技术挑战。
|
8月前
|
机器学习/深度学习 算法 Java
Java 大视界 -- Java 大数据在智能物流运输车辆智能调度与路径优化中的技术实现(218)
本文深入探讨了Java大数据技术在智能物流运输中车辆调度与路径优化的应用。通过遗传算法实现车辆资源的智能调度,结合实时路况数据和强化学习算法进行动态路径优化,有效提升了物流效率与客户满意度。以京东物流和顺丰速运的实际案例为支撑,展示了Java大数据在解决行业痛点问题中的强大能力,为物流行业的智能化转型提供了切实可行的技术方案。
|
8月前
|
边缘计算 算法 Java
Java 绿色计算与性能优化:从内存管理到能耗降低的全方位优化策略与实践技巧
本文探讨了Java绿色计算与性能优化的技术方案和应用实例。文章从JVM调优(包括垃圾回收器选择、内存管理和并发优化)、代码优化(数据结构选择、对象创建和I/O操作优化)等方面提出优化策略,并结合电商平台、社交平台和智能工厂的实际案例,展示了通过Java新特性提升性能、降低能耗的显著效果。最终指出,综合运用这些优化方法不仅能提高系统性能,还能实现绿色计算目标,为企业节省成本并符合环保要求。
275 0
|
9月前
|
机器学习/深度学习 分布式计算 Java
Java 大视界 -- Java 大数据机器学习模型在遥感图像土地利用分类中的优化与应用(199)
本文探讨了Java大数据与机器学习模型在遥感图像土地利用分类中的优化与应用。面对传统方法效率低、精度差的问题,结合Hadoop、Spark与深度学习框架,实现了高效、精准的分类。通过实际案例展示了Java在数据处理、模型融合与参数调优中的强大能力,推动遥感图像分类迈向新高度。
下一篇
开通oss服务