基准测试神器JMH —— 详解36个官方例子

简介: 基准测试是指通过设计科学的测试方法、测试工具和测试系统,实现对一类测试对象的某项性能指标进行定量的和可对比的测试。而JMH是一个用来构建,运行,分析Java或其他运行在JVM之上的语言的 纳秒/微秒/毫秒/宏观 级别基准测试的工具。

简介


基准测试是指通过设计科学的测试方法、测试工具和测试系统,实现对一类测试对象的某项性能指标进行定量的和可对比的测试。而JMH是一个用来构建,运行,分析Java或其他运行在JVM之上的语言的 纳秒/微秒/毫秒/宏观 级别基准测试的工具。


JMH is a Java harness for building, running, and analysing nano/micro/milli/macro benchmarks written in Java and other languages targetting the JVM.


为什么需要


有人可能会说,我可以在代码的前后打点计算代码运行时间,为什么还需要JMH?下面着重介绍一下JMH的常用功能,都来源于官方提供的sample,相信看完这些例子,就能回答这个问题了,官方sample地址点击阅读原文可查看。


官方sample解读


(1)JMHSample01HelloWorld


第一个例子教我们如何使用,在开始前,只需要引入依赖。类似单元测试,常放在test目录下运行。


640.png


这里精简一下simple的代码,使用 @Benchmark 来标记需要基准测试的方法,然后需要写一个main方法来启动基准测试。


640.png


可以在IDE中直接运行main方法;如果是在服务器上可以打成jar包运行。运行后控制台输出如下格式的报告:报告的第一部分是此次运行的环境和配置,包括JDK、JMH版本,基准测试的配置(后面会详细介绍)等。第二部分则是每次运行的报告输出,第三部分是汇总的报告,包括最小值、平均值、最大值。最后一部分则是本次基准测试的最终报告。


640.png


(2)JMHSample02BenchmarkModes


本例介绍了注解 @OutputTimeUnit 和 @BenchmarkMode。


640.png


  • @OutputTimeUnit 可以指定输出的时间单位,可以传入 java.util.concurrent.TimeUnit 中的时间单位,最小可以到纳秒级别;
  • @BenchmarkMode 指明了基准测试的模式
  • Mode.Throughput :吞吐量,单位时间内执行的次数
  • Mode.AverageTime:平均时间,一次执行需要的单位时间,其实是吞吐量的倒数
  • Mode.SampleTime:是基于采样的执行时间,采样频率由JMH自动控制,同时结果中也会统计出p90、p95的时间
  • Mode.SingleShotTime:单次执行时间,只执行一次,可用于冷启动的测试

这些模式可以自由组合,甚至可以使用全部。


640.png


(3)JMHSample03States


640.png


本例介绍了注解 @State 的用法,用于多线程的测试


  • @State(Scope.Thread):作用域为线程,可以理解为一个ThreadLocal变量
  • @State(Scope.Benchmark):作用域为本次JMH测试,线程共享
  • @State(Scope.Group):作用域为group,将在后文看到


而且JMH可以像spring一样自动注入这些变量。


(4)JMHSample04DefaultState


本例介绍了 @State 注解可以直接写在 Benchmark 的测试类上,表明类的所有属性的作用域。 (5)JMHSample05StateFixtures


640.png


本例中介绍了两个注解 @Setup 和 @TearDown。 @Setup 用于基准测试前的初始化动作, @TearDown 用于基准测试后的动作


(6)JMHSample06FixtureLevel


@Setup 和 @TearDown两个注解都可以传入 Level 参数,Level参数表明粒度,粒度从粗到细分别是


  • Level.Trial:Benchmark级别
  • Level.Iteration:执行迭代级别
  • Level.Invocation:每次方法调用级别


(7)JMHSample07FixtureLevelInvocation


本例中主要介绍了使用Level.Invocation达到每次方法执行完成后sleep一段时间,模拟在需要唤醒线程的情况下耗时更多。


(8)JMHSample08DeadCode


640.png


本例主要介绍了一个知识点:Dead-Code Elimination (DCE) ,即死码消除,文档上说编译器非常聪明,有的代码没啥用,就在编译器被消除了,但这给我做基准测试带了一些麻烦,比如上面的代码中,baseline 和 measureWrong 有着相同的性能,因为编译器觉得 measureWrong这段代码执行后没有任何影响,为了效率,就直接消除掉这段代码,但是如果加上return语句,就不会在编译期被去掉,这是我们在写基准测试时需要注意的点。


(9)JMHSample09Blackholes


本例是为了解决(8)中死码消除问题,JMH提供了一个 Blackholes (黑洞),这样写就不会被编译器消除了。


640.png


(10)JMHSample10ConstantFold


640.png


本例介绍了 constant-folding,即常量折叠,上述代码的 measureWrong1 和 measureWrong2 中的运算都是可以预测的值,所以也会在编译期直接替换为计算结果,从而导致基准测试失败,注意 final 修饰的变量也会被折叠。


(11)JMHSample11Loops


本例直接给出一个结论,不要在基准测试的时候使用循环,使用循环就会导致测试结果不准确,原因很复杂,甚至可以单独写一篇文章来介绍。简单能理解的一点是如果使用循环,预热可能就会存在问题。


640.png


(12)JMHSample12Forking


本例介绍了 @Fork 注解,@Fork 可以指定代码运行时是否需要 fork 出一个JVM进程,如果在同一个JVM中测试则会相互影响,一般fork进程设置为1。


(13)JMHSample13RunToRun


由于JVM的复杂性,每次测试结果都有差异,可以使用 @Fork 注解启动多个 JVM 经过多次测试来消除这种差异。


(15)JMHSample15Asymmetric


原来没有14,直接跳到了15


640.png


本例是对 @Group 和 @GroupThreads 使用的介绍,@Group 定义了一个线程组, @GroupThreads 可以分配线程给测试用例,可以测试线程执行不均衡的情况,比如三个线程写,一个线程读,这里用 @State(Scope.Group) 定义了counter 作用域是这个线程组。


640.png


执行完的数据包含get、inc、和整个组的统计,这样数据更直观,更全面。


(16)JMHSample16CompilerControl


本例提到了JVM的方法内联,简单来说比较短但是执行频率又很高的方法,在执行多次后,JVM将该方法的调用替换为本身,以减少出栈入栈,从而减少性能的消耗。但是Java方法内联是无法人为控制的。


640.png


JMH提供了可以控制是否使用内联的注解 @CompilerControl ,它的参数有如下可选:


  • CompilerControl.Mode.DONT_INLINE:不使用内联
  • CompilerControl.Mode.INLINE:强制使用内联
  • CompilerControl.Mode.EXCLUDE:不编译


640.png


从执行结果可以看到内联方法和空方法执行速度一样,不编译执行最慢。


(17)JMHSample17SyncIterations


本例阐述了在多线程条件下,线程池的启动与销毁都会影响基准测试的准确性,如果自己来实现需要让线程同时开始启动工作,但这又比较难做到,如果在启动和关闭线程池时,无法做到同时,那么测量必定不准确,因为无法确定开始和结束时间;JMH提供了多线程基准测试的方法,先让线程池预热,都预热完成后让所有线程同时进行基准测试,测试完等待所有线程都结束再关闭线程池。


640.png


这里warmupTime是预热时间,measurementTime是测量时间,threads是线程数,forks之前说过,是fork出一个子进程进行测试,syncIterations是是否需要同步预热,前面几个参数好理解,看了下代码才知道syncIterations如果设置为true代表等所有线程预热完成,然后所有线程一起进入测量阶段,等所有线程执行完测试后,再一起进入关闭;看一下设置为false时跑出的结果:


640.png


再看一下为true的结果:


640.png


当syncIterations设置为true时更准确地反应了多线程下被测试方法的性能,这个参数默认为true,无需手动设置。


(18)JMHSample18Control


本例介绍了使用 Control 的场景


640.png


如果测试一个线程组对一个AtomicBoolean分别进行set true 和 set false操作,我们知道只有一个线程set true成功,另一个线程才能对其set false,否则另一个线程就陷入死锁,但我们的测试用例两个方法的执行不是均匀成对的,所以极大概率测试会陷入死锁,这时需要JMH提供的Control进行控制,当测量结束,双方都退出循环。


(20)JMHSample20Annotations


19也不存在。本例介绍了所有在main方法中通过Options提供的参数都可以通过注解写在需要测试的方法上,这在编写大量需要不同运行环境的基准测试时显得非常方便,比如这样


640.png


(21)JMHSample21ConsumeCPU


本例介绍了Blackhole的另一种用法,前面提到的Blackhole可以用来干掉“死码消除”,同时Blackhole也可以“吞噬”cpu时间片(怪不得起这个名字)


640.png


Blackhole.consumeCPU的参数是时间片的tokens,和时间片成线性关系。


(22)JMHSample22FalseSharing


从名字可知本例是说false-sharing,即伪共享,关于伪共享这里就不再展开,后续会写一篇文章专门介绍伪共享。尽管JMH中提供的 @State 会自动填充缓存行,但是对于对象中特定的单个变量还是无法填充,所以本例介绍了4种方式来消除伪共享,需要我们自己注意。


(23)JMHSample23AuxCounters


本例介绍了注解 @AuxCounters ,它是一个辅助计数器,可以统计 @State 修饰的对象中的 public 属性被执行的情况,它的参数有两个


  • AuxCounters.Type.EVENTS: 统计发生的次数
  • AuxCounters.Type.OPERATIONS:按我们指定的格式统计,如按吞吐量统计


640.png


运行结果如下:


640.png


(24)JMHSample24Inheritance


本例介绍了JMH在父类中定义了Benchmark,子类也会继承并合成自己的Benchmark,这是JMH在编译期完成的,如果不是由JMH来编译,就无法享受这种继承。


640.png


运行结果:


640.png


(25)JMHSample25API_GA


本例介绍了如何用API的方式来写基准测试代码,比较复杂,个人觉得还是注解的方式简单。


(26)JMHSample26BatchSize


本例介绍了 batchSize,指定一次迭代方法需要执行 batchSize 次


640.png


(27)JMHSample27Params


本例介绍 @Param ,@Param 允许使用一份基准测试代码跑多组数据,特别适合测量方法性能和参数取值的关系


640.png


运行结果:


640.png


(28)JMHSample28BlackholeHelpers


本例介绍了 Blackhole 不仅可以用在 Benchmark 修饰的方法上,也可以用在其他JMH提供的方法上,比如 @Setup 和 @TearDown 等等


640.png


(29)JMHSample29StatesDAG


本例展示了 @State 中嵌套 @State 的情况,不过想不出为啥需要这样做,例子中也说这是个实验性质的Feature。


(30)JMHSample30Interrupts


本例类似(18),也是在测试时遇到死锁的情况,JMH可对能被Interrupt的超时动作发起Interrupt动作,让测试正常结束。如对一个BlockQueue进行put和take操作,如果put和get不对称,就会死锁,此时JMH会自行打断。


640.png


运行时会提示被Interrupt:


640.png


(31)JMHSample31InfraParams


本例介绍了在方法中可覆盖的三种参数,这给在测试时获取配置以及动态修改配置提供了可能


  • BenchmarkParams:基准测试级别
  • IterationParams:迭代级别
  • ThreadParams:线程级别


640.png


(32)JMHSample32BulkWarmup


本例介绍了三种预热方式:


  • WarmupMode.INDI:每个Benchmark单独预热
  • WarmupMode.BULK:在每个Benchmark执行前都预热所有的Benchmark
  • WarmupMode.BULK_INDI:在每个Benchmark执行前都预热所有的Benchmark,且需要再预热本次执行的Benchmark


(33)JMHSample33SecurityManager


关于 SecurityManager ,可以通过注入的方式来修改 SecurityManager,用处不大。


(34)JMHSample34SafeLooping


这节专门讲如何构造安全的循环,和前面的内容稍有重复


640.png


measureWrong1和measureWrong2都可能在编译时被展开,后面两种正确的方式在前面都提过。


(35)JMHSample35Profilers


本例讲解了如何使用JMH内置的性能剖析工具查看基准测试消耗在什么地方,具体的剖析方式内置的有如下几种:


  • ClassloaderProfiler:类加载剖析
  • CompilerProfiler:JIT编译剖析
  • GCProfiler:GC剖析
  • StackProfiler:栈剖析
  • PausesProfiler:停顿剖析
  • HotspotThreadProfiler:Hotspot线程剖析
  • HotspotRuntimeProfiler:Hotspot运行时剖析
  • HotspotMemoryProfiler:Hotspot内存剖析
  • HotspotCompilationProfiler:Hotspot编译剖析
  • HotspotClassloadingProfiler:Hotspot 类加载剖析


用法


640.png


(36)JMHSample36BranchPrediction


本例提醒我们要注意“分支预测”,简单来说,分支预测是CPU在处理有规律的数据比没有规律的数据要快,CPU可以“预测”这种规律。我们在基准测试时需要注意样本数据的规律性对结果也会产生影响。


(37)JMHSample37CacheAccess


本例提醒我们对内存的顺序访问与非顺序访问会对测试结果产生影响,这点也是因为CPU存在缓存行的缘故,与之前提到的伪共享类似。


(38)JMHSample38PerInvokeSetup


本例也是之前提到过的在每次调用前执行Setup,使用它可以测量排序性能,如果Setup不在每次执行排序时执行,那么只有第一次排序是执行了排序,后面每次排序的都是相同顺序的数据。


总结


通过这么多例子我们概括出为什么需要JMH


  • 方便:使用方便,配置一些注解即可测试,且测量维度全面,内置的工具丰富;
  • 专业:JMH自动地帮我们避免了一些基准测试上的“坑”;
  • 准确:预热、fork隔离、避免方法内联、避免常量折叠等很多方法可以提高测量的准确性。


相关文章
|
人工智能 缓存 数据可视化
Java基准测试工具JMH使用
Java基准测试工具JMH使用
257 0
|
8月前
|
XML Java 测试技术
【Java优化实战】「微基准系列」带你脚踏实地的进行开发和使用JMH测试和提升应用程序和服务指南
【Java优化实战】「微基准系列」带你脚踏实地的进行开发和使用JMH测试和提升应用程序和服务指南
200 1
|
IDE Java 测试技术
如何在linux上做Java基准测试工具JMH测试
如何在linux上做Java基准测试工具JMH测试
133 0
|
安全 Java 测试技术
Java基准测试工具JMH高级使用
Java基准测试工具JMH高级使用
121 0
|
Java 测试技术 开发者
如何在Java中做基准测试?JMH使用初体验
大家好,我是王有志。今天和大家聊聊如何使用Java Microbenchmark Harness来做基准测试。
149 1
如何在Java中做基准测试?JMH使用初体验
|
JSON Java fastjson
JMH - Java 代码性能测试的终极利器、必须掌握
JMH - Java 代码性能测试的终极利器、必须掌握
3103 1
|
Java 测试技术
SpringBoot 如何使用 JMH 进行性能测试
SpringBoot 如何使用 JMH 进行性能测试
|
Java 测试技术
在java中使用JMH(Java Microbenchmark Harness)做性能测试
在java中使用JMH(Java Microbenchmark Harness)做性能测试
|
Arthas 消息中间件 监控
测试和性能监控神器 JMH & Arthas
测试和性能监控神器 JMH & Arthas
|
Java 测试技术 Maven
JMH微基准测试入门案例
JMH - java Microbenchmark Harness 官网:http://openjdk.java.net/projects/code-tools/jmh/ 创建JMH测试 1.创建ma
116 0