前言
- 经过前面几篇文章的积累,相信你已经掌握了 静态的 Class 文件的结构,也理解了虚拟机类加载和字节码执行的 动态过程;
- 这篇文章,我们来聊一聊
Java
的编译过程,你将看到从源码到字节码再到本地代码的整个过程。请点赞,你的点赞和关注真的对我非常重要!
目录
1. 经典程序编译原理
将源代码翻译为目标代码的过程,称为编译过程,经典的程序编译过程包含以下过程:
- 如果将目标代码理解为中间代码,就是狭义上的编译过程。例如
*.c
文件编译生成*.obj
文件的过程,或者*.java
文件编译生成*.class
文件的过程; - 如果将目标代码理解为最终执行的机器代码,那就是广义上的编译过程。那么还包括
*.obj
文件链接为可执行的*.exe
文件的过程,或者*.class
解释 / 编译为机器代码的过程;
在Java
技术下,除非有特定的上下文语境,编译一词通常指的是*.java
转换为*.class
的过程,这个过程也被称为 编译前端。除此之外,编译一词还可以指运行期即时编译(JIT,Just in Time Compile)或者(静态的)提前编译(AOT,Ahead of Time Compile),这两种编译称为 编译后端。
下面,我们整理一下 编译前端 & 编译后端 的要点:
2. 编译前端
编译前端阶段中,最重要的一个编译器就是javac 编译器
, 在命令行执行javac
命令,其实本质是运行了javac.exe
这个应用。Android
工程师可能对于 Gradle
构建过程更为熟悉,构建过程中有一个Task:compileDebugJavaWithJavac
,其实也用到了javac 编译器
,编译中间产物路径在build/intermediates/javac/debug/classes
。
2.1 javac 编译
下面,我们整理javac 编译器
的主要处理过程:
延伸文章:
- 关于注解处理器,请阅读:《Java | 注解处理器原理解析与实践》
- 关于类加载,请阅读:《Java | 谈谈你对类加载过程的理解》
- 关于方法调用,请阅读:《Java | 深入理解方法调用的本质(含重载与重写区别)》
2.2 Java 常用语法糖
语法糖 指的是高级语言中的某种语法,这些语法糖在编译时进行解语法糖,转换为无糖语法。这些语法糖大多都是靠编译器实现,而不是依赖字节码或者虚拟机的底层支持。下表总结了部分熟知的语法糖:
延伸文章:
- 关于泛型,请阅读:《Java | 关于泛型能问的都在这里了(含Kotlin)》
- 关于内部类,请阅读:《Java | 为什么非静态内部类会持有外部类的引用》
- 关于switch,请阅读:《Java | switch 和 if-else 哪个更高效》
3. 编译后端
在编译后端阶段中,最重要的是 运行期即时编译器(JIT,Just in Time Compiler)和 静态的提前编译器(AOT,Ahead of Time Compiler)。
3.1 解释执行 & 编译执行
根据前面的内容,我们知道编译前端的核心编译产物是:Class 文件。但是对于CPU
来说,它是不认得字节码的。在《Java | 为什么 Java 实现了平台无关性》这篇文章里,我们强调了:每种CPU
只能“读懂”自身支持的机器语言或者本地代码(native code)。
因此,Java 虚拟机
在执行字节码时,需要将字节码翻译为当前平台的本地代码,可以分为:解释执行 & 编译执行,具体如下:
需要注意的是,并不是所有的Java 虚拟机
都采用解释器与编译器并存的运行架构。当触发即时编译时,执行引擎(默认)不会等待即时编译完成,而是先按解释执行的方式继续执行。直到即时编译完成后,方法的入口地址才会被修改。
3.2 即时编译器热点探测
那么,即时编译器是如何探测热点代码的呢?具体来说,探测的热点代码有两种::被多次调用的方法 & 被多次执行的循环体。使用的探测方法有:基于采样 & 基于计数器:
3.3 编译器优化技术
Editting...
4. 总结
- 编译前端的优化措施主要目的是降低程序员的编码复杂度,提高编码效率。语法糖并不是不是依赖字节码或者虚拟机的底层支持,在编译后会转换为基础的无糖语法。另外,注解处理器相当于编译器的插件,开发人员可以通过它对前端编译施加影响。
- 编译后端的优化措施主要目的是生成更高效的机器代码,提高运行效率。提前编译在程序运行前编译字节码,相当于提前预热。而即时编译器在运行时动态监控程序运行,探测得热点代码后编译为本地代码,生成的代码更高效,但需要预热期。