Java代码是如何在机器上运行的?

简介: 计算机能识别的是机器指令码,简称机器码。机器码是二进制的,计算机可以直接识别,但与人类的语言差别太大,不容易被人理解和记忆。后来,就诞生了各种高级语言,人们用高级语言编写程序,然后通过把程序解释或编译成机器码。

概览


计算机能识别的是机器指令码,简称机器码。机器码是二进制的,计算机可以直接识别,但与人类的语言差别太大,不容易被人理解和记忆。后来,就诞生了各种高级语言,人们用高级语言编写程序,然后通过把程序解释或编译成机器码。

比如python,就是一种解释型语言。Python程序源码不需要编译,可以直接从源代码运行程序。Python解释器将源代码转换为字节码,然后把编译好的字节码转发到Python虚拟机(PVM)中进行执行。

而C语言就是典型的编译型语言,需要先用编译器编译成机器码,比如我们通常用gcc来编译C语言程序:

$ gcc hello.c # 编译
$ ./a.out # 执行
hello world!

那Java是解释型语言还是编译型语言呢?

Java是兼具编译型语言与解释型语言的特点的。程序员写好Java程序后,需要先用javac编译成JVM可以使用的字节码class文件。然后JVM加载class文件,逐条解释执行。在运行过程中,部分热点代码会被即时编译器编译成机器码。


源代码到字节码

Java语言的源代码是.java为后缀的文件。当然现在有很多其它高级语言也架构在JVM上,比如groovy、kotlin等。源代码是给人看的,易于阅读、理解、维护。

源代码经过编译后得到字节码,字节码是给JVM用的,易于理解和识别。字节码是以.class为后缀,其格式是JVM的一套规划,字节码人类对照文档也是勉强能看懂的,只是相对Java代码来说要难以理解一些而已。

Java与Python不同,Python不需要编译字节码文件(当然,Python也提供了这种操作),编译是一个自动的过程,一般不会在意它的存在。而Java会先编译好字节码文件,这样JVM直接读字节码文件,可以节省加载模块的时间,提高效率。同时字节码的形式也增加了反向工程的难度,可以保护源代码(当然,也可以被反编译)。

熟悉JVM的小伙伴都知道,它有一个“类加载过程”,可以说是老八股文了,经常会被面试官问到。类加载过程其实就是指的JVM从读取一个class文件到准备好这个类,以及最后销毁的整个过程。

所以class文件其实是以“类”为单位的,这跟java文件有一些不同。如果我们在一个Java文件里面声明多个类,用Javac编译出来会发现有多个class文件。比如我们声明一个One.java文件:

public class One {
  public class OneInner {}
  private class OnePrivateInner {}
  public static class OneStaticInner {}
  private static class OneprivateStaticInner {}
}
class Two{}

用Javac编译后,会出现6个class文件

➜  $ ls
'One$OneInner.class'         'One$OneStaticInner.class'          One.class   Two.class
'One$OnePrivateInner.class'  'One$OneprivateStaticInner.class'   One.java


字节码到机器码

加载和使用字节码

前面提到,JVM会加载class文件,然后加载后的Java类会被存放于方法区(Method Area)中。从指定的类的main方法作为入口开始运行。实际运行时,虚拟机会执行方法区内的代码,JVM会使用堆和栈来存储运行时数据。

每当进入一个方法,Java虚拟机会在当前线程的栈中生成一个栈帧,存放局部变量以及字节码的操作数,这个栈帧的大小是提前计算好的。

网络异常,图片无法展示
|

退出方法时,不管是正常返回还是异常返回,Java虚拟机均会弹出当前线程的当前栈帧,并将之舍弃。

Java虚拟机需要将字节码翻译成机器码,才能让机器执行。这个过程有两种形式,一种是解释执行,即逐条将字节码翻译成机器码并执行;另一种是即时编译(Just-In-Time compilation,JIT),即将一个方法中包含的所有字节码编译成机器码后再执行。

网络异常,图片无法展示
|

分层编译

这两种编译方式是怎么协作的呢?

HotSpot虚拟机包含多个即时编译器C1、C2和Graal。其中,Graal是一个实验性质的即时编译器,可以通过参数 -XX:+UnlockExperimentalVMOptions -XX:+UseJVMCICompiler启用,并且替换C2。

C1和C2各有优劣,适用于不同的场景。在Java 7以前,只能选择一种编译器。C1编译快,但生成的代码执行效率一般,常用于对于执行时间较短的,或者对启动性能有要求的程序,常用于客户端;C2编译慢,但生成的代码执行效率快,适用于对于执行时间较长的,或者对峰值性能有要求的程序,常用于服务端。实际上,C1对应的参数是client,C2对应的参数是server,也跟它们的应用场景比较匹配。

Java7引入了分层编译的概念,综合了C1的启动性能优势和C2的峰值性能优势。C1和C2编译出的机器码是不同的。C2代码的执行效率要比C1代码高出30%以上。机器码越快,需要的编译时间就越长。分层编译是一种折衷的方式,既能够满足部分不那么热的代码能够在短时间内编译完成,也能满足很热的代码能够拥有最好的优化。

热点代码

那怎么判定热点代码呢?

JVM会收集方法的运行时信息,主要包括调用次数和循环回边的次数。当方法的调用次数和循环回边的次数的和,超过指定阈值时,便会触发即时编译。

循环回边次数可以简单理解为方法内部代码的循环次数,比如方法内部有for循环或while循环。

在分层编译出现前,这个阈值是由参数-XX:CompileThreshold指定的,使用C1时,该值为1500;使用C2时,该值为10000。

当启用分层编译时,JVM使用另一套阈值系统。在这套系统中,阈值的大小是动态调整的。JVM将阈值与某个系数 s 相乘。该系数与当前待编译的方法数目成正相关,与编译线程的数目成负相关。

编译线程

默认情况下编译线程的总数目是根据处理器数量来调整的。Java 虚拟机会将这些编译线程按照1:2的比例分配给 C1和C2(至少各为1个)。举个例子,对于一个四核机器来说,总的编译线程数目为3,其中包含一个C1编译线程和两个C2编译线程。

机器资源太少的时候,也可能各1个线程。

用arthas可以看到编译线程:

网络异常,图片无法展示
|

可以看到,它们的ID是-1,优先级也是-1。我们自己创建的线程优先级是0~10,所以编译线程的优先级会更高一些。


总结


一句话来总结Java程序是怎么在机器上运行的呢?首先Java程序员编写Java代码,然后Java代码会被编译成class文件,多个class文件会被打包成jar包或者war包。然后JVM加载class文件,然后先解释执行为字节码。程序运行一段时间后,JVM会通过方法调用次数和循环持续判断一个方法是否为热点代码,如果是,会使用分层编译,通过编译线程编译成字节码,在机器上运行。

目录
相关文章
|
12天前
|
Kubernetes jenkins 持续交付
从代码到k8s部署应有尽有系列-java源码之String详解
本文详细介绍了一个基于 `gitlab + jenkins + harbor + k8s` 的自动化部署环境搭建流程。其中,`gitlab` 用于代码托管和 CI,`jenkins` 负责 CD 发布,`harbor` 作为镜像仓库,而 `k8s` 则用于运行服务。文章具体介绍了每项工具的部署步骤,并提供了详细的配置信息和示例代码。此外,还特别指出中间件(如 MySQL、Redis 等)应部署在 K8s 之外,以确保服务稳定性和独立性。通过本文,读者可以学习如何在本地环境中搭建一套完整的自动化部署系统。
38 0
|
5天前
|
存储 Java 开发者
【Java新纪元启航】JDK 22:解锁未命名变量与模式,让代码更简洁,思维更自由!
【9月更文挑战第7天】JDK 22带来的未命名变量与模式匹配的结合,是Java编程语言发展历程中的一个重要里程碑。它不仅简化了代码,提高了开发效率,更重要的是,它激发了我们对Java编程的新思考,让我们有机会以更加自由、更加创造性的方式解决问题。随着Java生态系统的不断演进,我们有理由相信,未来的Java将更加灵活、更加强大,为开发者们提供更加广阔的舞台。让我们携手并进,共同迎接Java新纪元的到来!
29 11
|
2天前
|
并行计算 Java 开发者
探索Java中的Lambda表达式:简化代码,提升效率
Lambda表达式在Java 8中引入,旨在简化集合操作和并行计算。本文将通过浅显易懂的语言,带你了解Lambda表达式的基本概念、语法结构,并通过实例展示如何在Java项目中应用Lambda表达式来优化代码,提高开发效率。我们将一起探讨这一现代编程工具如何改变我们的Java编码方式,并思考它对程序设计哲学的影响。
|
3天前
|
安全 Java 测试技术
掌握Java的并发编程:解锁高效代码的秘密
在Java的世界里,并发编程就像是一场精妙的舞蹈,需要精准的步伐和和谐的节奏。本文将带你走进Java并发的世界,从基础概念到高级技巧,一步步揭示如何编写高效、稳定的并发代码。让我们一起探索线程池的奥秘、同步机制的智慧,以及避免常见陷阱的策略。
|
12天前
|
Java Devops 持续交付
探索Java中的Lambda表达式:简化代码,提升效率DevOps实践:持续集成与部署的自动化之路
【8月更文挑战第30天】本文深入探讨了Java 8中引入的Lambda表达式如何改变了我们编写和管理代码的方式。通过简化代码结构,提高开发效率,Lambda表达式已成为现代Java开发不可或缺的一部分。文章将通过实际例子展示Lambda表达式的强大功能和优雅用法。
|
12天前
|
Java
用JAVA架建List集合为树形结构的代码方法
这段代码定义了一个表示树形结构的 `Node` 类和一个用于构建树形结构的 `TreeController`。`Node` 类包含基本属性如 `id`、`pid`、`name` 和 `type`,以及子节点列表 `children`。`TreeController` 包含初始化节点列表并将其转换为树形结构的方法。通过过滤和分组操作实现树形结构的构建。详情可见:[代码示例链接1](http://www.zidongmutanji.com/zsjx/43551.html),[代码效果参考链接2](https://www.257342.com/sitemap/post.html)。
25 5
|
10天前
|
Java API 开发者
代码小妙招:用Java轻松获取List交集数据
在Java中获取两个 `List`的交集可以通过 `retainAll`方法和Java 8引入的流操作来实现。使用 `retainAll`方法更为直接,但会修改原始 `List`的内容。而使用流则提供了不修改原始 `List`、更为灵活的处理方式。开发者可以根据具体的需求和场景,选择最适合的方法来实现。了解和掌握这些方法,能够帮助开发者在实际开发中更高效地处理集合相关的问题。
10 1
|
12天前
|
Java
java代码和详细的代码应用
代码块分为局部、构造、静态和同步代码块。局部代码块控制变量生命周期,例如 `int a` 只在特定代码块内有效。构造代码块用于创建对象时执行附加功能,避免构造方法中代码重复。静态代码块随类加载执行一次,常用于初始化操作。同步代码块确保多线程环境下方法执行的原子性,通过 `synchronized` 关键字实现。
22 3
|
12天前
|
Java
Java中的Lambda表达式:简化代码,提升效率
【8月更文挑战第31天】Lambda表达式在Java 8中引入,旨在使代码更加简洁和易读。本文将探讨Lambda表达式的基本概念、使用场景及如何通过Lambda表达式优化Java代码。我们将通过实际示例来展示Lambda表达式的用法和优势,帮助读者更好地理解和应用这一特性。
|
12天前
|
Java C# 容器
Java代码的第一行实战
这段代码展示了Java的基本结构,包括`package`(包)、`public`(访问修饰符)、`class`(类)、`static`(静态)、`void`(空)及`System.out.println()`(系统输出)。同时介绍了Java中的注释、数据类型(如`byte`、`short`、`int`、`long`、`float`、`double`、`char`、`boolean`)、变量、常量、运算符、类型转换、赋值运算符、关系运算符与逻辑运算符等内容。通过生动的例子帮助理解各种概念。
18 2