1. 类文件结构
我们直到,编译 .java 文件可以得到 .class 类字节码文件。
下面是一个简单的名为 HelloWorld.java 文件
public class HelloWorld { public static void main(String[] args) { System.out.println("hello world"); } }
经过编译后得到 HelloWorld.class 文件,其内容使用十六进制方式查看:
0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09 0000020 00 16 00 17 08 00 18 0a 00 19 00 1a 07 00 1b 07 0000040 00 1c 01 00 06 3c 69 6e 69 74 3e 01 00 03 28 29 0000060 56 01 00 04 43 6f 64 65 01 00 0f 4c 69 6e 65 4e 0000100 75 6d 62 65 72 54 61 62 6c 65 01 00 12 4c 6f 63 0000120 61 6c 56 61 72 69 61 62 6c 65 54 61 62 6c 65 01 0000140 00 04 74 68 69 73 01 00 1d 4c 63 6e 2f 69 74 63 0000160 61 73 74 2f 6a 76 6d 2f 74 35 2f 48 65 6c 6c 6f 0000200 57 6f 72 6c 64 3b 01 00 04 6d 61 69 6e 01 00 16 0000220 28 5b 4c 6a 61 76 61 2f 6c 61 6e 67 2f 53 74 72 0000240 69 6e 67 3b 29 56 01 00 04 61 72 67 73 01 00 13 0000260 5b 4c 6a 61 76 61 2f 6c 61 6e 67 2f 53 74 72 69 0000300 6e 67 3b 01 00 10 4d 65 74 68 6f 64 50 61 72 61 0000320 6d 65 74 65 72 73 01 00 0a 53 6f 75 72 63 65 46 0000340 69 6c 65 01 00 0f 48 65 6c 6c 6f 57 6f 72 6c 64 0000360 2e 6a 61 76 61 0c 00 07 00 08 07 00 1d 0c 00 1e 0000400 00 1f 01 00 0b 68 65 6c 6c 6f 20 77 6f 72 6c 64 0000420 07 00 20 0c 00 21 00 22 01 00 1b 63 6e 2f 69 74 0000440 63 61 73 74 2f 6a 76 6d 2f 74 35 2f 48 65 6c 6c 0000460 6f 57 6f 72 6c 64 01 00 10 6a 61 76 61 2f 6c 61 0000500 6e 67 2f 4f 62 6a 65 63 74 01 00 10 6a 61 76 61 0000520 2f 6c 61 6e 67 2f 53 79 73 74 65 6d 01 00 03 6f 0000540 75 74 01 00 15 4c 6a 61 76 61 2f 69 6f 2f 50 72 0000560 69 6e 74 53 74 72 65 61 6d 3b 01 00 13 6a 61 76 0000600 61 2f 69 6f 2f 50 72 69 6e 74 53 74 72 65 61 6d 0000620 01 00 07 70 72 69 6e 74 6c 6e 01 00 15 28 4c 6a 0000640 61 76 61 2f 6c 61 6e 67 2f 53 74 72 69 6e 67 3b 0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01 0000700 00 07 00 08 00 01 00 09 00 00 00 2f 00 01 00 01 0000720 00 00 00 05 2a b7 00 01 b1 00 00 00 02 00 0a 00 0000740 00 00 06 00 01 00 00 00 04 00 0b 00 00 00 0c 00 0000760 01 00 00 00 05 00 0c 00 0d 00 00 00 09 00 0e 00 0001000 0f 00 02 00 09 00 00 00 37 00 02 00 01 00 00 00 0001020 09 b2 00 02 12 03 b6 00 04 b1 00 00 00 02 00 0a 0001040 00 00 00 0a 00 02 00 00 00 06 00 08 00 07 00 0b 0001060 00 00 00 0c 00 01 00 00 00 09 00 10 00 11 00 00 0001100 00 12 00 00 00 05 01 00 10 00 00 00 01 00 13 00 0001120 00 00 02 00 14
Class 文件格式
类型 | 名称 |
u4 | magic |
u2 | minor_version |
u2 | major_version |
u2 | constant_pool_count |
cp_info | constant_pool |
u2 | access_flags |
u2 | this_class |
u2 | super_class |
u2 | interfaces_count |
u2 | interfaces |
u2 | fields_count |
field_info | fields |
u2 | methods_count |
method_info | methods |
u2 | attributes_count |
attribute_info | attributes |
根据 JVM 规范, Class 文件格式采用一种类似于 C 语言的结构体的伪结构体来存储数据,这种伪结构中只有两种数据类型:无符号数和表。
无符号数属于基本的数据类型,以 u1、u2、u4、u8 来分别代表 1 个字节、2 个字节、4 个字节和 8 个字节的无符号数,无符号数可以用来描述数字、索引引用、数量之或者按照 UTF-8 编码构成字符串值。
1.1 魔数
每个 Class 文件的头 4 个字节为魔数(Magic Number),它的唯一作用是确定这个文件是否为一个能被虚拟机接受的 Class 文件。
对应字节码文件的 0~3 个字节:
0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09
1.2 版本号
紧接着,第 5 和 第 6 个字节是次版本号(Minor Version),第 7 和 第 8 个字节是主版本号(Major Version)。Java 版本号是从十进制的 45 开始的,这里 16 进制的 34 也就是十进制的 52,也就是 Java 8 版本。
0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09
1.3 常量池
紧跟着版本号之后就是常量池入口,可以将它理解为 Class 文件中的资源仓库,是占用 Class 文件空间最大的数据项目之一。
8~9 字节,表示常量池长度,00 23 (35) 表示常量池有 #1~#34项,注意 #0 项不计入,也没有值
0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09
1.4 访问标识与继承信息
1.5 字段表信息
1.6 方法表信息
1.7 属性表集合
2. 字节码指令
参考 Oracle 官网资料:
https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html#jvms-6.5
Oracle 还提供了 javap 工具反编译 Class 文件
javap -v HelloWorld
Classfile HelloWorld.class Last modified 2022-3-29; size 555 bytes MD5 checksum 66459c9d86936e88b74e59657176cfcc Compiled from "HelloWorld.java" public class com.hzz.t1.HelloWorld minor version: 0 major version: 52 flags: ACC_PUBLIC, ACC_SUPER Constant pool: #1 = Methodref #6.#20 // java/lang/Object."<init>":()V #2 = Fieldref #21.#22 // java/lang/System.out:Ljava/io/PrintStream; #3 = String #23 // hello world #4 = Methodref #24.#25 // java/io/PrintStream.println:(Ljava/lang/String;)V #5 = Class #26 // com/hzz/t1/HelloWorld #6 = Class #27 // java/lang/Object #7 = Utf8 <init> #8 = Utf8 ()V #9 = Utf8 Code #10 = Utf8 LineNumberTable #11 = Utf8 LocalVariableTable #12 = Utf8 this #13 = Utf8 Lcom/hzz/t1/HelloWorld; #14 = Utf8 main #15 = Utf8 ([Ljava/lang/String;)V #16 = Utf8 args #17 = Utf8 [Ljava/lang/String; #18 = Utf8 SourceFile #19 = Utf8 HelloWorld.java #20 = NameAndType #7:#8 // "<init>":()V #21 = Class #28 // java/lang/System #22 = NameAndType #29:#30 // out:Ljava/io/PrintStream; #23 = Utf8 hello world #24 = Class #31 // java/io/PrintStream #25 = NameAndType #32:#33 // println:(Ljava/lang/String;)V #26 = Utf8 com/hzz/t1/HelloWorld #27 = Utf8 java/lang/Object #28 = Utf8 java/lang/System #29 = Utf8 out #30 = Utf8 Ljava/io/PrintStream; #31 = Utf8 java/io/PrintStream #32 = Utf8 println #33 = Utf8 (Ljava/lang/String;)V { public com.hzz.t1.HelloWorld(); descriptor: ()V flags: ACC_PUBLIC Code: stack=1, locals=1, args_size=1 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return LineNumberTable: line 8: 0 LocalVariableTable: Start Length Slot Name Signature 0 5 0 this Lcom/hzz/t1/HelloWorld; public static void main(java.lang.String[]); descriptor: ([Ljava/lang/String;)V flags: ACC_PUBLIC, ACC_STATIC Code: stack=2, locals=1, args_size=1 0: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream; 3: ldc #3 // String hello world 5: invokevirtual #4 // Method java/io/PrintStream.println:(Ljava/lang/String;)V 8: return LineNumberTable: line 10: 0 line 11: 8 LocalVariableTable: Start Length Slot Name Signature 0 9 0 args [Ljava/lang/String; }
2.3 图解方法执行流程
案列代码如下:
public class Demo3_1 { public static void main(String[] args) { int a = 10; int b = Short.MAX_VALUE + 1; int c = a + b; System.out.println(c); } }
使用 javap 工具编译后的字节码文件内容如下:
Classfile Demo3_1.class Last modified 2022-4-9; size 605 bytes MD5 checksum 76b6e22dfd6f735f6f21c833c80ebca6 Compiled from "Demo3_1.java" public class com.hzz.t3.Demo3_1 minor version: 0 major version: 52 flags: ACC_PUBLIC, ACC_SUPER Constant pool: #1 = Methodref #7.#25 // java/lang/Object."<init>":()V #2 = Class #26 // java/lang/Short #3 = Integer 32768 #4 = Fieldref #27.#28 // java/lang/System.out:Ljava/io/PrintStream; #5 = Methodref #29.#30 // java/io/PrintStream.println:(I)V #6 = Class #31 // com/hzz/t3/Demo3_1 #7 = Class #32 // java/lang/Object #8 = Utf8 <init> #9 = Utf8 ()V #10 = Utf8 Code #11 = Utf8 LineNumberTable #12 = Utf8 LocalVariableTable #13 = Utf8 this #14 = Utf8 Lcom/hzz/t3/Demo3_1; #15 = Utf8 main #16 = Utf8 ([Ljava/lang/String;)V #17 = Utf8 args #18 = Utf8 [Ljava/lang/String; #19 = Utf8 a #20 = Utf8 I #21 = Utf8 b #22 = Utf8 c #23 = Utf8 SourceFile #24 = Utf8 Demo3_1.java #25 = NameAndType #8:#9 // "<init>":()V #26 = Utf8 java/lang/Short #27 = Class #33 // java/lang/System #28 = NameAndType #34:#35 // out:Ljava/io/PrintStream; #29 = Class #36 // java/io/PrintStream #30 = NameAndType #37:#38 // println:(I)V #31 = Utf8 com/hzz/t3/Demo3_1 #32 = Utf8 java/lang/Object #33 = Utf8 java/lang/System #34 = Utf8 out #35 = Utf8 Ljava/io/PrintStream; #36 = Utf8 java/io/PrintStream #37 = Utf8 println #38 = Utf8 (I)V { public com.hzz.t3.Demo3_1(); descriptor: ()V flags: ACC_PUBLIC Code: stack=1, locals=1, args_size=1 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return LineNumberTable: line 9: 0 LocalVariableTable: Start Length Slot Name Signature 0 5 0 this Lcom/hzz/t3/Demo3_1; public static void main(java.lang.String[]); descriptor: ([Ljava/lang/String;)V flags: ACC_PUBLIC, ACC_STATIC Code: stack=2, locals=4, args_size=1 0: bipush 10 2: istore_1 3: ldc #3 // int 32768 5: istore_2 6: iload_1 7: iload_2 8: iadd 9: istore_3 10: getstatic #4 // Field java/lang/System.out:Ljava/io/PrintStream; 13: iload_3 14: invokevirtual #5 // Method java/io/PrintStream.println:(I)V 17: return LineNumberTable: line 11: 0 line 12: 3 line 13: 6 line 14: 10 line 15: 17 LocalVariableTable: Start Length Slot Name Signature 0 18 0 args [Ljava/lang/String; 3 15 1 a I 6 12 2 b I 10 8 3 c I }
执行流程:
- 常量池载入运行时常量池
- 其实,常量池也是方法区的一部分,只不过这里单独提出来,便于讲解需要。
- 方法字节码载入方法区
(stack=2,locals=4) 对应操作数栈有2个空间(每个空间4个字节),局部变量表中有4个槽位
执行引擎开始执行字节码
bipush 10:将一个 byte 压入操作数栈(其长度会补齐4个字节),类似的指令还有如:
1、sipush 将一个 short 压入操作数栈(其长度会补齐 4 个字节)
2、ldc 将一个 int 压入操作数栈
3、ldc2_w 将一个 long 压入操作数栈(分两次压入,因为 long 是 8 个字节)
4、这里小的数字都是和字节码指令存在一起,超过 short 范围的数字存入了常量池
istore_1:将操作数栈顶元素弹出,存入局部变量表的 slot 1
对应代码中的 a = 10
ldc #3:就是从常量池中加载 #3 数据 32768 (超过short最大值范围的数会被放到运行时常量池中) 到操作数栈中。需要注意的是, Short.MAX_VALUE 是 32767,所以 32768 = Short.MAX_VALUE + 1 实际是在编译期间计算好的。
istore_2:将操作数栈顶元素弹出,存入局部变量表的 slot 2
iload_1 和 iload_2:将局部变量表中的 1 号和 2 号位置的元素放到操作数栈中,因为执行运算只能在操作数栈中进行。
iadd:将操作数栈中的两个元素弹出栈并相加,结果再压入栈中。
istore_3:将操作数栈中的元素弹出,放入局部变量表的 3 号位置。
getstatic #4: 在运行时常量池中找到 #4,发现是一个对象则在堆内存中找到该对象,并将其引用放入操作数栈中。
iload_3:将局部变量表中的 3 号位置的元素放到操作数栈中。
invokevirtual #5:找到常量池 #5 项,定位到方法区 java/io/PrintStream.println:(I)V 方法,生成新的栈帧(分配 locals、stack等),传递参数,执行新栈帧中的字节码。
执行完毕,弹出栈帧,并清除 main 操作数栈内容。
return:完成 main 方法调用,弹出 main 栈帧,程序结束。
2.4 分析 i++
从字节码角度触发分析 i++ 问题。
案列源代码如下:
public class Demo3_2 { public static void main(String[] args) { int a = 10; int b = a++ + ++a + a--; System.out.println(a); System.out.println(b); } }
字节码:
Classfile /D:/java学习/深入理解java虚拟机/out/production/深入理解java虚拟机/com/hzz/t3/Demo3_2.class Last modified 2022-4-9; size 580 bytes MD5 checksum f648b33283c98b6a960614f1fae5e7e6 Compiled from "Demo3_2.java" public class com.hzz.t3.Demo3_2 minor version: 0 major version: 52 flags: ACC_PUBLIC, ACC_SUPER Constant pool: #1 = Methodref #5.#22 // java/lang/Object."<init>":()V #2 = Fieldref #23.#24 // java/lang/System.out:Ljava/io/PrintStream; #3 = Methodref #25.#26 // java/io/PrintStream.println:(I)V #4 = Class #27 // com/hzz/t3/Demo3_2 #5 = Class #28 // java/lang/Object #6 = Utf8 <init> #7 = Utf8 ()V #8 = Utf8 Code #9 = Utf8 LineNumberTable #10 = Utf8 LocalVariableTable #11 = Utf8 this #12 = Utf8 Lcom/hzz/t3/Demo3_2; #13 = Utf8 main #14 = Utf8 ([Ljava/lang/String;)V #15 = Utf8 args #16 = Utf8 [Ljava/lang/String; #17 = Utf8 a #18 = Utf8 I #19 = Utf8 b #20 = Utf8 SourceFile #21 = Utf8 Demo3_2.java #22 = NameAndType #6:#7 // "<init>":()V #23 = Class #29 // java/lang/System #24 = NameAndType #30:#31 // out:Ljava/io/PrintStream; #25 = Class #32 // java/io/PrintStream #26 = NameAndType #33:#34 // println:(I)V #27 = Utf8 com/hzz/t3/Demo3_2 #28 = Utf8 java/lang/Object #29 = Utf8 java/lang/System #30 = Utf8 out #31 = Utf8 Ljava/io/PrintStream; #32 = Utf8 java/io/PrintStream #33 = Utf8 println #34 = Utf8 (I)V { public com.hzz.t3.Demo3_2(); descriptor: ()V flags: ACC_PUBLIC Code: stack=1, locals=1, args_size=1 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return LineNumberTable: line 7: 0 LocalVariableTable: Start Length Slot Name Signature 0 5 0 this Lcom/hzz/t3/Demo3_2; public static void main(java.lang.String[]); descriptor: ([Ljava/lang/String;)V flags: ACC_PUBLIC, ACC_STATIC Code: stack=2, locals=3, args_size=1 0: bipush 10 2: istore_1 3: iload_1 4: iinc 1, 1 7: iinc 1, 1 10: iload_1 11: iadd 12: iload_1 13: iinc 1, -1 16: iadd 17: istore_2 18: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream; 21: iload_1 22: invokevirtual #3 // Method java/io/PrintStream.println:(I)V 25: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream; 28: iload_2 29: invokevirtual #3 // Method java/io/PrintStream.println:(I)V 32: return LineNumberTable: line 9: 0 line 10: 3 line 11: 18 line 12: 25 line 13: 32 LocalVariableTable: Start Length Slot Name Signature 0 33 0 args [Ljava/lang/String; 3 30 1 a I 18 15 2 b I }
bipush 10:将一个数字 10 压入操作数栈(其长度会补齐4个字节)。
istore_1:弹出栈顶元素到局部变量表 1 号位置。
iload_1:将局部变量表 1 号位置的元素放到操作数栈中。
iinc 1,1:直接在局部变量 slot 1 位置上进行运算,自增 1.
iinc 1,1:在局部变量 slot 1 位置上进行运算,自增 1.
iload_1:将局部变量表 slot 1 位置上的元素放入到操作数栈中。
iadd:将操作数栈中的元素进行相加操作,结果压入栈顶。
iload_1:将局部变量表 slot 1 位置上的元素放入到操作数栈中。
iinc 1,-1:将局部变量表 slot 1 位置上的元素进行自减 1 操作。
iadd:对操作数栈中的元素进行相加,结果压入栈中。
istore_2:弹出操作数栈的栈顶元素到局部变量表 slot 2 位置上。
2.5 条件判断指令
说明:
- byte,short,char 都会按 int 比较,因为操作数栈都是 4 字节
- goto 用来进行跳转到指定行号的字节码
案例源码:
public class Demo3_3 { public static void main(String[] args) { int a = 10; if (a == 10) { a = 10; } else { a = 20; } } }
字节码:
0: bipush 10 2: istore_1 3: iload_1 4: bipush 10 6: if_icmpne 15 9: bipush 10 11: istore_1 12: goto 18 15: bipush 20 17: istore_1 18: return
2.6 循环控制指令
案例源代码:
public class Demo3_4 { public static void main(String[] args) { int a = 10; while (a < 10) { a++; } } }
字节码:
0: bipush 10 2: istore_1 3: iload_1 4: bipush 10 6: if_icmpge 15 9: iinc 1, 1 12: goto 3 15: return
2.7 构造方法
1、< cinit> () V
案例源代码:
public class Demo3_8_1 { static int i = 10; static { i = 20; } static { i = 30; } }
编译器会按从上至下的顺序,收集所有 static 静态代码块和静态成员赋值的代码,合并为一个特殊的方法 < cinit>()V ,字节码如下:
Code: stack=1, locals=0, args_size=0 0: bipush 10 2: putstatic #2 // Field i:I 5: bipush 20 7: putstatic #2 // Field i:I 10: bipush 30 12: putstatic #2 // Field i:I 15: return
编译器会按从上至下的顺序,收集所有 static 静态代码块和静态成员赋值的代码,合并为一个特殊的方法 < cinit>()V ,字节码如下:
Code: stack=1, locals=0, args_size=0 0: bipush 10 2: putstatic #2 // Field i:I 5: bipush 20 7: putstatic #2 // Field i:I 10: bipush 30 12: putstatic #2 // Field i:I 15: return
< cinit>()V 方法会在类加载的初始化阶段被调用。
2、< init>()V
案例源代码:
public class Demo3_8_2 { private String a = "s1"; { b = 20; } private int b = 20; { a = "s2"; } public Demo3_8_2(String a, int b ) { this.a = a; this.b = b; } public static void main(String[] args) { Demo3_8_2 d = new Demo3_8_2("s3", 30); System.out.println(d.a); System.out.println(d.b); } }
编译器会按从上至下的顺序,收集所有 {} 代码块和成员变量赋值的代码,形成新的构造方法,但原始构造方法内的代码总是在最后。
public com.hzz.t3.Demo3_8_2(java.lang.String, int); descriptor: (Ljava/lang/String;I)V flags: ACC_PUBLIC Code: stack=2, locals=3, args_size=3 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: aload_0 5: ldc #2 // String s1 7: putfield #3 // Field a:Ljava/lang/String; 10: aload_0 11: bipush 20 13: putfield #4 // Field b:I 16: aload_0 17: bipush 20 19: putfield #4 // Field b:I 22: aload_0 23: ldc #5 // String s2 25: putfield #3 // Field a:Ljava/lang/String; 28: aload_0 29: aload_1 // s3 30: putfield #3 // Field a:Ljava/lang/String; 33: aload_0 34: iload_2 // 30 35: putfield #4 // Field b:I 38: return LineNumberTable: line 20: 0 line 8: 4 line 11: 10 line 14: 16 line 17: 22 line 21: 28 line 22: 33 line 23: 38 LocalVariableTable: Start Length Slot Name Signature 0 39 0 this Lcom/hzz/t3/Demo3_8_2; 0 39 1 a Ljava/lang/String; 0 39 2 b I
2.8 方法调用
看一下几种不同的方法调用对应的字节码指令。
案列源码:
public class Demo3_9 { private void test1() { } private final void test2() { } public void test3() { } public static void test4() { } public static void main(String[] args) { Demo3_9 d = new Demo3_9(); d.test1(); d.test2(); d.test3(); Demo3_9.test4(); } }
字节码:
Code: stack=2, locals=2, args_size=1 0: new #2 // class com/czh/t3/Demo3_9 3: dup 4: invokespecial #3 // Method "<init>":()V 7: astore_1 8: aload_1 9: invokespecial #4 // Method test1:()V 12: aload_1 13: invokespecial #5 // Method test2:()V 16: aload_1 17: invokevirtual #6 // Method test3:()V 20: invokestatic #7 // Method test4:()V 23: return
new 是创建【对象】,给对象分配堆内存,执行成功会将【对象引用】压入操作数栈
dup 是复制操作数栈栈顶的内容,本例即为【对象引用】,为什么需要两份引用呢,一个是要配合 invokespecial 调用该对象的构造方法 “< init>”: ()V (会消耗掉栈顶一个引用),另一个要配合 astore_1 赋值给局部变量
最终方法(final),私有方法(private),构造方法都是由 invokespecial 指令来调用,属于静态绑定
普通成员方法是由 invokevirtual 调用,属于动态绑定,即支持多态
成员方法与静态方法调用的另一个区别是,执行方法前是否需要【对象引用】
2.9 多态的原理
因为普通成员方法需要在运行时才能确定具体的内容,所以虚拟机需要调用 invokevirtual 指令。
在执行 invokevirtual 指令时,经历了以下几个步骤:
先通过栈帧中的对象引用找到对象
分析对象头,找到对象的实际 Class
Class 结构中有 vtable,它在类加载的链接阶段就已经根据方法的重写规则生成好了
查表得到方法的具体地址
执行方法的字节码
2.10 异常处理
2.10.1 try-catch
案例源代码:
public class Demo3_11_1 { public static void main(String[] args) { int i = 0; try { i = 10; } catch (Exception e) { i = 20; } } }
字节码:
Code: stack=1, locals=3, args_size=1 0: iconst_0 1: istore_1 2: bipush 10 4: istore_1 5: goto 12 8: astore_2 9: bipush 20 11: istore_1 12: return Exception table: from to target type 2 5 8 Class java/lang/Exception
可以看到多出来一个 Exception table 的结构,[from, to) 是前闭后开的检测范围,一旦这个范围内的字节码执行出现异常,则通过 type 匹配异常类型,如果一致,进入 target 所指示行号
8 行的字节码指令 astore_2 是将异常对象引用存入局部变量表的 slot 2 位置
2.10.2 多个 single-catch
案例源代码:
public class Demo3_11_2 { public static void main(String[] args) { int i = 0; try { i = 10; } catch (ArithmeticException e) { i = 30; } catch (NullPointerException e) { i = 40; } catch (Exception e) { i = 50; } } }
字节码:
Code: stack=1, locals=3, args_size=1 0: iconst_0 1: istore_1 2: bipush 10 4: istore_1 5: goto 26 8: astore_2 9: bipush 30 11: istore_1 12: goto 26 15: astore_2 16: bipush 40 18: istore_1 19: goto 26 22: astore_2 23: bipush 50 25: istore_1 26: return Exception table: from to target type 2 5 8 Class java/lang/ArithmeticException 2 5 15 Class java/lang/NullPointerException 2 5 22 Class java/lang/Exception
因为异常出现时,只能进入 Exception table 中一个分支,所以局部变量表 slot 2 位置被共用。
2.10.3 multi-catch 的情况案例源代码:
public class Demo3_11_3 { public static void main(String[] args) { try { Method test = Demo3_11_3.class.getMethod("test"); test.invoke(null); } catch (NoSuchMethodException | IllegalAccessException | InvocationTargetException e) { e.printStackTrace(); } } public static void test() { System.out.println("ok"); } }
字节码:
Code: stack=3, locals=2, args_size=1 0: ldc #2 // class com/hzz/t3/Demo3_11_3 2: ldc #3 // String test 4: iconst_0 5: anewarray #4 // class java/lang/Class 8: invokevirtual #5 // Method java/lang/Class.getMethod:(Ljava/lang/String;[Ljava/lang/Class;)Ljava/lang/reflect/Method; 11: astore_1 12: aload_1 13: aconst_null 14: iconst_0 15: anewarray #6 // class java/lang/Object 18: invokevirtual #7 // Method java/lang/reflect/Method.invoke:(Ljava/lang/Object;[Ljava/lang/Object;)Ljava/lang/Object; 21: pop 22: goto 30 25: astore_1 26: aload_1 27: invokevirtual #11 // Method java/lang/ReflectiveOperationException.printStackTrace:()V 30: return Exception table: from to target type 0 22 25 Class java/lang/NoSuchMethodException 0 22 25 Class java/lang/IllegalAccessException 0 22 25 Class java/lang/reflect/InvocationTargetException
2.10.4 finally
案例源代码:
public class Demo3_11_4 { public static void main(String[] args) { int i = 0; try { i = 10; } catch (Exception e) { i = 20; } finally { i = 30; } } }
字节码:
Code: stack=1, locals=4, args_size=1 0: iconst_0 1: istore_1 // 0->i 2: bipush 10 // try 4: istore_1 // 10->i 5: bipush 30 // finally 7: istore_1 // 30->i 8: goto 27 // return 11: astore_2 // catch Exception -> e 12: bipush 20 14: istore_1 // 20->i 15: bipush 30 // finally 17: istore_1 // 30->i 18: goto 27 // return 21: astore_3 // catch any_>slot 3 22: bipush 30 // finally 24: istore_1 // 30->i 25: aload_3 // <- slot 3 26: athrow // throw 27: return Exception table: from to target type 2 5 11 Class java/lang/Exception 2 5 21 any // 剩余的异常类型,比如 Error 11 15 21 any // 剩余的异常类型,比如 Error
可以看到 finally 中的代码被复制了 3 份,分别放入 try 流程,catch 流程以及 catch 剩余的异常类型流程,但是 finally 语句只能执行一次。
2.10.5 finally 出现了 return
案例源代码:
public class Demo3_12_2 { public static void main(String[] args) { int result = test(); System.out.println(result); } public static int test() { try { return 10; } finally { return 20; } } }
字节码:
Code: stack=1, locals=2, args_size=0 0: bipush 10 // <- 10 放入栈顶 2: istore_0 // 10 -> slot 0 从栈顶移除了 3: bipush 20 // <- 20 放入栈顶 5: ireturn // 返回栈顶 int(20) 6: astore_1 // catch any -> slot 1 7: bipush 20 // <- 20 放入栈顶 9: ireturn // 返回栈顶 int(20) Exception table: from to target type 0 3 6 any
由于 finally 中的 ireturn 被插入了所有可能的流程,因此返回结果肯定以 finally 的为准
至于字节码中第 2 行,似乎没啥用,且留个伏笔,看下个例子
跟上例中的 finally 相比,发现没有 athrow 了,这告诉我们:如果在 finally 中出现了 return,会吞掉异常,因此不要在 finally 语句中使用 return 语句
案例代码:
public class Demo3_12_1 { public static void main(String[] args) { int result = test(); System.out.println(result); } public static int test() { try { int i = 1 / 0; return 10; } finally { return 20; } } }
字节码:
Code: stack=2, locals=3, args_size=0 0: iconst_1 1: iconst_0 2: idiv 3: istore_0 4: bipush 10 6: istore_1 7: bipush 20 9: ireturn 10: astore_2 11: bipush 20 13: ireturn Exception table: from to target type 0 7 10 any
运行结果为 20,并没有任何异常,同时字节码中也没有 athrow,表明异常确实被吞掉了。
2.11 synchronized
案例源代码:
public class Demo3_13 { public static void main(String[] args) { Object lock = new Object(); synchronized (lock) { System.out.println("ok"); } } }
字节码:
Code: stack=2, locals=4, args_size=1 0: new #2 // class java/lang/Object 3: dup // 复制一份,放到操作数栈顶,用于构造函数消耗 4: invokespecial #1 // Method java/lang/Object."<init>":()V 7: astore_1 // lock 引用 -> lock 8: aload_1 // <- lock (synchronized 开始) 9: dup // 复制一份,放到操作数栈,用于加锁时消耗 10: astore_2 // lock 引用 -> slot 2 11: monitorenter // monitorenter(lock 引用),加锁 12: getstatic #3 // Field java/lang/System.out:Ljava/io/PrintStream; 15: ldc #4 // String ok 17: invokevirtual #5 // Method java/io/PrintStream.println:(Ljava/lang/String;)V 20: aload_2 // <- slot 2(lock引用) 21: monitorexit // monitorexit(lock引用) 22: goto 30 25: astore_3 // any -> slot 3 26: aload_2 // <- slot 2(lock引用) 27: monitorexit // monitorexit(lock引用) 28: aload_3 29: athrow 30: return Exception table: from to target type 12 22 25 any 25 28 25 any
3. 编译器处理
所谓的 ”语法糖“,其实就是指 Java 编译器把 .java 源码编译为 .class 字节码的过程中,自动生成和转换的一些代码,主要是为了减轻程序员的负担,算是 Java 编译器给我们的一个额外福利。
3.1 默认构造器
public class Candy1 { }
经过编译器优化后,编译生成的字节码文件:
public class Candy1 { // 这个无参构造是编译器帮助我们加上的 public Candy1() { super(); // 即调用父类 Object 的无参构造方法,即调用 java/lang/Object." <init>":()V } }
3.2 自动拆装箱
拆装箱就是基本数据类型和其对应的包装类型的互相转换的过程。
这个特性是 JDK 5 开始加入的, 代码片段1 :
public class Candy2 { public static void main(String[] args) { Integer x = 1; int y = x; } }
编译后的字节码文件:
Code: stack=1, locals=3, args_size=1 0: iconst_1 1: invokestatic #2 // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer; 4: astore_1 5: aload_1 6: invokevirtual #3 // Method java/lang/Integer.intValue:()I 9: istore_2 10: return LineNumberTable: line 9: 0 line 10: 5 line 11: 10 LocalVariableTable: Start Length Slot Name Signature 0 11 0 args [Ljava/lang/String; 5 6 1 x Ljava/lang/Integer; 10 1 2 y I
可以看到,编译后的字节码文件中,自动地实现了 1 的装箱以及变量 x 的拆箱操作。
然而上面的代码片段1在 JDK 5 之前是无法编译通过的,必须改写为代码片段2 :
public class Candy2 { public static void main(String[] args) { Integer x = Integer.valueOf(1); int y = x.intValue(); } }
编译后的字节码文件:
Code: stack=1, locals=3, args_size=1 0: iconst_1 1: invokestatic #2 // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer; 4: astore_1 5: aload_1 6: invokevirtual #3 // Method java/lang/Integer.intValue:()I 9: istore_2 10: return LineNumberTable: line 9: 0 line 10: 5 line 11: 10 LocalVariableTable: Start Length Slot Name Signature 0 11 0 args [Ljava/lang/String; 5 6 1 x Ljava/lang/Integer; 10 1 2 y I
通过观察可以发现,JDK 5 之前版本的代码太麻烦了,需要在基本类型和包装类型之间来回转换(尤其是集合类中操作的都是包装类型),因此这些转换的事情在 JDK 5 以后都由编译器在编译阶段完成,即代码片段 1 都会在编译阶段被转换为代码片段 2.
3.3 泛型集合取值
泛型也是在 JDK 5 开始加入的特性,但 Java 在编译泛型代码后会执行泛型擦除的动作,即泛型信息在编译为字节码之后就丢失了,实际的类型都当做了 Object 类型来处理:
public class Candy3 { public static void main(String[] args) { List<Integer> list = new ArrayList<>(); list.add(10); // 实际调用的是 list.add(Object e) Integer x = list.get(0); // 实际调用的是 Object obj = list.get(int index) } }
字节码:
Code: stack=2, locals=3, args_size=1 0: new #2 // class java/util/ArrayList 3: dup 4: invokespecial #3 // Method java/util/ArrayList."<init>":()V 7: astore_1 8: aload_1 9: bipush 10 11: invokestatic #4 // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer; 14: invokeinterface #5, 2 // InterfaceMethod java/util/List.add:(Ljava/lang/Object;)Z 19: pop 20: aload_1 21: iconst_0 22: invokeinterface #6, 2 // InterfaceMethod java/util/List.get:(I)Ljava/lang/Object; 27: checkcast #7 // class java/lang/Integer 30: astore_2 31: return LineNumberTable: line 13: 0 line 14: 8 line 15: 20 line 16: 31 LocalVariableTable: Start Length Slot Name Signature 0 32 0 args [Ljava/lang/String; 8 24 1 list Ljava/util/List; 31 1 2 x Ljava/lang/Integer; LocalVariableTypeTable: Start Length Slot Name Signature 8 24 1 list Ljava/util/List<Ljava/lang/Integer;>;
擦除的是字节码上的泛型信息,可以看到 LocalVariableTypeTable 仍然保留了方法参数泛型的信息。
3.4 可变参数
可变参数也是 JDK 5 开始加入的新特性:
public class Candy4 { public static void foo(String... args) { // 将 args 赋值给 arr,可以看出 String... 实际就是 String[] String[] arry = args; System.out.println(arry); } public static void main(String[] args) { foo("hello", "world"); } }
可变参数 String… args 其实是一个 String[] args ,从代码中的赋值语句中就可以看出来。 同 样 Java 编译器会在编译期间将上述代码变换为:
public class Candy4 { public static void foo(String... args) { // 将 args 赋值给 arr,可以看出 String... 实际就是 String[] String[] arry = args; System.out.println(arry); } public static void main(String[] args) { foo(new String[]{"hello", "world"}); } }
需要注意的是,如果调用的是 foo(),即使未传递参数时,等价代码为 foo(new String[]{}),创建了一个空数组,而不是直接传递的 null.
3.5 foreach 循环
仍是 JDK 5 开始引入的语法糖,数组的循环:
public class Candy5_1 { public static void main(String[] args) { int[] array = {1, 2, 3, 4, 5, 6}; for (int e : array) { System.out.println(e); } } }
会被编译器转化为:
public class Candy5_1 { public Candy5_1() { } public static void main(String[] args) { int[] array = new int[]{1, 2, 3, 4, 5}; for(int i = 0; i < array.length; ++i) { int e = array[i]; System.out.println(e); } } }
当对集合使用 foreach 时
public class Candy5_2 { public static void main(String[] args) { List<Integer> list = Arrays.asList(1, 2, 3, 4, 5); for (Integer i : list) { System.out.println(i); } } }
会被编译器转化为对迭代器的调用:
public class Candy5_2 { public Candy5_2() { } public static void main(String[] args) { List<Integer> list = Arrays.asList(1, 2, 3, 4, 5); // 获取该集合的迭代器 Iterator iter = list.iterator(); while(iter.hasNext()) { Integer e = (Integer)iter.next(); System.out.println(e); } } }
foreach 循环写法,能够配合数组,以及所有实现了 Iterable 接口的集合类一起使用,其中
Iterable 用来获取集合的迭代器( Iterator )。
3.6 switch 字符串
从 JDK 7 开始,switch 可以作用于字符串和枚举类,这个功能其实也是语法糖,例如:
public class Candy6_1 { public static void choose(String str) { switch (str) { case "hello": { System.out.println("h"); break; } case "world": { System.out.println("w"); break; } } } }
public class Candy6_1 { public Candy6_1() { } public static void choose(String str) { byte x = 1; //比较字符串的hasCode是否相等 switch (str.hashCode()) { case 99162322: // hello 的 hashcode if (str.equals("hello")) { // 再次比较,因为hashCode相等不代表相等,还要比较字符串内容 x = 0; } break; case 113318802: // world 的 hashcode if (str.equals("world")) { x = 1; } } // 第二个 switch 用于输出 switch (x) { case 0: System.out.println("h"); break; case 1: System.out.println("w"); } } }
可以看到,执行了两遍 switch,第一遍是根据字符串的 hashCode 和 equals 将字符串的转换为相应 byte 类型,第二遍才是利用 byte 执行进行比较。
为什么第一遍时必须既比较 hashCode,又利用 equals 比较呢?hashCode 是为了提高效率,减少可能的比较;而 equals 是为了防止 hashCode 冲突,例如 BM 和 C. 这两个字符串的hashCode 值都是 2123 ,如果有如下代码:
public class Candy6_2 { public static void choose(String str) { switch (str) { case "BM": { System.out.println("h"); break; } case "C.": { System.out.println("w"); break; } } } }
会被编译器转换为:
public class Candy6_2 { public Candy6_2() { } public static void choose(String str) { byte x = -1; switch(str.hashCode()) { case 2123: if (str.equals("C")) { x = 1; } else if (str.equals("BM")) { x = 0; } default: switch(x) { case 0: System.out.println("h"); break; case 1: System.out.println("w"); } } } }
3.7 switch 枚举
switch 枚举的例子,原始代码:
enum Sex { MALE, FEMALE } public class Candy7 { public static void foo(Sex sex) { switch (sex) { case MALE: System.out.println("男"); break; case FEMALE: System.out.println("女"); break; } } }
public class Demo7 { /** * 定义一个合成类(仅 jvm 使用,对我们不可见) * 用来映射枚举的 ordinal 与数组元素的关系 * 枚举的 ordinal 表示枚举对象的序号,从 0 开始 * 即 MALE 的 ordinal()=0,FEMALE 的 ordinal()=1 */ static class $MAP { //数组大小即为枚举元素个数,里面存放了case用于比较的数字 static int[] map = new int[2]; static { //ordinal即枚举元素对应所在的位置,MALE为 0,FEMALE为 1 map[SEX.MALE.ordinal()] = 1; map[SEX.FEMALE.ordinal()] = 2; } } public static void main(String[] args) { SEX sex = SEX.MALE; //将对应位置枚举元素的值赋给x,用于case操作 int x = $MAP.map[sex.ordinal()]; switch (x) { case 1: System.out.println("man"); break; case 2: System.out.println("woman"); break; default: break; } } } enum SEX { MALE, FEMALE; }
3.8 枚举类
JDK 7 新增了枚举类,以前面的性别枚举为例:
enum Sex { MALE, FEMALE }
转换后代码:
public final class Sex extends Enum<Sex> { //对应枚举类中的元素 public static final Sex MALE; public static final Sex FEMALE; private static final Sex[] $VALUES; static { //调用构造函数,传入枚举元素的值及ordinal MALE = new Sex("MALE", 0); FEMALE = new Sex("FEMALE", 1); $VALUES = new Sex[]{MALE, FEMALE}; } //调用父类中的方法 private Sex(String name, int ordinal) { super(name, ordinal); } public static Sex[] values() { return $VALUES.clone(); } public static Sex valueOf(String name) { return Enum.valueOf(Sex.class, name); } }
3.9 try-with-resources
JDK 7 开始新增了对需要关闭的资源处理的特殊语法 try-with-resources`:
try(资源变量 = 创建资源对象){ } catch( ) { }
其中资源对象需要实现 AutoCloseable 接口,例如 InputStream 、 OutputStream 、
Connection 、 Statement 、 ResultSet 等接口都实现了 AutoCloseable ,使用 try-with-resources 可以不用写 finally 语句块,编译器会帮助生成关闭资源代码,例如:
public class Candy9 { public static void main(String[] args) { try(InputStream is = new FileInputStream("d:\\1.txt")) { System.out.println(is); } catch (IOException e) { e.printStackTrace(); } } }
会被转换为:
public class Candy9 { public static void main(String[] args) { try { InputStream is = new FileInputStream("d:\\1.txt"); Throwable t = null; try { System.out.println(is); } catch (Throwable e1) { // t 是我们代码出现的异常 t = e1; throw e1; } finally { // 判断了资源不为空 if (is != null) { // 如果我们代码有异常 if (t != null) { try { is.close(); } catch (Throwable e2) { // 如果 close 出现异常,作为被压制异常添加 t.addSuppressed(e2); } } else { // 如果我们代码没有异常,close 出现的异常就是最后 catch 块中的e is.close(); } } } } catch (IOException e) { e.printStackTrace(); } } }
为什么要设计一个 addSuppressed(Throwable e) (添加被压制异常)的方法呢?是为了防止异常信息的丢失(想想 try-with-resources 生成的 fianlly 中如果抛出了异常):
public class Test6 { public static void main(String[] args) { try (MyResource resource = new MyResource()) { int i = 1/0; } catch (Exception e) { e.printStackTrace(); } } class MyResource implements AutoCloseable { public void close() throws Exception { throw new Exception("close 异常"); } } }
输出
java.lang.ArithmeticException: / by zero at test.Test6.main(Test6.java:7) Suppressed: java.lang.Exception: close 异常 at test.MyResource.close(Test6.java:18) at test.Test6.main(Test6.java:6)
如以上代码所示,两个异常信息都不会丢。
3.10 方法重写时的桥接方法
我们都知道,方法重写时对返回值分两种情况:
父子类的返回值完全一致
子类返回值可以是父类返回值的子类(比较绕口,见下面的例子)
class A { public Number m() { return 1; } } class B extends A { @Override // 子类 m 方法的返回值是 Integer 是父类 m 方法返回值 Number 的子类 public Integer m() { return 2; } }
对于子类,Java 编译器会做如下处理:
class B extends A { public Integer m() { return 2; } // 此方法才是真正重写了父类 public Number m() 方法 public synthetic bridge Number m() { // 调用 public Integer m() return m(); } }
其中桥接方法比较特殊,仅对 java 虚拟机可见,并且与原来的 public Integer m() 没有命名冲突,可以用下面反射代码来验证:
for (Method m : B.class.getDeclaredMethods()) { System.out.println(m); }
会输出:
public java.lang.Integer test.candy.B.m() public java.lang.Number test.candy.B.m()
3.11 匿名内部类
源代码:
public class Candy11 { public static void main(String[] args) { Runnable runnable = new Runnable() { @Override public void run() { System.out.println("ok"); } }; } }
转换后代码:
// 额外生成的类 final class Candy11$1 implements Runnable { Candy11$1() { } public void run() { System.out.println("ok"); } } public class Candy11 { public static void main(String[] args) { Runnable runnable = new Candy11$1(); } }
引用局部变量的匿名内部类,源代码:
public class Candy11 { public static void test(final int x) { Runnable runnable = new Runnable() { @Override public void run() { System.out.println("ok:" + x); } }; } }
转换后代码:
// 额外生成的类 final class Candy11$1 implements Runnable { int val$x; Candy11$1(int x) { this.val$x = x; } public void run() { System.out.println("ok:" + this.val$x); } }
public class Candy11 { public static void test(final int x) { Runnable runnable = new Candy11$1(x); } }