4.6. 栈顶缓存技术(Top Of Stack Cashing)技术
前面提过,基于栈式架构的虚拟机所使用的零地址指令更加紧凑,但完成一项操作的时候必然需要使用更多的入栈和出栈指令,这同时也就意味着将需要更多的指令分派(instruction dispatch)次数和内存读/写次数。
由于操作数是存储在内存中的,因此频繁地执行内存读/写操作必然会影响执行速度。为了解决这个问题,HotSpot JVM 的设计者们提出了栈顶缓存(Tos,Top-of-Stack Cashing)技术,将栈顶元素全部缓存在物理 CPU 的寄存器中,以此降低对内存的读/写次数,提升执行引擎的执行效率。
**寄存器的优点:**指令更少,执行速度更快
4.7. 动态链接(Dynamic Linking)
动态链接、方法返回地址、附加信息 : 有些地方被称为帧数据区
每一个栈帧内部都包含一个指向运行时常量池中该栈帧所属方法的引用。包含这个引用的目的就是为了支持当前方法的代码能够实现动态链接(Dynamic Linking)。比如:invokedynamic 指令
在 Java 源文件被编译到字节码文件中时,所有的变量和方法引用都作为符号引用(Symbolic Reference)保存在 class 文件的常量池里。比如:描述一个方法调用了另外的其他方法时,就是通过常量池中指向方法的符号引用来表示的,那么动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用。
代码演示:
public class DynamicLinkingTest { int num = 10; public void methodA(){ System.out.println("methodA()...."); } public void methodB(){ System.out.println("methodB()...."); methodA(); num++; } }
为什么需要运行时常量池呢?
常量池的作用:就是为了提供一些符号和常量,便于指令的识别. 也便于变量或者方法引用的多次引用.另外字节码文件中需要很多数据的支持,通常这些数据很大,我们不能直接保存在字节码中,所以我们通过符号引用相关的结构
4.8. 方法的调用:解析与分配
在 JVM 中,将符号引用转换为调用方法的直接引用与方法的绑定机制相关
4.8.1. 静态链接
当一个字节码文件被装载进 JVM 内部时,如果被调用的目标方法在编译期可知,且运行期保持不变时,这种情况下将调用方法的符号引用转换为直接引用的过程称之为静态链接
4.8.2. 动态链接
如果被调用的方法在编译期无法被确定下来,只能够在程序运行期将调用的方法的符号转换为直接引用,由于这种引用转换过程具备动态性,因此也被称之为动态链接。
静态链接和动态链接不是名词,而是动词,这是理解的关键。
对应的方法的绑定机制为:早期绑定(Early Binding)和晚期绑定(Late Binding)。绑定是一个字段、方法或者类在符号引用被替换为直接引用的过程,这仅仅发生一次。
4.8.3. 早期绑定
早期绑定就是指被调用的目标方法如果在编译期可知,且运行期保持不变时,即可将这个方法与所属的类型进行绑定,这样一来,由于明确了被调用的目标方法究竟是哪一个,因此也就可以使用静态链接的方式将符号引用转换为直接引用。
4.8.4. 晚期绑定
如果被调用的方法在编译期无法被确定下来,只能够在程序运行期根据实际的类型绑定相关的方法,这种绑定方式也就被称之为晚期绑定。
随着高级语言的横空出世,类似于 Java 一样的基于面向对象的编程语言如今越来越多,尽管这类编程语言在语法风格上存在一定的差别,但是它们彼此之间始终保持着一个共性,那就是都支持封装、继承和多态等面向对象特性,既然这一类的编程语言具备多态特征,那么自然也就具备早期绑定和晚期绑定两种绑定方式。
Java 中任何一个普通的方法其实都具备虚函数的特征,它们相当于 C++语言中的虚函数(C++中则需要使用关键字 virtual 来显式定义)。如果在 Java 程序中不希望某个方法拥有虚函数的特征时,则可以使用关键字 final 来标记这个方法。
代码演示:
/** * 说明早期绑定和晚期绑定的例子 * @author shkstart * @create 2020 上午 11:59 */ class Animal{ public void eat(){ System.out.println("动物进食"); } } interface Huntable{ void hunt(); } class Dog extends Animal implements Huntable{ @Override public void eat() { System.out.println("狗吃骨头"); } @Override public void hunt() { System.out.println("捕食耗子,多管闲事"); } } class Cat extends Animal implements Huntable{ public Cat(){ super();//表现为:早期绑定 } public Cat(String name){ this();//表现为:早期绑定 } @Override public void eat() { super.eat();//表现为:早期绑定 System.out.println("猫吃鱼"); } @Override public void hunt() { System.out.println("捕食耗子,天经地义"); } } public class AnimalTest { public void showAnimal(Animal animal){ animal.eat();//表现为:晚期绑定 } public void showHunt(Huntable h){ h.hunt();//表现为:晚期绑定 } }
4.8.5. 虚方法和非虚方法
如果方法在编译期就确定了具体的调用版本,这个版本在运行时是不可变的。这样的方法称为非虚方法。
静态方法、私有方法、final 方法、实例构造器、父类方法都是非虚方法。其他方法称为虚方法。
虚拟机中提供了以下几条方法调用指令:
普通调用指令:
invokestatic:调用静态方法,解析阶段确定唯一方法版本
invokespecial:调用方法、私有及父类方法,解析阶段确定唯一方法版本
invokevirtual:调用所有虚方法
invokeinterface:调用接口方法
代码演示
/** * 解析调用中非虚方法、虚方法的测试 * * invokestatic指令和invokespecial指令调用的方法称为非虚方法 * @author shkstart * @create 2020 下午 12:07 */ class Father { public Father() { System.out.println("father的构造器"); } public static void showStatic(String str) { System.out.println("father " + str); } public final void showFinal() { System.out.println("father show final"); } public void showCommon() { System.out.println("father 普通方法"); } } public class Son extends Father { public Son() { //invokespecial super(); } public Son(int age) { //invokespecial this(); } //不是重写的父类的静态方法,因为静态方法不能被重写! public static void showStatic(String str) { System.out.println("son " + str); } private void showPrivate(String str) { System.out.println("son private" + str); } public void show() { //invokestatic showStatic("atguigu.com"); //invokestatic super.showStatic("good!"); //invokespecial showPrivate("hello!"); //invokespecial super.showCommon(); //invokespecial:非虚方法,编译期便可知道. super.showFinal(); //invokevirtual showFinal();//因为此方法声明有final,不能被子类重写(但是可以直接调用啊.),所以也认为此方法是非虚方法。备注:虽然invokevirtual一般调用的是虚方法,但是 final修饰的方法例外. //虚方法如下: //invokevirtual showCommon();//没有super调用,且当前类可能重写该方法.所以无法确定. //info 在编译期间无法确定下来.首先它不属于父类的方法,是子类中额外加入的功能方法.如果Son的子类对其进行重写,可以构成多态. //例:如果存在一个类继承了Son,那具体用的是Son的info还是Son子类的info,编译器就确定不了了 info(); MethodInterface in = null; //invokeinterface in.methodA(); } public void info(){ } public void display(Father f){ f.showCommon(); } public static void main(String[] args) { Son so = new Son(); so.show(); } } interface MethodInterface{ void methodA(); }
动态调用指令:
invokedynamic:动态解析出需要调用的方法,然后执行
前四条指令固化在虚拟机内部,方法的调用执行不可人为干预,而 invokedynamic 指令则支持由用户确定方法版本。其中 invokestatic 指令和 invokespecial 指令调用的方法称为非虚方法,其余的(fina1 修饰的除外)称为虚方法。
关于 invokedynamic 指令
JVM 字节码指令集一直比较稳定,一直到 Java7 中才增加了一个 invokedynamic 指令,这是Java 为了实现「动态类型语言」支持而做的一种改进。 (Java本身还是一种静态类型语言)
但是在 Java7 中并没有提供直接生成 invokedynamic 指令的方法,需要借助 ASM 这种底层字节码工具来产生 invokedynamic 指令。直到 Java8 的 Lambda 表达式的出现,invokedynamic 指令的生成,在 Java 中才有了直接的生成方式。
Java7 中增加的动态语言类型支持的本质是对 Java 虚拟机规范的修改,而不是对 Java 语言规则的修改,这一块相对来讲比较复杂,增加了虚拟机中的方法调用,最直接的受益者就是运行在 Java 平台的动态语言的编译器。
代码演示:
/** * 体会invokedynamic指令 * @author shkstart * @create 2020 下午 3:09 */ @FunctionalInterface interface Func { public boolean func(String str); } public class Lambda { public void lambda(Func func) { return; } public static void main(String[] args) { Lambda lambda = new Lambda(); Func func = s -> { return true; }; lambda.lambda(func); lambda.lambda(s -> { return true; }); } }
运行结果:
动态类型语言和静态类型语言
动态类型语言和静态类型语言两者的区别就在于对类型的检查是在编译期还是在运行期,满足前者就是静态类型语言,反之是动态类型语言。
说的再直白一点就是,静态类型语言是判断变量自身的类型信息;动态类型语言是判断变量值的类型信息,变量没有类型信息,变量值才有类型信息,这是动态语言的一个重要特征。
举例
Java:String info = “lxylovejava”; // info = 123 这样就会报错. info被赋予String的类型信息.
JS:var name = “lxy123456”; var name = 10;//两种写法都可以,因为是运行期根据值确定类型的 name没有类型信息
Python: info = 130.5; //Python更牛叉,类型声明都不需要了…
4.8.6. 方法重写的本质
Java 语言中方法重写的本质:
找到操作数栈顶的第一个元素所执行的对象的实际类型,记作 C。(也就是说重写会去操作数栈栈顶获取到对象的引用类型,也就是符号引用,通过这个对象的符号引用就可以在堆中找到这个对象.)
如果在类型 C 中找到与常量中的描述符合简单名称都相符的方法,则进行访问权限校验,如果通过则返回这个方法的直接引用,查找过程结束;如果不通过,则返回 java.lang.IllegalAccessError 异常。
否则,按照继承关系从下往上依次对 C 的各个父类进行第 2 步的搜索和验证过程。
如果始终没有找到合适的方法,则抛出 java.lang.AbstractMethodsError 异常。
总结:
在编译阶段,编译器只知道对象的静态类型(类),而不知道实际类型,因此只能在class文件中确定调用父类的方法。
在执行过程中,它将判断对象的实际类型。如果实际类型实现了这种方法,它将被直接调用。如果没有实现,它将根据继承关系从下到上进行检索。只要检索到,它将被调用。如果没有检索到,它将被抛弃。继续向上层寻找.如果最后没有找到,则说明抽象方法没有被实现,则抛出AbstractMethodsError
IllegalAccessError 介绍
程序试图访问或修改一个属性或调用一个方法,这个属性或方法,你没有权限访问。一般的,这个会引起编译器异常。这个错误如果发生在运行时,就说明一个类发生了不兼容的改变。
4.8.7. 方法的调用:虚方法表
在面向对象的编程中,会很频繁的使用到动态分派,如果在每次动态分派(invokevirtual)的过程中都要重新在类的方法元数据中搜索合适的目标的话就可能影响到执行效率。因此,为了提高性能,JVM 采用在类的方法区建立一个虚方法表 (virtual method table)(非虚方法不会出现在表中)来实现。使用索引表来代替查找。
每个类中都有一个虚方法表,表中存放着各个方法的实际入口。(每次调用方法,直接从虚方法表中找各个方法的是哪个类型的信息)
虚方法表是什么时候被创建的呢?
虚方法表会在类加载的链接阶段被创建并开始初始化,类的变量初始值准备完成之后,JVM 会把该类的方法表也初始化完毕。
代码演示:
举例 1:
举例 2:
/** * 虚方法表的举例 * * @author shkstart * @create 2020 下午 1:11 */ interface Friendly { void sayHello(); void sayGoodbye(); } class Dog { public void sayHello() { } public String toString() { return "Dog"; } } class Cat implements Friendly { public void eat() { } public void sayHello() { } public void sayGoodbye() { } protected void finalize() { } public String toString(){ return "Cat"; } } class CockerSpaniel extends Dog implements Friendly { public void sayHello() { super.sayHello(); } public void sayGoodbye() { } } public class VirtualMethodTable { }
4.9. 方法返回地址(return address)
存放调用该方法的 pc 寄存器的值。一个方法的结束,有两种方式:
正常执行完成
出现未处理的异常,非正常退出
无论通过哪种方式退出,在方法退出后都返回到该方法被调用的位置。方法正常退出时,调用者的 pc 计数器的值作为返回地址,即调用该方法的指令的下一条指令的地址。而通过异常退出的,返回地址是要通过异常表来确定,栈帧中一般不会保存这部分信息。
总结:
当执行到A调用B的方法时,pc记录的是A的下一条指令,当B的栈帧被创建并作为当前栈帧时同时也获取到pc中的值并生成了返回地址,当B方法return,pc的值就是返回地址 (注意:返回地址和返回值是两回事哦)
方法返回地址记录的是当前栈帧的上一级栈帧的执行位置 而pc寄存器存储的永远是当前栈帧的执行位置
当一个方法开始执行后,只有两种方式可以退出这个方法:
执行引擎遇到任意一个方法返回的字节码指令(return),会有返回值传递给上层的方法调用者,简称正常完成出口;
一个方法在正常调用完成之后,究竟需要使用哪一个返回指令,还需要根据方法返回值的实际数据类型而定。
在字节码指令中,返回指令包含 ireturn(当返回值是 boolean,byte,char,short 和 int 类型时使用),lreturn(Long 类型),freturn(Float 类型),dreturn(Double 类型),areturn。另外还有一个 return 指令声明为 void 的方法,实例初始化方法,类和接口的初始化方法使用。
在方法执行过程中遇到异常(Exception),并且这个异常没有在方法内进行处理,也就是只要在本方法的异常表中没有搜索到匹配的异常处理器,就会导致方法退出,简称异常完成出口。
代码演示:
/** * * 返回指令包含ireturn(当返回值是boolean、byte、char、short和int类型时使用)、 * lreturn、freturn、dreturn以及areturn,另外还有一个return指令供声明为void的方法、 * 实例初始化方法、类和接口的初始化方法使用。 * * @author shkstart * @create 2020 下午 4:05 */ public class ReturnAddressTest { //构造方法返回指令:return public boolean methodBoolean() { return false;//ireturn; } public byte methodByte() { return 0;//ireturn; } public short methodShort() { return 0;//ireturn; } public char methodChar() { return 'a';//ireturn; } public int methodInt() { return 0;//ireturn; } public long methodLong() { return 0L;//lreturn; } public float methodFloat() { return 0.0f;//freturn; } public double methodDouble() { return 0.0;//dreturn; } public String methodString() { return null;//areturn; } public Date methodDate() { return null;//areturn; } public void methodVoid() {//return; } static { int i = 10; } // public void method2() { methodVoid(); try { method1(); } catch (IOException e) { e.printStackTrace(); } } public void method1() throws IOException { FileReader fis = new FileReader("atguigu.txt"); char[] cBuffer = new char[1024]; int len; while ((len = fis.read(cBuffer)) != -1) { String str = new String(cBuffer, 0, len); System.out.println(str); } fis.close(); } }
方法执行过程中,抛出异常时的异常处理,存储在一个异常处理表,方便在发生异常的时候找到处理异常的代码,如下图所示:
Exception table: from to target type 4 16 19 any //字节码4-16行出任何问题了,按照19行的解决方法处理. 19 21 19 any //字节码19-21行出任何问题了,按照19行的解决方法处理.
本质上,方法的退出就是当前栈帧出栈的过程。此时,需要恢复上层方法的局部变量表、操作数栈、将返回值压入调用者栈帧的操作数栈、设置 PC 寄存器值(用返回地址)等,让调用者方法继续执行下去。
正常完成出口和异常完成出口的区别在于:通过异常完成出口退出的不会给他的上层调用者产生任何的返回值。
注意:
返回地址和返回值是两回事,当前方法正常执行两者都有,既能接续上层方法又向其传递返回值;当前方法异常且未处理两者都没,此时能否接续上层方法的依据是上层方法的异常表.
每个方法对应一个异常处理表,方法对应着栈帧,栈帧存在于Java虚拟机栈,Java虚拟机栈和本地方法栈两者是不一样的.
4.10. 一些附加信息
栈帧中还允许携带与 Java 虚拟机实现相关的一些附加信息。例如:对程序调试提供支持的信息。
4.11. 栈的相关面试题
举例栈溢出的情况?(StackOverflowError)
通过 -Xss 设置栈的大小 (内存空间不足出现OOM)
调整栈大小,就能保证不出现溢出么?
不能保证不溢出 (可以延迟其溢出时间…)
分配的栈内存越大越好么?
不是,一定时间内降低了 OOM 概率,但是会挤占其它的线程空间,因为整个空间是有限的。
垃圾回收是否涉及到虚拟机栈?
不会
方法中定义的局部变量是否线程安全?
具体问题具体分析。如果对象是在内部产生,并在内部消亡,没有返回到外部,那么它就是线程安全的,反之则是线程不安全的。
方法中定义的局部变量是否线程安全?
代码演示
/** * 面试题: * 方法中定义的局部变量是否线程安全?具体情况具体分析 * * 何为线程安全? * 如果只有一个线程才可以操作此数据,则必是线程安全的。 * 如果有多个线程操作此数据,则此数据是共享数据。如果不考虑同步机制的话,会存在线程安全问题。 * @author shkstart * @create 2020 下午 7:48 */ public class StringBuilderTest { int num = 10; //s1的声明方式是线程安全的 内部产生内部消亡就是线程安全的! public static void method1(){ //StringBuilder:线程不安全 StringBuilder s1 = new StringBuilder(); s1.append("a"); s1.append("b"); //... } //sBuilder的操作过程:是线程不安全的 sBuilder创建后除了当前方法,可能被其他多个线程操作.. public static void method2(StringBuilder sBuilder){ sBuilder.append("a"); sBuilder.append("b"); //... } //s1的操作:是线程不安全的 因为有返回值,可能被多个线程抢用. public static StringBuilder method3(){ StringBuilder s1 = new StringBuilder(); s1.append("a"); s1.append("b"); return s1; } //s1的操作:是线程安全的 类似于情况1 public static String method4(){ StringBuilder s1 = new StringBuilder(); s1.append("a"); s1.append("b"); return s1.toString();//返回的String可能被多个线程强用,但是StringBuilder是安全的,随着方法的消亡而消亡. } public static void main(String[] args) { StringBuilder s = new StringBuilder(); new Thread(() -> {//可以看出method2是线程不安全的. s.append("a"); s.append("b"); }).start(); method2(s); } }
- 比较运行时数据区的Error和GC的情况
运行时数据区 | 是否存在 Error | 是否存在 GC |
程序计数器 | 否 | 否 |
虚拟机栈 | 是(SOE) | 否 |
本地方法栈 | 是 | 否 |
方法区 | 是(OOM) | 是 |
堆 | 是 | 是 |