【JVM】JVM系列之内存模型(六)(1)

简介:   经过前面的学习,我们终于进入了虚拟机最后一部分的学习,内存模型。理解内存模型对我们理解虚拟机、正确使用多线程编程提供很大帮助。下面开始正式学习。

一、前言


  经过前面的学习,我们终于进入了虚拟机最后一部分的学习,内存模型。理解内存模型对我们理解虚拟机、正确使用多线程编程提供很大帮助。下面开始正式学习。


二、Java并发基础


  在并发编程中存在两个关键问题①线程之间如何通信 ②线程之间如何同步。


  2.1 通信


  通信是指线程之间以何种机制来交换信息。在命令式编程中,线程之间的通信机制有两种:共享内存和消息传递。


  在共享内存的并发模型里,线程之间共享程序的公共状态,线程之间通过写-读内存中的公共状态来隐式进行通信。


  在消息传递的并发模型里,线程之间没有公共状态,线程之间必须通过明确的发送消息来显式进行通信。


  2.2 同步


  同步是指程序用于控制不同线程之间操作发生相对顺序的机制。


  在共享内存并发模型里,同步是显式进行的。程序员必须显式指定某个方法或某段代码需要在线程之间互斥访问。


  在消息传递的并发模型里,由于消息的发送必须在消息的接收之前, 因此同步是隐式进行的。


  Java并发采用的是共享内存模型,通信隐式进行;同步显示指定。


三、Java内存模型


  Java内存模型JMM(Java Memory Model)主要目标是定义程序中各个变量(非线程私有)的访问规则,即在虚拟机中将变量存储到内存和从内存取出变量这样的底层细节。Java中每个线程都有自己私有的工作内存。工作内存保存了被该线程使用的变量的主内存副本拷贝,线程对变量的读写操作都必须在工作内存进行,无法直接读写主内存中的变量。两个线程无法直接访问对方的工作内存。


  3.1 线程、工作内存、内存关系


  理解线程、主内存、工作内存之间的关系时,我们可以类比物理机中CPU、高速缓存、内存之间关系,学过计算机组成原理,我们知道CPU、高速缓存、内存之间的关系如下


image.png

 说明:线程的工作内存可以类比高速缓存,JMM控可以类比缓存一致性协议,是工作内存与主内存进行信息交换的具体协议。若线程A要与线程B通信(访问变量)。首先,线程A把工作线程中的共享变量刷新到主内存中。然后,线程B从主内存读取更新过的变量。


  3.2 内存间通信的指令


  内存见通信,主要指线程私有的工作内存与主内存之间的通信,如线程间共享变量的传递。主要有如下操作。


image.png


说明:①变量从主内存放入工作内存变量副本中实际是分为两步的,第一步是先把主内存的值放在工作内存中,此时还没有放入变量副本中;第二部把已经放在工作内存的值放入变量副本中。相反,变量副本从工作内存到主内存也是分为两步,与前面类似,不再累赘。总之,两个内存空间的变量值的传递需要两个操作才能完成,这样做是为了提高cpu的效率,不等待主内存写入完成。②read、load操作;store、write操作必须按顺序执行(并非连续执行)。


  上述的8个操作需要满足如下规则


image.png


3.3 重排序


  在执行程序时为了提高性能,编译器和处理器常常会对指令做重排序。重排序会遵守数据的依赖性,编译器和处理器不会改变存在数据依赖关系的两个操作的执行顺序。重排序分为如下三种类型。


  1. 编译器优化的重排序。编译器在不改变单线程程序语义的前提下,可以重新安排语句的执行顺序。


  2. 指令级并行的重排序。现代处理器采用了指令级并行技术(Instruction-Level Parallelism, ILP)来将多条指令重叠执行。如果不存在数据依赖性,处理器可以改变语句对应机器指令的执行顺序。


  3. 内存系统的重排序。由于处理器使用缓存和读/写缓冲区,这使得加载和存储操 作看上去可能是在乱序执行。


  而我们编写的Java源程序中的语句顺序并不对应指令中的相应顺序,如(int a = 0; int b = 0;翻译成机器指令后并不能保证a = 0操作在b = 0操作之前)。因为编译器、处理器会对指令进行重排序,通常而言,Java源程序变成最后的机器执行指令会经过如下的重排序。


image.png


说明:①编译器优化重排序属于编译器重排序,指令级并行重排序、内存系统重排序属于处理器重排序。②这些重排序可能会导致多线程程序出现内存可见性问题。③JMM编译器重排序规则会禁止特定类型的编译器重排序。④JMM的处理器重排序会要求Java编译器在生成指令序列时,插入特定类型的内存屏障指令,通过内存屏障指令来禁止特定类型的处理器重排序。


  下面一个例子说明了重排序


image.png


下面是Process A与Process B与内存之间的交互图


image.png


 对于最后的结果x = y = 0而言,从内存的角度看,整个指令序列可能如下,A2 -> B2 -> A1 -> B2 -> A3 -> B3。按照这样的指令排序,最后得到的结果就时x = y = 0。


  说明:①从内存角度看,A1与A3操作一起才算是完成了a变量的写,A1操作是在处理器A的缓冲区中完成写,之后A3操作将缓冲区的变量值同步到内存中。②在程序中,A1发生在A2之前,然而实际的指令序列中,A2发生在A1之前,这就是发生了重排序,处理器操作内存的顺序发生了变化。同理,B1与B2指令也发生了重排序。


  3.4 内存屏障指令


  为了保证内存可见性,Java编译器在生成指令序列的适当位置会插入内存屏障指令来禁止特定类型的处理器重排序。内存屏障指令分为如下四种


image.png

3.5 先行发生原则(happens before)


  先行发生原则是判断数据是否存在竞争、线程是否安全的主要依据。如果一个操作执行的结果需要对另一个操作可见,那么这两个操作之间必须要存在 happens-before 关系,如如果操作A先行发生与操作B,即A操作产生的结果能够被操作B观察到。

  如下图示例


  线程A  线程B

  i = 3;  j = i;

  结果:j = 3;

  说明:线程A中的i = 3先行发生于j = i;则结果一定是j = 3。

  具体的happens-before原则如下

  1. 程序顺序规则:一个线程中的每个操作,happens- before 于该线程中的任意后续操作(控制流操作而不是程序代码顺序)。


  2. 监视器锁规则:对一个监视器的解锁,happens- before 于随后对这个监视器的加锁。


  3. volatile变量规则:对一个 volatile域的写,happens- before于任意后续对这个volatile域的读。


  4. 线程启动规则:Thread对象的start()方法happens - before 于此线程的每一个动作。


  5. 线程终止规则:线程中所有操作都happens - before 于对此线程的终止检测。


  6. 线程中断规则:对线程interrupt()方法的调用happens - before 于被中断线程的代码检测到中断事件的发生。


  7. 对象终结规则:一个对象的初始化完成(构造函数执行结束)happens - before 于它的finalize()方法的开始。


  8. 传递性:如果 A happens- before B,且 B happens- before C,那么 A happens- before C。


  说明:happens-before 仅仅要求前一个操作(执行的结果)对后一个操作可见,且前一个操作按顺序排在第二个操作之前(可能会发生指令重排)。时间先后顺序与happens - before原则之间没有太大的关系。


  3.6 as-if-serial语义


  as-if-serial的语义是:不管怎么重排序(编译器和处理器为了提高并行度),(单线程)程序的执行结果不能被改变。编译器,runtime 和处理器都必须遵守 as-if-serial 语义。为了遵守 as-if-serial 语义,编译器和处理器不会对存在数据依赖关系的操作做重排序,因为这种重排序会改变执行结果。但是,如果操作之间不存在数据依赖关系,这些操作就可能被编译器和处理器重排序。如如下代码片段


double pi = 3.14; //A
double r  = 1.0;   //B
double area = pi * r * r; //C

其中,操作A、B、C之间的依赖性如下


image.png


说明:A和C之间存在数据依赖关系,同时B和C之间也存在数据依赖关系。因此在最终执行的指令序列中,C不能被重排序到A和B的前面(C排到A和B的前面,程序的结果将会被改变)。但A和B之间没有数据依赖关系,编译器和 处理器可以重排序A和B之间的执行顺序。因此,最后的指令序列可能是:


  A -> B -> C;

  B -> A -> C;  // 重排序了

  套用happens - before规则我们可以知道:

  A happens - before B;  // 程序顺序规则

  B happens - before C;  // 程序顺序规则

  A happens - before C;  // 传递性


  说明:A happens- before B,但实际执行时 B 却可以排在 A 之前执行(第二种指令执行顺序)。在前面我们讲到,如果 A happens- before B,JMM 并不要求 A 一定要在 B 之前执行。JMM 仅仅要求前一个操作(执行的结果)对后一个操作可见,且前一个操作按顺序排在第二个操作之前。这里操作 A 的执行结果不需要对操作 B 可见;而且重排序操作 A 和操作 B 后的执行结果,与操作 A 和操作 B 按 happens- before 顺序执行的结果一致。在这种情况下,JMM 会认为这种重排序并不非法,JMM 允许这种重排序。


  对于单线程,JMM可以进行指令重排序,但是一定要遵守as-if-serial语义,这样才能保证单线程的正确性。


  对于多线程而言,JMM的指令重排序可能会影响多线程程序的正确性。下面为多线程示例。

class ReorderExample { 
    int a = 0;
    boolean flag = false;
    public void writer() {
        a = 1;    //操作A
        flag = true;    //操作B
    }
    public void reader() {
        if (flag) {    //操作C
            int i =    a * a;    //操作D
        }
    }
}


说明:变量flag用于标识变量a是否已经写入。若线程A先执行writer函数,然后线程B执行reader函数。由happens - before 规则(程序顺序规则)我们知道,操作A happens - before B,但是由于操作A与操作B之间没有数据依赖,所以可以进行重排序。同理,操作C与操作D之间也无数据依赖关系(但存在控制依赖关系,JMM允许对存在数据依赖的指令进行重排序),也可进行重排序。


  下图展示了重排序操作A、操作B所可能产生的结果。


image.png



 说明:假设重排序操作A、操作B,且操作C、操作D在操作A、操作B的中间,那么最后线程B的变量i的结果为0;flag为true,则对i进行写入。然而,此时的a还未写入,此时,重排序破坏了多线程的语义,最后写入的i值是不正确的。


  下图展示了重排序操作C、操作D可能产生的执行结果。


image.png



说明:存在控制依赖的指令也会被重排序,控制依赖会影响并行度。temp变量的出现是因为编译器和处理器会采用猜测执行来克服控制相关性对并行度的影响,从图中我们可以知道重排序破坏了多线程的语义,最后写入i的值是不正确的。


  在单线程程序中,对存在控制依赖的操作重排序,不会改变执行结果(这也是 as- if-serial 语义允许对存在控制依赖的操作做重排序的原因);但在多线程程序中,对存在控制依赖的操作重排序,可能会改变程序的执行结果。


  在多线程中为了保证程序的正确性,我们需要进行适当的同步,以保证正确的结果。


目录
相关文章
|
1月前
|
Java Docker 索引
记录一次索引未建立、继而引发一系列的问题、包含索引创建失败、虚拟机中JVM虚拟机内存满的情况
这篇文章记录了作者在分布式微服务项目中遇到的一系列问题,起因是商品服务检索接口测试失败,原因是Elasticsearch索引未找到。文章详细描述了解决过程中遇到的几个关键问题:分词器的安装、Elasticsearch内存溢出的处理,以及最终成功创建`gulimall_product`索引的步骤。作者还分享了使用Postman测试接口的经历,并强调了问题解决过程中遇到的挑战和所花费的时间。
|
30天前
|
存储 算法 Oracle
不好意思!耽误你的十分钟,JVM内存布局还给你
先赞后看,南哥助你Java进阶一大半在2006年加州旧金山的JavaOne大会上,一个由顶级Java开发者组成的周年性研讨会,公司突然宣布将开放Java的源代码。于是,下一年顶级项目OpenJDK诞生。Java生态发展被打开了新的大门,Java 7的G1垃圾回收器、Java 8的Lambda表达式和流API…大家好,我是南哥。一个Java学习与进阶的领路人,相信对你通关面试、拿下Offer进入心心念念的公司有所帮助。
不好意思!耽误你的十分钟,JVM内存布局还给你
|
1月前
|
存储 算法 Java
JVM自动内存管理之垃圾收集算法
文章概述了JVM内存管理和垃圾收集的基本概念,提供一个关于JVM内存管理和垃圾收集的基础理解框架。
JVM自动内存管理之垃圾收集算法
|
1月前
|
存储 Java 程序员
JVM自动内存管理之运行时内存区
这篇文章详细解释了JVM运行时数据区的各个组成部分及其作用,有助于理解Java程序运行时的内存布局和管理机制。
JVM自动内存管理之运行时内存区
|
1月前
|
存储 安全 Java
JVM常见面试题(二):JVM是什么、由哪些部分组成、运行流程,JDK、JRE、JVM关系;程序计数器,堆,虚拟机栈,堆栈的区别是什么,方法区,直接内存
JVM常见面试题(二):JVM是什么、由哪些部分组成、运行流程是什么,JDK、JRE、JVM的联系与区别;什么是程序计数器,堆,虚拟机栈,栈内存溢出,堆栈的区别是什么,方法区,直接内存
JVM常见面试题(二):JVM是什么、由哪些部分组成、运行流程,JDK、JRE、JVM关系;程序计数器,堆,虚拟机栈,堆栈的区别是什么,方法区,直接内存
|
1月前
|
存储 安全 Java
JVM内存结构
这篇文章详细介绍了Java虚拟机(JVM)的内存结构,包括类的加载过程、类加载器的双亲委派机制、沙箱安全机制、程序计数器、Java栈、Java堆、本地方法和本地方法栈等关键组件及其作用。
JVM内存结构
|
2月前
|
运维 Java Linux
(九)JVM成神路之性能调优、GC调试、各内存区、Linux参数大全及实用小技巧
本章节主要用于补齐之前GC篇章以及JVM运行时数据区的一些JVM参数,更多的作用也可以看作是JVM的参数列表大全。对于开发者而言,能够控制JVM的部分也就只有启动参数了,同时,对于JVM的性能调优而言,JVM的参数也是基础。
|
2月前
|
存储 缓存 算法
(五)JVM成神路之对象内存布局、分配过程、从生至死历程、强弱软虚引用全面剖析
在上篇文章中曾详细谈到了JVM的内存区域,其中也曾提及了:Java程序运行过程中,绝大部分创建的对象都会被分配在堆空间内。而本篇文章则会站在对象实例的角度,阐述一个Java对象从生到死的历程、Java对象在内存中的布局以及对象引用类型。
|
2月前
|
Java
Jinfo 查看 jvm 配置及使用 Jstat 查看堆内存使用与垃圾回收
Jinfo 查看 jvm 配置及使用 Jstat 查看堆内存使用与垃圾回收
46 5
|
2月前
|
Java
jmap 查看jvm内存大小并进行dump文件内存分析
jmap 查看jvm内存大小并进行dump文件内存分析
46 3