一、前言
经过前面的学习,我们终于进入了虚拟机最后一部分的学习,内存模型。理解内存模型对我们理解虚拟机、正确使用多线程编程提供很大帮助。下面开始正式学习。
二、Java并发基础
在并发编程中存在两个关键问题①线程之间如何通信 ②线程之间如何同步。
2.1 通信
通信是指线程之间以何种机制来交换信息。在命令式编程中,线程之间的通信机制有两种:共享内存和消息传递。
在共享内存的并发模型里,线程之间共享程序的公共状态,线程之间通过写-读内存中的公共状态来隐式进行通信。
在消息传递的并发模型里,线程之间没有公共状态,线程之间必须通过明确的发送消息来显式进行通信。
2.2 同步
同步是指程序用于控制不同线程之间操作发生相对顺序的机制。
在共享内存并发模型里,同步是显式进行的。程序员必须显式指定某个方法或某段代码需要在线程之间互斥访问。
在消息传递的并发模型里,由于消息的发送必须在消息的接收之前, 因此同步是隐式进行的。
Java并发采用的是共享内存模型,通信隐式进行;同步显示指定。
三、Java内存模型
Java内存模型JMM(Java Memory Model)主要目标是定义程序中各个变量(非线程私有)的访问规则,即在虚拟机中将变量存储到内存和从内存取出变量这样的底层细节。Java中每个线程都有自己私有的工作内存。工作内存保存了被该线程使用的变量的主内存副本拷贝,线程对变量的读写操作都必须在工作内存进行,无法直接读写主内存中的变量。两个线程无法直接访问对方的工作内存。
3.1 线程、工作内存、内存关系
理解线程、主内存、工作内存之间的关系时,我们可以类比物理机中CPU、高速缓存、内存之间关系,学过计算机组成原理,我们知道CPU、高速缓存、内存之间的关系如下
线程、主内存、工作内存的关系图如下
说明:线程的工作内存可以类比高速缓存,JMM控可以类比缓存一致性协议,是工作内存与主内存进行信息交换的具体协议。若线程A要与线程B通信(访问变量)。首先,线程A把工作线程中的共享变量刷新到主内存中。然后,线程B从主内存读取更新过的变量。
3.2 内存间通信的指令
内存见通信,主要指线程私有的工作内存与主内存之间的通信,如线程间共享变量的传递。主要有如下操作。
说明:①变量从主内存放入工作内存变量副本中实际是分为两步的,第一步是先把主内存的值放在工作内存中,此时还没有放入变量副本中;第二部把已经放在工作内存的值放入变量副本中。相反,变量副本从工作内存到主内存也是分为两步,与前面类似,不再累赘。总之,两个内存空间的变量值的传递需要两个操作才能完成,这样做是为了提高cpu的效率,不等待主内存写入完成。②read、load操作;store、write操作必须按顺序执行(并非连续执行)。
上述的8个操作需要满足如下规则
3.3 重排序
在执行程序时为了提高性能,编译器和处理器常常会对指令做重排序。重排序会遵守数据的依赖性,编译器和处理器不会改变存在数据依赖关系的两个操作的执行顺序。重排序分为如下三种类型。
1. 编译器优化的重排序。编译器在不改变单线程程序语义的前提下,可以重新安排语句的执行顺序。
2. 指令级并行的重排序。现代处理器采用了指令级并行技术(Instruction-Level Parallelism, ILP)来将多条指令重叠执行。如果不存在数据依赖性,处理器可以改变语句对应机器指令的执行顺序。
3. 内存系统的重排序。由于处理器使用缓存和读/写缓冲区,这使得加载和存储操 作看上去可能是在乱序执行。
而我们编写的Java源程序中的语句顺序并不对应指令中的相应顺序,如(int a = 0; int b = 0;翻译成机器指令后并不能保证a = 0操作在b = 0操作之前)。因为编译器、处理器会对指令进行重排序,通常而言,Java源程序变成最后的机器执行指令会经过如下的重排序。
说明:①编译器优化重排序属于编译器重排序,指令级并行重排序、内存系统重排序属于处理器重排序。②这些重排序可能会导致多线程程序出现内存可见性问题。③JMM编译器重排序规则会禁止特定类型的编译器重排序。④JMM的处理器重排序会要求Java编译器在生成指令序列时,插入特定类型的内存屏障指令,通过内存屏障指令来禁止特定类型的处理器重排序。
下面一个例子说明了重排序
下面是Process A与Process B与内存之间的交互图
对于最后的结果x = y = 0而言,从内存的角度看,整个指令序列可能如下,A2 -> B2 -> A1 -> B2 -> A3 -> B3。按照这样的指令排序,最后得到的结果就时x = y = 0。
说明:①从内存角度看,A1与A3操作一起才算是完成了a变量的写,A1操作是在处理器A的缓冲区中完成写,之后A3操作将缓冲区的变量值同步到内存中。②在程序中,
A1发生在A2之前,然而实际的指令序列中,A2发生在A1之前,这就是发生了重排序,处理器操作内存的顺序发生了变化。同理,B1与B2指令也发生了重排序。
3.4 内存屏障指令
为了保证内存可见性,Java编译器在生成指令序列的适当位置会插入内存屏障指令来禁止特定类型的处理器重排序。内存屏障指令分为如下四种
3.5 先行发生原则(happens before)
先行发生原则是判断数据是否存在竞争、线程是否安全的主要依据。如果一个操作执行的结果需要对另一个操作可见,那么这两个操作之间必须要存在 happens-before 关系,如如果操作A先行发生与操作B,即A操作产生的结果能够被操作B观察到。
如下图示例
线程A 线程B
i = 3; j = i;
结果:j = 3;
说明:线程A中的i = 3先行发生于j = i;则结果一定是j = 3。
具体的happens-before原则如下
1. 程序顺序规则:一个线程中的每个操作,happens- before 于该线程中的任意后续操作(控制流操作而不是程序代码顺序)。
2. 监视器锁规则:对一个监视器的解锁,happens- before 于随后对这个监视器的加锁。
3. volatile变量规则:对一个 volatile域的写,happens- before于任意后续对这个volatile域的读。
4. 线程启动规则:Thread对象的start()方法happens - before 于此线程的每一个动作。
5. 线程终止规则:线程中所有操作都happens - before 于对此线程的终止检测。
6. 线程中断规则:对线程interrupt()方法的调用happens - before 于被中断线程的
代码检测到中断事件的发生。
7. 对象终结规则:一个对象的初始化完成(构造函数执行结束)happens - before 于它的finalize()方法的开始。
8. 传递性:如果 A happens- before B,且 B happens- before C,那么 A happens- before C。 仅仅要求前一个操作(执行的结果)对后一个操作可见,且前一个操作按顺序排在第二个操作之前(可能会发生指令重排)。时间先后顺序与happens - before原则之间没有太大的关系。
3.6 as-if-serial语义
as-if-serial的语义是:不管怎么重排序(编译器和处理器为了提高并行度),(单线程)程序的执行结果不能被改变。编译器,runtime 和处理器都必须遵守 as-if-serial 语义。为了遵守 as-if-serial 语义,编译器和处理器不会对存在数据依赖关系的操作做重排序,因为这种重排序会改变执行结果。但是,如果操作之间不存在数据依赖关系,这些操作就可能被编译器和处理器重排序。如如下代码片段
double pi = 3.14; //A double r = 1.0; //B double area = pi * r * r; //C
其中,操作A、B、C之间的依赖性如下
说明:A和C之间存在数据依赖关系,同时B和C之间也存在数据依赖关系。因此在最终执行的指令序列中,C不能被重排序到A和B的前面(C排到A和B的前面,程序的结果将会被改变)。但A和B之间没有数据依赖关系,编译器和 处理器可以重排序A和B之间的执行顺序。因此,最后的指令序列可能是:
A -> B -> C;
B -> A -> C; // 重排序了
套用happens - before规则我们可以知道:
A happens - before B; // 程序顺序规则
B happens - before C; // 程序顺序规则
A happens - before C; // 传递性
说明:A happens- before B,但实际执行时 B 却可以排在 A 之前执行(第二种指令执行顺序)。在前面我们讲到,如果 A happens- before B,JMM 并不要求 A 一定要在 B 之前执行。JMM 仅仅要求前一个操作(执行的结果)对后一个操作可见,且前一个操作按顺序排在第二个操作之前。这里操作 A 的执行结果不需要对操作 B 可见;而且重排序操作 A 和操作 B 后的执行结果,与操作 A 和操作 B 按 happens- before 顺序执行的结果一致。在这种情况下,JMM 会认为这种重排序并不非法,JMM 允许这种重排序。
对于单线程,JMM可以进行指令重排序,但是一定要遵守as-if-serial语义,这样才能保证单线程的正确性。
对于多线程而言,JMM的指令重排序可能会影响多线程程序的正确性。下面为多线程示例。
class ReorderExample { int a = 0; boolean flag = false; public void writer() { a = 1; //操作A flag = true; //操作B } public void reader() { if (flag) { //操作C int i = a * a; //操作D } } }
说明:变量flag用于标识变量a是否已经写入。若线程A先执行writer函数,然后线程B执行reader函数。由happens - before 规则(程序顺序规则)我们知道,操作A happens - before B,但是由于操作A与操作B之间没有数据依赖,所以可以进行重排序。同理,操作C与操作D之间也无数据依赖关系(但存在控制依赖关系,JMM允许对存在数据依赖的指令进行重排序),也可进行重排序。
下图展示了重排序操作A、操作B所可能产生的结果。
说明:假设重排序操作A、操作B,且操作C、操作D在操作A、操作B的中间,那么最后线程B的变量i的结果为0;flag为true,则对i进行写入。然而,此时的a还未写入,此时,重排序破坏了多线程的语义,最后写入的i值是不正确的。
下图展示了重排序操作C、操作D可能产生的执行结果。
说明:存在控制依赖的指令也会被重排序,控制依赖会影响并行度。temp变量的出现是因为编译器和处理器会采用猜测执行来克服控制相关性对并行度的影响,从图中我们可以知道重排序破坏了多线程的语义,最后写入i的值是不正确的。
在单线程程序中,对存在控制依赖的操作重排序,不会改变执行结果(这也是 as- if-serial 语义允许对存在控制依赖的操作做重排序的原因);但在多线程程序中,对存在控制依赖的操作重排序,可能会改变程序的执行结果。
在多线程中为了保证程序的正确性,我们需要进行适当的同步,以保证正确的结果。
四、顺序一致性内存模型
顺序一致性内存模型时JMM的参考模型,它提供了很强的内存一致性与可见性,是一个被计算机科学家理想化了的理论参考模型,它为程序员提供了极强的内存可见性保证。JMM对正确同步的多线程程序的内存一致性做了如下保证
如果程序是正确同步的,程序的执行将具有顺序一致性(sequentially consistent)-- 即程序的执行结果与该程序在顺序一致性内存模型中的执行结果相同。马上我们将会看到,这对于程序员来说是一个极强的保证。这里的同步是指广义上的同步,包括对常用同步原语(synchronized,volatile 和 final)的正确使用。
顺序一致性内存模型包括如下两个特性:
1. 一个线程中的所有操作必须按照程序的顺序来执行。
2. (不管程序是否同步)所有线程都只能看到一个单一的操作执行顺序。在顺序一致性内存模型中,每个操作都必须原子执行且立刻对所有线程可见(JMM中并不保证)。
顺序一致性内存模型为程序员提供的视图如下:
说明:每一时刻只有一个线程可以访问内存,当多个线程并发执行时,图中的开关装置能把所有线程的所有内存读/写操作串行化(即在顺序一致性模型中,所有操作之间具有全序关系)。下面这个例子更进一步阐明了在顺序一致性内存模型中各线程操作之间的关系。
假设线程A有A1、A2、A3三个操作,线程B有B1、B2、B3三个操作。
① 若使用监视器锁来进行同步,在A的三个操作完成后,释放监视器锁,之后B获得监视器锁,那么整个操作序列为:A1 -> A2 -> A3 -> B1 -> B2 -> B3。
② 若不使用监视器锁来进行同步,那么整个序列可能为:A1 -> B1 -> A2 -> B2 -> B3 -> A3。其中线程A、B的三个操作是有序的,并且线程A、B看到的操作序列都是同一操作序列,每个操作都必须原子执行且立刻对所有线程可见,但是整体的操作无序。
未同步程序在 JMM 中不但整体的执行顺序是无序的,而且所有线程看到的操作执行顺序也可能不一致。比如,在当前线程把写过的数据缓存在本地内存中,在还没有刷新到主内存之前,这个写操作仅对当前线程可见;从其他线程的角度来观察,会认为这个写操作根本还没有被当前线程执行。只有当前线程把本地内存中写过的数据刷新到主内存之后,这个写操作才能对其他线程可见。在这种情况下,当前线程和其它线程看到的操作执行顺序将不一致,当前线程认为写数据到缓冲区就完成了写操作,其他线程认为只有数据刷新到主内存才算完成了写操作,所以就导致了线程之间看到的操作序列不相同。
顺序一致性内存模型是通过内存规则保证顺序一致性,顺序一致性是JMM追求的目标,但是JMM模型本身并不进行保证,必须通过适当的同步保证。
4.1 同步程序的执行特性
下面例子展示一个正确同步的程序在JMM和顺序一致性内存模型的操作序列。
class SynchronizedExample { int a = 0; boolean flag = false; public synchronized void writer() { // 获取锁 a = 1; //操作A flag = true; //操作B } // 释放锁 public synchronized void reader() { // 获取锁 if (flag) { //操作C int i = a; //操作D } } // 释放锁 }
说明:线程A先执行writer方法,线程B执行reader方法。这是一个正确同步的程序,在JMM的操作序列与在顺序一致性模型的操作序列是相同的。