一、什么是JMM
JMM(java memory model)Java内存模型:是java虚拟机规范中定义的一组规范,用于屏蔽掉各种硬件和操作系统的内存访问差异,以实现让JAVA程序在各平台都能达到一致的并发结果。其主要规定了线程和内存之间的一些关系,并描述了和多线程相关的一组规范。它解决了CPU多级缓存、处理器优化、指令重排等导致的结果不可预期的问题。
二、内存区域和内存模型的区分
- java内存区域,也叫java内存、jvm内存模型,和java虚拟机(JVM)相关,java运行时将数据分区域存储,强调对内存空间的划分。(即:堆、栈、方法区、程序计数器等)
- java内存模型,也叫内存模型(Jmm),是java定义的并发编程相关的一组规范,保证了操作的原子性、可见性、有序性。
原子性:指一个操作是不可分割的,在执行期间不能被中断。例如,对于基本数据类型的读写操作是原子的,而对于long和double类型的读写操作则可能不是原子的。
可见性:指当一个线程修改了共享变量的值后,其他线程可以立即看到这个变化。Java提供了volatile关键字来保证变量的可见性。
有序性:指程序执行的顺序必须与编写的代码顺序一致。Java中,使用synchronized关键字和Lock接口来保证代码块的原子性和有序性。
三、主内存和本地内存
JMM抽象了主内存和本地内存的概念。本地内存不是真的给每个线程分配的内存,而是JMM的一个抽象,是对于寄存器、一级缓存、二级缓存等的抽象。
主内存 :所有线程创建的实例对象都存放在主内存中,不管该实例对象是成员变量还是方法中的本地变量(也称局部变量)
本地内存 :每个线程都有一个私有的本地内存来存储共享变量的副本,并且,每个线程只能访问自己的本地内存,无法访问其他线程的本地内存。本地内存是 JMM 抽象出来的一个概念,存储了主内存中的共享变量副本。
3.1指令序列的重排
在执行程序的时候,为了提高性能,编译器和处理器常常会对指令做重排序。重排序分三类:
- 编译器优化的重排序:编译器在不改变单线程程序语义的前提下,可以重新安排语句的测试和执行的顺序。
- 指令级并行的重排序:现代处理器采用了指令级并行技术来将多条指令重叠执行。如果不存在数据依赖性,处理器可以改变语句对应机器指令的执行顺序。
- 内存系统的重排序:由于处理器使用缓存和读、写缓冲区,这使得加载和存储操作上看上去可能是乱序执行。
即系统在执行代码的时候并不一定是按照你写的代码的顺序依次执行。指令重排序可以保证串行语义一致,但是没有义务保证多线程间的语义也一致 ,但是在在多线程下,指令重排序可能会导致一些问题。
3.2happens-before简介
从jdk5开始,java使用jsr-133内存模型,其用happens-before的概念来阐述操作之间内存的可见性。在JMM中,如果一个操作执行的结果需要对另一个操作结果可见,那么这两个操作之间就存在happens-before关系,这两个操作可以在同一个线程,也可以在两个线程内。
happens-before的规则:
- 程序顺序规则:一个线程中的每个操作,happens-before于该线程中的任意后续操作。
- 监视器锁规则:对于一个锁的解锁,happens-before于随后对这个锁进行加锁。
- Volatile变量规则:对一个Volatile的写,happens-before于任意后续对这个Volatile域的读。
- 传递性:如果A happens-before B,且B happens-before C ,即A happens-before C。
【两个操作之间具有happens-before关系,并不意味着,前一个操作必须要在后一个操作之前执行!仅仅需要前一个操作的结果对后一个操作的结果可见,且前一个操作顺序再后一个操作顺序之前即可】
针对上述话的解释,有如下图:
【未同步程序在顺序一致性模型中虽然整体执行顺序是无序的,但所有线程都只能看到一个一致性的整体执行顺序。如上图所示:无论六个顺序如何改变,整体的执行顺序仍然按照A1-A2-A3,B1-B2-B3执行】
上述图片展示了happens-before于JMM的关系,对于程序员来说,happens-before 规则简单易懂,它避免程序员为了理解JMM提供的内存可见性而去学习复杂的重排序规则以及这些规则的具体实现方法。
四、内存模型的八种操作
为了更好的控制主内存和本地内存的交互,Java 内存模型定义了八种操作来实现:
- 读取(Read):从主内存中读取数据到工作内存。
- 加载(Load):将读取的数据放入工作内存的变量副本中。
- 使用(Use):执行代码,对变量进行操作,比如进行运算、赋值等。
- 赋值(Assign):将工作内存中的数据写回主内存。
- 存储(Store):将赋值的变量写入主内存。
- 锁定(Lock):获取锁,标识进入同步代码块的线程独占资源。
- 解锁(Unlock):释放锁,标识退出同步代码块,释放资源。
- volatile读写:使用volatile关键字修饰的变量的读取和写入操作具有一定的内存屏障效果,可以保证可见性和有序性。
五、Volatile关键字详解
volatile 是 Java 并发编程的重要组成部分,它的主要作用有两个:保证内存的可见性和禁止指令重排序。Volatile关键字可以保证变量的可见性,如果将变量声明为volatile,这就指示JVM,这个变量是共享的且不稳定的,每次使用都需要到主存中读取,但不能保证数据的原子性。volatile写内存语义是执行刷新到主内存中,读的内存语义是直接从主内存中读取。
通过使用Java关键字synchronized、volatile和locks,可以实现Java中的同步。
在Java中,不能有同步变量。对变量使用synchronized关键字是非法的,会导致编译错误。您可以使用Java volatile变量代替Java中的同步变量,它将指示JVM线程从主内存读取volatile变量的值,而不是在本地缓存它。如果一个变量不在多个线程之间共享,那么就不需要使用volatile关键字。
public class Singleton { private static volatile Singleton _instance; // volatile variable public static Singleton getInstance() { if (_instance == null) { synchronized (Singleton.class) { if (_instance == null) _instance = new Singleton(); } } return _instance; } }
在第一个请求到来时创建实例:如果不将_instance变量设置为volatile,那么创建Singleton实例的线程将无法与其他线程通信。因此,如果线程A正在创建单例实例,只是在创建之后,CPU损坏等,所有其他线程将无法看到_instance的值不为空,他们会认为它仍然被分配为空。
为什么会发生这种情况?因为读线程没有做任何锁定,直到写线程从同步块中出来,内存不会被同步,_instance的值不会在主存中更新。在Java中使用Volatile关键字,这是由Java自己处理的,所有读取线程都可以看到这样的更新。
使用场景:
- 当多个线程访问共享变量时,如果不使用volatile关键字,可能会出现可见性问题,即一个线程修改了变量的值,但其他线程无法感知到最新值的变化,导致数据不一致。
- 当一个变量被多个线程频繁地修改和访问时,使用volatile关键字可以避免使用锁(synchronized)的开销,提高程序的性能。
六、Synchronized关键字详解
Synchronized是java的关键字,主要解决多个线程之间访问资源的同步性,可以保证被它修饰的方法或者代码块在任意时刻只能有一个线程执行。早期,属于重量级锁,效率低下;Java 6后,synchronized引入了大量的优化如自旋锁、锁消除、锁粗化、偏向锁、轻量级锁等技术减少锁操作的开销。
底层原理:synchronized同步语句块的实现使用的是 monitorenter和 monitorexit指令,其中monitorenter 指令指向同步代码块的开始位置,monitorexit指令则指明同步代码块的结束位置。
使用synchronized关键字的方式:
synchronized void method (){ //修饰实例方法 } synchronized static void method(){ //修饰静态方法 } synchronized (this){ //修饰代码块 }
【重】synchronized关键字加到static静态方法和synchronized(class)代码块上都是给Class类加锁;synchronized关键字加到实例方法上是给对象加锁;尽量不要使用synchronized(string a)因为JVM中,字符串常量池具有缓存功能。
七、Volatile和synchronized区别
synchronized关键字和volatile关键字是两个互补的存在,而不是对立的存在!
- volatile关键字是线程同步的轻量级实现,所以volatile性能肯定比synchronize关键字要好 。但是volatile关键字只能用于变量而 synchronize关键字可以修饰方法以及代码块 。
- volatile关键字能保证数据的可见性,但不能保证数据的原子性。synchronized关键字两者都能保证。
- volatile关键字主要用于解决变量在多个线程之间的可见性,而 synchronized关键字解决的是多个线程之间访问资源的同步性。