Java内存模型JMM

简介: Java内存模型JMM

简介


计算机存储结构,从本地磁盘到主存到CPU缓存,也就是从硬盘到内存,到CPU。

一般对于的程序的操作就是从数据库查数据到内存然后到CPU进行计算

1673408188151.jpg

因为有这么多级的缓存(cpu和物理主内存的速度是不一致的)

CPU的运行并不是直接操作内存而是先把内存里边的数据读到缓存,而内存的读和写操作的时候就会造成不一致的问题

1673408197861.jpg

JVM规范中试图定义一种Java内存模型(Java Memory Model,简称 JMM)来屏蔽掉各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的内存访问效果。


Java Memory Model


JMM本身是一种抽象的概念并不真实存在,它仅仅描述的是一组约定或规范,通过这组规范定义了程序中(尤其是多线程)各个变量的读写访问方式并决定一个线程对共享变量的写入何时以及如何变成对另一个线程可见,关键技术点都是围绕线程的原子性、可见性和有序性展开的。


原则:


JMM的关键技术点都是围绕多线程的原子性、可见性和有序性展开的


作用:


通过JMM来实现线程和主内存之间的抽象关系。

屏蔽掉各个硬件平台和操作系统的内存访问差异以实现让Java程序在各种平台下都能达到一致的内存访问效果


三大特性


可见性


是指当一个线程修改了某一个共享变量的值,其他线程是否能够立即知道该变更,JMM规定了所有的变量都存储在主内存中。

1673408245011.jpg

系统主内存 共享变量数据修改被写入的时机是不确定的, 多线程并发下很可能出现“脏读”,所以每个线程都有自己的工作内存 ,线程自己的工作内存中保存了该线程使用到的变量的主内存副本拷贝 ,线程对变量的所有操作(读取、赋值等)都必须在线程自己的工作内存中进行,而不能够直接读写主内存中的变量, 不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成


假设有个user类,new user对象(对象的属性存在主内存 共享变量中),同时两个线程去操作这个对象,线程需要先读取贡献变量到本地内存,再写入(修改)变量值,再放回主内存。线程只能操作自己的,不可以直接操作主内存

1673408254145.jpg

线程脏读

主内存中有变量 x ,初始值为0

线程A要将x 加1,先将 x = 0拷贝到自己的私有内存中,然后更新x的值

线程A将更新的x值回刷到主内存的时间是不固定的(可能刚刚计算完cpu的调度、上下文的切换先挂起了)

刚好在线程A没有回刷 x 到主内存时,线程B 同样从主内存中读取x,此时为0,和线程A一样的操作,最后期盼的x=2 就会变成 x=1


原子性


指同一个操作是不可打断的,即多线程环境下,操作不能被其他线程干扰


有序性


有序性不是平常写的main方法,从方法入口一行一行往下执行。尤其在多线程高并发的环境,有序性就复杂了


对于一个线程的执行代码而言,我们总是习惯性认为代码的执行总是从上到下,有序执行。但是为了性能,编译器和处理器通常会对指令序列进行重新排序。Java规范规定JVM线程内部维持顺序话语义,即只要程序的最终结果与它顺序化执行的结果相等,那么指令的执行顺序可以与代码顺序不一致,此过程叫执行的重排序。


优缺点

JVM能根据处理器特性(CPU多级缓存系统、多核处理器等)适当的对机器指令进行重排序,使机器指令能够更符合CPU的执行特性,最大限度的发挥机器性能但是,

指令重排 可以保证串行语义一致,但没有义务保证 多线程的语义也一致(即可能产生“脏读”),简单说就是

两行以上不相干的代码在执行的时候有可能先执行的不是第一条,不见得是从上到下顺序执行,执行顺序 会被优化


从源码到最终执行示例图

1673408279003.jpg

单线程环境里面确保程序最终执行结果和代码顺序执行的结果一致。

处理器在进行重排序时必须要考虑 指令之间的数据依赖性

多线程环境中线程交替执行,由于编译器优化重排的存在,两个线程中使用的变量能否保证一致性是无法确定的,结果无法预测。


在某些特殊场景,我们需要禁止指令重排而保证程序执行的有序性


多线程对变量的读写过程


由于JVM运行程序的实体是线程,而每个线程创建时JVM都会为其创建一个工作内存(也称为栈空间),工作内存是每个线程的私有数据区域,而Java内存模型中规定所有的变量都存储在主内存,主内存是共享内存区域,所有线程都可以访问,但线程对变量的操作(读取赋值等)必须在工作内存中进行,首先要将变量从主内存拷贝到线程自己的工作内存空间,然后对变量进行操作,操作完成后再将变量写回主内存,不能直接操作主内存中的变量,各个线程中的工作内存中存储着主内存中的变量副本拷贝,因此不同的线程间无法访问对方的工作内存,线程间的通信(传值)必须通过主内存来完成

1673408297470.jpg

JMM定义了线程和主内存之间的抽象关系


线程之间的共享变量存储在主内存中(从硬件角度来说就是主内存)

每个线程都有一个私有的本地工作内存,本地工作内存中存储了该线程用来读/写共享变量的副本(从硬件角度来说就是CPU的缓存,比如寄存器、L1、L2、L3缓存等)

总结


我们定义的所有共享变量都存储在物理主内存中

每个线程都有自己独立的工作内存,里面保存该线程使用到的变量的副本(主内存中该变量的一份拷贝)

线程对共享变量所有的操作都必须先在线程自己的工作内存中进行后写回主内存,不能直接从主内存中读写(不能越级)

不同线程之间也无法直接访问其他线程的工作内存中的变量,线程间变量值的传递需要通过主内存来进行(同级不能相互访问)


多线程先行发生原则之happens-before


在JVM中,如果一个操作执行的结果需要对另一个操作可见性,或者代码重排序,那么这两个操作之间必须存在happens-before(先行发生)原则。

逻辑上的先后关系

x=5 线程A执行
y=a 线程B执行
上述称之为:写后读



y是否等于5?


如果线程A的操作(x=5)happens-before(先行发生)线程B的操作(y=x),那么可以确定线程B执行后y=5一定成立

如果他们不存在happens-before原则,那么y=5不一定成立。


这就是happens-before原则 -----》包含可见性和有序性的约束


如果Java内存模型中所有的有序性都仅依靠volatile和synchronized来完成,那么有很多操作都将会变的非常啰嗦,但是我们在编写Java并发代码的时候并没有察觉到这一点。


我们没有 时时、处处、此次,添加volatile和synchronized来完成程序,这是因为Java语言中JMM原则下有一个“先行发生”(Happens-Before)的原则限制和规矩


这个原则非常重要


它是判断数据是否存在竞争,线程是否安全的非常有用的手段。依赖这个原则,我们可以通过几条简单规则一下子解决并发环境下两个操作之间是否可能存在冲突的所有问题 ,而不需要陷入Java内存模型苦涩难懂的底层编译原理之中。


happens-before原则


如果一个操作happens-before另一个操作,那么第一个操作的执行结果将对第二个操作可见,而且第一个操作的执行顺序排在第二个操作之前。


两个操作之间存在happens-before关系,并不意味着一定要按照happens-before原则制定的顺序来执行。如果重排序之后的执行结果与按照happens-before关系来执行的结果一致,那么这种重排序 并不非法


例如: 1+2+3 = 3+2+1,最终结果是一致的


happens-before之8条


次序规则

一个线程内,按照代码顺序,写在前面的操作先行发生于写在后面的操作

前一个操作的结果可以被后续的操作获取,例如:前面一个操作把变量 x 赋值为1,那后面的一个操作肯定能知道 x 已经变成了1


锁定规则

一个unLock操作 先行发生于后面(这里“后面”是指时间上的先后)对同一个锁的 lock操作

static Object objectLock = new Object();
    public static void main1(String[] args) {
        // 对于同一把锁objectLock,ThreadA一定先unlock同一把锁后B才能获得该锁, A先行发生于B
        synchronized (objectLock){
        }
    }


volatile变量原则

对一个volatile变量的写操作先行发生于后面对这个变量的读操作,前面的写对后面的读是可见的,这里的“后面“同样是指时间上的先后。


传递规则

如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C


线程启动规则(Thread Start Rule)

Thread对象的start()方法先行发生于此线程的每一个动作

Thread t1 = new Thread(()->{
            System.out.println("hello world");
        });
       t1.start();
//先start()之后,才会执行线程里的内容(System.out.println("hello world");)


线程中断规则(Thread Interruption Rule)

对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生;

可以通过Thread.interrupted()检测到是否发生中断

解释: 也就是说要先调用interrupt()方法设置过中断标志位,才能检测到中断发送


线程终止规则(Thread Termination Rule)

线程中的所有操作都先行发生于对此线程的终止检测,可以通过isAlive()等手段检测线程是否已经终止执行。


对象终结规则(Finalizer Rule)

一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始

finalize(): JVM中一个对象要被回收的时候,最终要执行的一个方法

对象没有完成初始化之前,是不能调用finalized()方法的

也就是说:要先new一个对象(先生 ),才能被当作垃圾清理回收( 后死 )


在Java语言里面,Happens-Before的语义本质上是一种可见性


A Happens-Before B 意味着A发生过的事情对B来说是可见的,无论A事件和B时间是否发生在同一个线程里


JMM的设计分为两个部分:


一部分是面向程序员提供的,也就是happens-before原则,通俗易懂的向程序员阐述了一个强内存模型,只要理解happens-before规则,就可以编写并发安全的程序

另一部分是针对JVM实现的,为了尽可能少的对编译器和处理器做约束从而提高性能,JMM在不影响程序执行结果的前提下对其不做要求,即允许优化重排序。我们只需要关注前者就好,也就是理解happens-before规则即可,其他繁杂的内容JMM规范结合操作系统给我们搞定,只需写好代码即可


案例


private int value = 0;
public int getValue(){
    return value;
}
public int setValue(){
    return ++value;
}


假设存在线程A和B,线程A先(时间上的先后)调用了setValue(), 然后线程B调用了同一个对象的getValue(),那么线程B收到的返回值是什么?注意:是两个不同的线程


分析:


由于两个方法是不同的线程调用,不在同一个线程中,所以肯定不满足程序次序规则;

两个方法都没有使用锁,所以不满足锁定规则;

变量不是用volatile修饰的,所以volatile变量规则不满足;

传递规则肯定不满足(只有两个线程,不涉及第三个)

无法通过happens-before原则推到出 线程A happens-befores 线程B,虽然可以确认 在时间上线程A优先于线程B指定,但就是无法确认线程B获得的结果是什么 ,所以这段代码不是线程安全的。


解决方案:


private int value = 0;
public synchronized int getValue(){
    return value;
}
public synchronized int setValue(){
    return ++value;
}


②把value定义为volatile变量,由于setter方法对value的修改不依赖value的原值(每次都会++),满足volatile关键字的使用场景

/**
 * 使用:把value定义为volatile变量,由于setter方法对value的修改不依赖value的原值,满足volatile关键字的使用场景
 * 理由:利用volatile保证读取操作的可见性;利用synchronized保证复合操作的原子性结合使用锁和volatile变量来减少同步的开销
 */
private volatile int value = 0;
public int getValue(){
    return value; //利用volatile保证读取操作的可见性
}
public synchronized int setValue(){
    return ++value; //利用synchronized保证复合操作的原子性
}
相关文章
|
15天前
|
安全 Java 程序员
深入理解Java内存模型与并发编程####
本文旨在探讨Java内存模型(JMM)的复杂性及其对并发编程的影响,不同于传统的摘要形式,本文将以一个实际案例为引子,逐步揭示JMM的核心概念,包括原子性、可见性、有序性,以及这些特性在多线程环境下的具体表现。通过对比分析不同并发工具类的应用,如synchronized、volatile关键字、Lock接口及其实现等,本文将展示如何在实践中有效利用JMM来设计高效且安全的并发程序。最后,还将简要介绍Java 8及更高版本中引入的新特性,如StampedLock,以及它们如何进一步优化多线程编程模型。 ####
21 0
|
17天前
|
存储 监控 算法
Java内存管理深度剖析:从垃圾收集到内存泄漏的全面指南####
本文深入探讨了Java虚拟机(JVM)中的内存管理机制,特别是垃圾收集(GC)的工作原理及其调优策略。不同于传统的摘要概述,本文将通过实际案例分析,揭示内存泄漏的根源与预防措施,为开发者提供实战中的优化建议,旨在帮助读者构建高效、稳定的Java应用。 ####
31 8
|
15天前
|
存储 监控 算法
深入探索Java虚拟机(JVM)的内存管理机制
本文旨在为读者提供对Java虚拟机(JVM)内存管理机制的深入理解。通过详细解析JVM的内存结构、垃圾回收算法以及性能优化策略,本文不仅揭示了Java程序高效运行背后的原理,还为开发者提供了优化应用程序性能的实用技巧。不同于常规摘要仅概述文章大意,本文摘要将简要介绍JVM内存管理的关键点,为读者提供一个清晰的学习路线图。
|
19天前
|
存储 算法 Java
Java 内存管理与优化:掌控堆与栈,雕琢高效代码
Java内存管理与优化是提升程序性能的关键。掌握堆与栈的运作机制,学习如何有效管理内存资源,雕琢出更加高效的代码,是每个Java开发者必备的技能。
46 5
|
17天前
|
存储 算法 Java
Java内存管理深度解析####
本文深入探讨了Java虚拟机(JVM)中的内存分配与垃圾回收机制,揭示了其高效管理内存的奥秘。文章首先概述了JVM内存模型,随后详细阐述了堆、栈、方法区等关键区域的作用及管理策略。在垃圾回收部分,重点介绍了标记-清除、复制算法、标记-整理等多种回收算法的工作原理及其适用场景,并通过实际案例分析了不同GC策略对应用性能的影响。对于开发者而言,理解这些原理有助于编写出更加高效、稳定的Java应用程序。 ####
|
17天前
|
安全 Java 程序员
Java内存模型的深入理解与实践
本文旨在深入探讨Java内存模型(JMM)的核心概念,包括原子性、可见性和有序性,并通过实例代码分析这些特性在实际编程中的应用。我们将从理论到实践,逐步揭示JMM在多线程编程中的重要性和复杂性,帮助读者构建更加健壮的并发程序。
|
22天前
|
算法 Java 开发者
Java内存管理与垃圾回收机制深度剖析####
本文深入探讨了Java虚拟机(JVM)的内存管理机制,特别是其垃圾回收机制的工作原理、算法及实践优化策略。不同于传统的摘要概述,本文将以一个虚拟的“城市环卫系统”为比喻,生动形象地揭示Java内存管理的奥秘,旨在帮助开发者更好地理解并调优Java应用的性能。 ####
|
14天前
|
存储 监控 算法
Java内存管理的艺术:深入理解垃圾回收机制####
本文将引领读者探索Java虚拟机(JVM)中垃圾回收的奥秘,解析其背后的算法原理,通过实例揭示调优策略,旨在提升Java开发者对内存管理能力的认知,优化应用程序性能。 ####
29 0
|
25天前
|
缓存 Prometheus 监控
Elasticsearch集群JVM调优设置合适的堆内存大小
Elasticsearch集群JVM调优设置合适的堆内存大小
208 1
|
24天前
|
Java
JVM内存参数
-Xmx[]:堆空间最大内存 -Xms[]:堆空间最小内存,一般设置成跟堆空间最大内存一样的 -Xmn[]:新生代的最大内存 -xx[use 垃圾回收器名称]:指定垃圾回收器 -xss:设置单个线程栈大小 一般设堆空间为最大可用物理地址的百分之80