高并发编程-重新认识Java内存模型(JMM)

简介: 高并发编程-重新认识Java内存模型(JMM)

20191031000621874.png


从CPU到内存模型


高并发编程-通过volatile重新认识CPU缓存 和 Java内存模型(JMM)


说到java内存模型, 我们先探讨下 内存模型(Memory Model) , 内存模型是和计算机硬件相关的一个概念。


先简单来了解下 计算机内存模型,然后再来引出 Java内存模型和计算机内存模型的关联关系。


计算机在执行程序的时候,每条指令都是在CPU中执行的,而执行的时候,不可避免的要和数据进行交互。 数据存在哪里呢 ?--------->存放在主存当中的,即计算机的物理内存。 (存在内存中对于提高计算机的执行效率必不可少)


20191030142614102.png


最开始, CPU和内存相安无事,内存的速度还能匹配的上CPU的运行速度。 随着CPU技术的发展,CPU的执行速度越来越快。但内存的技术并没有质的提高,所以从内存中读取和写入数据的过程和CPU的执行速度比起来差距越来越大,导致CPU每次操作内存都要耗时很长。


20191029151025349.png

所以为了解决这个问题,引入了高速缓存

所以程序的执行过程变为:

  1. 程序以及数据被加载到主内存
  2. 指令和数据被加载到CPU的高速缓存
  3. CPU执行指令,把结果写到高速缓存
  4. 高速缓存中的数据写回主内存


20191029150710461.png

随着CPU能力的不断提升, CPU的运算速度超越了1级缓存的数据I\O能力,CPU厂商又引入了多级的缓存结构。



20191029150755530.png


按照数据读取顺序和与CPU结合的紧密程度,CPU缓存可以分为一级缓存(L1),二级缓存(L3),部分高端CPU还具有三级缓存(L3),每一级缓存中所储存的全部数据都是下一级缓存的一部分。


在有了多级缓存之后,程序的执行就变成了:


当CPU要读取一个数据时,首先从一级缓存中查找,如果没有找到再从二级缓存中查找,如果还是没有就从三级缓存或内存中查找。


单核CPU只含有一套L1,L2,L3缓存;


多核CPU,则每个核心都含有一套L1(甚至和L2)缓存,而 共享L3(或者和L2)缓存。


20191030143931736.png

20191030143241837.png


L1是最接近CPU的,它容量最小、例如32K、速度最快,每个核上都有一个L1 Cache(准确地说每个核上有两个L1

Cache,一个存数据 L1d Cache,一个存指令 L1i Cache)。

L2 Cache 容量更大一些、例如256K、速度要稍慢一些,一般情况下每个核上都有一个独立的L2 Cache;

L3 Cache是三级缓存中最大的一级、例如12MB、同时也是最慢的一级,在同一个CPU插槽之间的核共享一个L3 Cache。

20191030144229749.png

为了高效地存取缓存,不是简单随意地将单条数据写入缓存的。


缓存是由缓存行组成的,典型的一行是64字节。CPU存取缓存都是按行为最小单位操作的。一个Java long型占8字节,所以从一条缓存行上可以获取到8个long型变量。那么如果要访问一个long类型数组,当有一个long元素对象被加载到cache中,将会无消耗地加载了另外7个,所以可以非常快地遍历数组。


由于多核是可以并行的,可能会出现多个线程同时写各自的缓存的情况,而各自的cache之间的数据就有可能不同。


还有一种硬件问题 : 为了使处理器内部的运算单元能够尽量的被充分利用,处理器可能会对输入代码进行乱序执行处理。这就是处理器优化。


除了处理器会对代码进行优化乱序处理,编程语言的编译器也会有类似的优化,比如Java虚拟机的即时编译器(JIT)也会做指令重排。


可想而知,如果任由处理器优化和编译器对指令重排的话,就可能导致各种各样的问题。


如何解决呢? 为了解决这个问题 ------------------------> 引入了 内存模型


内存模型如何确保缓存一致性


内存模型到底是怎么保证缓存一致性的呢 ,通常有如下了两种方案


1、通过在总线加LOCK#锁的方式


2、通过缓存一致性协议(Cache Coherence Protocol)


早期的CPU,通过在总线上加LOCK#锁的形式来解决缓存不一致的问题,但是在锁住总线期间,其他CPU无法访问内存,会导致效率低下。 所以引入了第二种 缓存一致性协议(Cache Coherence Protocol)。


缓存一致性协议 , 最出名的就是Intel 的MESI协议,MESI协议保证了每个缓存中使用的共享变量的副本是一致的。


MESI的核心的思想:当CPU写数据时,如果发现操作的变量是共享变量,即在其他CPU中也存在该变量的副本,会发出信号通知其他CPU将该变量的缓存行置为无效状态,因此当其他CPU需要读取这个变量时,发现自己缓存中缓存该变量的缓存行是无效的,那么它就会从内存重新读取。


在MESI协议中,每个缓存可能有有4个状态,它们分别是:


M(Modified):这行数据有效,数据被修改了,和内存中的数据不一致,数据只存在于本Cache中。

E(Exclusive):这行数据有效,数据和内存中的数据一致,数据只存在于本Cache中。

S(Shared):这行数据有效,数据和内存中的数据一致,数据存在于很多Cache中。

I(Invalid):这行数据无效。


MESI协议,可以保证缓存的一致性,但是无法保证实时性。


并发变成需要解决的问题 (原子性、可见性、有序性)


原子性是指在一个操作中就是cpu不可以在中途暂停然后再调度,既不被中断操作,要不执行完成,要不就不执行。

可见性是指当多个线程访问同一个变量时,一个线程修改了这个变量的值,其他线程能够立即看得到修改的值。

有序性即程序执行的顺序按照代码的先后顺序执行。


结合上面所说的,可以理解为: 缓存一致性问题—>可见性问题。处理器优化会导致原子性问题的。指令重排即会导致有序性问题


内存模型需要解决的问题


为了保证共享内存的正确性(可见性、有序性、原子性),内存模型定义了共享内存系统中多线程程序读写操作行为的规范。通过这些规则来规范对内存的读写操作,从而保证指令执行的正确性。它与处理器有关、与缓存有关、与并发有关、与编译器也有关。他解决了CPU多级缓存、处理器优化、指令重排等导致的内存访问问题,保证了并发场景下的一致性、原子性和有序性。


内存模型解决并发问题主要采用两种方式:限制处理器优化和使用内存屏障。


Java内存模型


计算机内存模型,这是解决多线程场景下并发问题的一个重要规范。那么实现上,不同的编程语言,可能有所不同。


Java内存模型(Java Memory Model ,JMM)就是一种符合内存模型规范的,屏蔽了各种硬件和操作系统的访问差异的,保证了Java程序在各种平台下对内存的访问都能保证效果一致的机制及规范。


我们这里指的是 JDK 5 开始使用的新的内存模型JSR-133: JavaTM Memory Model and Thread Specification


Java内存模型规定了所有的共享变量都存储在主内存中,每条线程还有自己的工作内存,线程的工作内存中保存了该线程中是用到的变量的主内存副本拷贝,线程对变量的所有操作都必须在工作内存中进行,而不能直接读写主内存。不同的线程之间也无法直接访问对方工作内存中的变量,线程间变量的传递均需要自己的工作内存和主存之间进行数据同步进行。


JMM就作用于工作内存和主存之间数据同步过程。JMM规定了如何做数据同步以及什么时候做数据同步。


20191030160007195.png


故: JMM是一种规范,目的是解决由于多线程通过共享内存进行通信时,存在的本地内存数据不一致、编译器会对代码指令重排序、处理器会对代码乱序执行等带来的问题。


JMM的API实现


Java中提供了很多和并发处理相关的关键字,比如volatile、synchronized、final、j.u.c包 等 ,这些关键字或者包就是Java内存模型封装了底层实现后,供开发者直接使用


原子性 synchronized


在Java中可以使用synchronized来保证方法和代码块内的操作是原子性的。 为了保证原子性,synchronized提供了两个高级的字节码指令monitorenter和monitorexit 。 具体细节另外开篇讨论。


可见性 volatile 、 synchronized 、 final


Java内存模型是通过在变量修改后将新值同步回主内存,在变量读取前从主内存刷新变量值的这种依赖主内存作为传递媒介的方式来实现的。


Java中的volatile关键字提供了一个功能,那就是被其修饰的变量在被修改后可以立即同步到主内存,被其修饰的变量在每次是用之前都从主内存刷新。因此,可以使用volatile来保证多线程操作时变量的可见性。


除了volatile,Java中的synchronized和final两个关键字也可以实现可见性 。


有序性 synchronized 、volatile


在Java中,可以使用synchronized和volatile来保证多线程之间操作的有序性。实现方式有所区别:

volatile关键字会禁止指令重排。synchronized关键字保证同一时刻只允许一条线程操作。


相关文章
|
14天前
|
设计模式 安全 Java
Java编程中的单例模式:理解与实践
【10月更文挑战第31天】在Java的世界里,单例模式是一种优雅的解决方案,它确保一个类只有一个实例,并提供一个全局访问点。本文将深入探讨单例模式的实现方式、使用场景及其优缺点,同时提供代码示例以加深理解。无论你是Java新手还是有经验的开发者,掌握单例模式都将是你技能库中的宝贵财富。
19 2
|
9天前
|
JSON Java Apache
非常实用的Http应用框架,杜绝Java Http 接口对接繁琐编程
UniHttp 是一个声明式的 HTTP 接口对接框架,帮助开发者快速对接第三方 HTTP 接口。通过 @HttpApi 注解定义接口,使用 @GetHttpInterface 和 @PostHttpInterface 等注解配置请求方法和参数。支持自定义代理逻辑、全局请求参数、错误处理和连接池配置,提高代码的内聚性和可读性。
|
11天前
|
安全 Java 编译器
JDK 10中的局部变量类型推断:Java编程的简化与革新
JDK 10引入的局部变量类型推断通过`var`关键字简化了代码编写,提高了可读性。编译器根据初始化表达式自动推断变量类型,减少了冗长的类型声明。虽然带来了诸多优点,但也有一些限制,如只能用于局部变量声明,并需立即初始化。这一特性使Java更接近动态类型语言,增强了灵活性和易用性。
94 53
|
11天前
|
缓存 算法 Java
本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制
在现代软件开发中,性能优化至关重要。本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制。通过调整垃圾回收器参数、优化堆大小与布局、使用对象池和缓存技术,开发者可显著提升应用性能和稳定性。
33 6
|
10天前
|
存储 安全 Java
Java多线程编程的艺术:从基础到实践####
本文深入探讨了Java多线程编程的核心概念、应用场景及其实现方式,旨在帮助开发者理解并掌握多线程编程的基本技能。文章首先概述了多线程的重要性和常见挑战,随后详细介绍了Java中创建和管理线程的两种主要方式:继承Thread类与实现Runnable接口。通过实例代码,本文展示了如何正确启动、运行及同步线程,以及如何处理线程间的通信与协作问题。最后,文章总结了多线程编程的最佳实践,为读者在实际项目中应用多线程技术提供了宝贵的参考。 ####
|
7天前
|
监控 安全 Java
Java中的多线程编程:从入门到实践####
本文将深入浅出地探讨Java多线程编程的核心概念、应用场景及实践技巧。不同于传统的摘要形式,本文将以一个简短的代码示例作为开篇,直接展示多线程的魅力,随后再详细解析其背后的原理与实现方式,旨在帮助读者快速理解并掌握Java多线程编程的基本技能。 ```java // 简单的多线程示例:创建两个线程,分别打印不同的消息 public class SimpleMultithreading { public static void main(String[] args) { Thread thread1 = new Thread(() -> System.out.prin
|
9天前
|
存储 缓存 安全
在 Java 编程中,创建临时文件用于存储临时数据或进行临时操作非常常见
在 Java 编程中,创建临时文件用于存储临时数据或进行临时操作非常常见。本文介绍了使用 `File.createTempFile` 方法和自定义创建临时文件的两种方式,详细探讨了它们的使用场景和注意事项,包括数据缓存、文件上传下载和日志记录等。强调了清理临时文件、确保文件名唯一性和合理设置文件权限的重要性。
24 2
|
10天前
|
Java UED
Java中的多线程编程基础与实践
【10月更文挑战第35天】在Java的世界中,多线程是提升应用性能和响应性的利器。本文将深入浅出地介绍如何在Java中创建和管理线程,以及如何利用同步机制确保数据一致性。我们将从简单的“Hello, World!”线程示例出发,逐步探索线程池的高效使用,并讨论常见的多线程问题。无论你是Java新手还是希望深化理解,这篇文章都将为你打开多线程的大门。
|
11天前
|
安全 Java 编译器
Java多线程编程的陷阱与最佳实践####
【10月更文挑战第29天】 本文深入探讨了Java多线程编程中的常见陷阱,如竞态条件、死锁、内存一致性错误等,并通过实例分析揭示了这些陷阱的成因。同时,文章也分享了一系列最佳实践,包括使用volatile关键字、原子类、线程安全集合以及并发框架(如java.util.concurrent包下的工具类),帮助开发者有效避免多线程编程中的问题,提升应用的稳定性和性能。 ####
39 1
|
14天前
|
存储 设计模式 分布式计算
Java中的多线程编程:并发与并行的深度解析####
在当今软件开发领域,多线程编程已成为提升应用性能、响应速度及资源利用率的关键手段之一。本文将深入探讨Java平台上的多线程机制,从基础概念到高级应用,全面解析并发与并行编程的核心理念、实现方式及其在实际项目中的应用策略。不同于常规摘要的简洁概述,本文旨在通过详尽的技术剖析,为读者构建一个系统化的多线程知识框架,辅以生动实例,让抽象概念具体化,复杂问题简单化。 ####