多线程(四):线程安全

简介: 多线程(四):线程安全

在开始讲解线程安全之前我们先来回顾一下我们学了那些东西了:

1. 线程和进程的认识

2. Thread 类的基本用法

3. 简单认识线程状态

4. 初见线程安全

上一章结束时看了一眼线程安全问题,本章将针对这个重点讲解。


一个代码在单线程中能够安全执行,但是在多线程中就容易出现错误;其本质原因就是线程在系统中的调度是无序的 / 抢占式执行的。

再看一眼上一章末尾的题,两个线程各执行 5w 次自增操作,最后的结果为什么是一个小于 10w 的随机数。


上节课也画了图:


7bfca9a1bce848d6b9b01844fdc6a4dd.png


线程不安全的原因


我们在这里讨论一下照成线程不安全的原因有哪些?


  1. 多线程的抢占式执行(罪魁祸首)
  2. 多个线程修改同一个变量 【如果是一个线程修改一个变量 => 安全】【多个线程读取一个变量 => 安全】【多个线程修改不同变量 => 安全】
  1. 修改操作不是原子的
  2. 内存可见性引起的线程不安全
  3. 指令重排序引起的线程不安全


那么我们就开始本章内容的讲解

对于 多线程的抢占式执行多个线程修改同一个变量 这两点不是我们能够改变的,我们就直接跳过,直接看第三条


修改操作不是原子的


这里说到的原子性,数据库中 事物的原子性 是一个概念, 原子性意味着不可再分,说明每个操作都是最小单位。


例如上述例题: 每次自增操作都不算是最小操作,我们还可以对其进行划分,将一次 add 操作,分为三个小操作:load 、 add 、 save ;


任意某个操作对应单个 cpu 指令就是原子的, 对应多个 cpu 操作就是非原子的。


正是应该这个操作不是原子的,导致了俩个线程的指令排序存在更多的变数


既然我们发现了这个问题了,我们该如何解决呢?


保证操作的原子性


既然它不是原子的,那么我们就可以通过加锁操作让它变成原子性的。

就比如:



bdcd293f22fc44a3abe95b120728ad92.png



我们要上厕所,为了让别人也进来,所以需要锁门,我们就给门 加了个锁,那么上完厕所以后,就解锁,剩下的两个人就继续 抢占式 上厕所。

那么这个锁呢就可以保证 “原子性” 的效果

锁的核心操作就两个,加锁和解锁

对于上述的一个锁,当谁抢到了,其他线程就需要等待,也就发生了 阻塞等待,直到拿到锁的线程释放为止。

那么如何对线程进行加锁呢?

加锁 和 解锁


Java提供了关键字:synchronized,Java直接用 synchronized 这个关键字实现加锁过程。

还是上一章中最后一段的线程自增 5w 次的例子:

代码如下

class Count {
    private int count = 0;
    public void add() {
        synchronized (this) {
            count++;
        }
    }
    public int get() {
        return count;
    }
}
public class demo11 {
    public static void main(String[] args) throws InterruptedException {
        Count count = new Count();
        Thread t1 = new Thread(() -> {
            for (int i = 0; i < 50000; i++) {
                count.add();
            }
        });
        Thread t2 = new Thread(() -> {
            for (int i = 0; i < 50000; i++) {
                count.add();
            }
        });
        t1.start();
        t2.start();
        t1.join();
        t2.join();
        System.out.println(count.get());
    }
}

唯一不同的点在于:


59c3f1cf77b74d5bb146cef5fc25e2f8.png

我们加了关键字。

这里给它加了个代码块,这个代码块有啥用呢?


一旦进入 被 synchronized 修饰的代码块时,就出发加锁机制, 一旦离开了这个代码块就会触发解锁机制。


而且我们在 synchronized 后面加了一个(this)这里的 this 就是锁对象

谁调用 this 就是谁,就对谁进行加锁操作。

例如:


7963b807395446cfa1948e459686765d.png



如果两个线程,针对同一个对象进行加锁,就会造成锁竞争(一个拿到锁,另一个线程阻塞等待)。如果两个对象针对不同的锁竞争就不会照成锁竞争。


现在重点来说一下锁括号里面的东西:


() 里的锁对象,可以是写作任意一个Object 对象,但是不能是 内置类型(内置类型就是基本数据类型)。


这括号主要就是为为了告诉大家,多个线程针对同一个对象加锁就会出现锁竞争,如果针对不同的对象加锁,就不会出现锁竞争了,再也没有别的作用


加锁以后,操作就变成原子的了,原来的操作就变成为了:


dd9759bdbd924d1fb54d4e406fb9349f.png


那么再次执行的时候就变成为了:

46055eca4bcf4deab9f2c184d354863b.png

由于 t1 已经率先lock 了,t2 再次尝试 lock 就会出现阻塞等待的情况。


此时就可以保证 t2 的load 一定是在 t1 save 之后,此时计算的结果就一定是安全的。


加锁的本质其实就是变成串行化。


那么对比 join 方法,join也是实现串行化,join 方法是让两个线程都是实现串行化,而加锁只是让加锁的部分串行,其他部分还是并发执行的。


无论如何,加锁可能会造成阻塞,代码阻塞,对于程序的效率还是会有影响的。


内存可见性引起的线程不安全


我们先来写个 bug 在来说原因。

看代码:


import java.util.Scanner;
public class demo12 {
    public static boolean flag = false;
    public static void main(String[] args) {
        Thread t1 = new Thread(() -> {
            while (!flag) {
            }
        });
        Thread t2 = new Thread(() -> {
            Scanner scanner = new Scanner(System.in);
            flag = scanner.nextBoolean();
        });
        t1.start();
        t2.start();
    }
}


我们在来运行一遍:


970dc100d8cf496e84d50d43aa66638c.png

可以看到输入了true 之后代码还在跑,同样可以在 jconsole 里看到线程还在执行,为什么这一段代码还继续执行呢。


这里就涉及到内存可见性了。


我们在执行这段代码的时候,进入到 while 循环, !flag 为真 在这个过程中又发生了两个 原子性的操作, 一个是 load :从内存读取数据到 cpu 寄存器;一个是 cmp (在cpu中可以叫别的名字):比较寄存器内的值是否为 false 。


这两个操作,load 消耗的时间远远高于 cmp 。


读内存虽然比读硬盘 快个几千倍 ; 读寄存器又要比 读内存快个几千倍


这样换算下来 每秒钟就要执行上亿次。

那么这样看下来,编译器发现 load 的开销很大,并且每次的结果都一样,那么编译器就做了一个非常大胆的操作,直接将 load 优化掉了(去掉了),只有第一次执行的 load 真正执行了,后续只循环 cmp 不执行 load 。


所谓的内存可见性就是在多线程的环境下,编译器对于代码优化,产生了误判,从而引起的 bug ,从而导致我们代码的 bug 。


那么我们就可以通过 让编译器对这个场景暂停优化 :


这里就需要使用另一个关键字: volatile


该关键字的含义就是:被它修饰的变量,此时编译器就会停止上述的优化。能够保证每次都是从内存上重新读取数据。


volatile关键字的作用主要有如下两个:


  1. 保证内存可见性:基于屏障指令实现,即当一个线程修改一个共享变量时,另外一个线程能读到这个修改的值。
  2. 保证有序性:禁止指令重排序。编译时 JVM 编译器遵循内存屏障的约束,运行时靠屏障指令组织指令顺序。


volatile不能保证原子性,volatile 使用的场景是:一个线程读,一个线程写的情况,而 synchronized 则适用于多线程写。


volatile 的这个效果,称为 “保证内存可见性”。


而 synchronized 不确定是否也能保证内存可见性,网上资料 众说纷纭 。


volatile 还有一个效果,禁止指令重排序。


指令重排序


什么是指令重排序?

这也是编译器优化手段的一种,调整了代码的执行顺序,但是前后的逻辑不改变,效率更高。

如果是单线程的实现逻辑,结果并不会改变,但是在多线程中就会产生问题。

举例:

有个学生对象: Student s;

线程: t1  :s = new Student();

线程: t2  :if (s != null)  s.learn();

大体可以分为三个步骤:


1. 申请内存空间

2. 调用构造方法(初始化内存的数据)

3. 把对象的引用赋值给s (内存地址的赋值)

如果是个单线程,此处可以发生指令重排序, 2 和 3 谁先谁后都可以。


t1执行1和3,即将执行2的时候,t2开始执行,t2拿到的就不是一个空的对象,是一个非空的,他就去调用cow的方法,但是实际上,t1还没有初始化,调用方法,会产生bug,所以我们可以在cow对象前加关键字volatile,保证执行顺序。


那么本章的 线程安全 就到这里,下一章继续多线程内容


相关文章
|
4月前
|
安全 算法 Java
Java 多线程:线程安全与同步控制的深度解析
本文介绍了 Java 多线程开发的关键技术,涵盖线程的创建与启动、线程安全问题及其解决方案,包括 synchronized 关键字、原子类和线程间通信机制。通过示例代码讲解了多线程编程中的常见问题与优化方法,帮助开发者提升程序性能与稳定性。
200 0
|
1月前
|
JSON 网络协议 安全
【Java】(10)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
143 1
|
1月前
|
JSON 网络协议 安全
【Java基础】(1)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
161 1
|
4月前
|
数据采集 监控 调度
干货分享“用 多线程 爬取数据”:单线程 + 协程的效率反超 3 倍,这才是 Python 异步的正确打开方式
在 Python 爬虫中,多线程因 GIL 和切换开销效率低下,而协程通过用户态调度实现高并发,大幅提升爬取效率。本文详解协程原理、实战对比多线程性能,并提供最佳实践,助你掌握异步爬虫核心技术。
|
5月前
|
Java 数据挖掘 调度
Java 多线程创建零基础入门新手指南:从零开始全面学习多线程创建方法
本文从零基础角度出发,深入浅出地讲解Java多线程的创建方式。内容涵盖继承`Thread`类、实现`Runnable`接口、使用`Callable`和`Future`接口以及线程池的创建与管理等核心知识点。通过代码示例与应用场景分析,帮助读者理解每种方式的特点及适用场景,理论结合实践,轻松掌握Java多线程编程 essentials。
370 5
|
9月前
|
Python
python3多线程中使用线程睡眠
本文详细介绍了Python3多线程编程中使用线程睡眠的基本方法和应用场景。通过 `time.sleep()`函数,可以使线程暂停执行一段指定的时间,从而控制线程的执行节奏。通过实际示例演示了如何在多线程中使用线程睡眠来实现计数器和下载器功能。希望本文能帮助您更好地理解和应用Python多线程编程,提高程序的并发能力和执行效率。
349 20
|
9月前
|
安全 Java C#
Unity多线程使用(线程池)
在C#中使用线程池需引用`System.Threading`。创建单个线程时,务必在Unity程序停止前关闭线程(如使用`Thread.Abort()`),否则可能导致崩溃。示例代码展示了如何创建和管理线程,确保在线程中执行任务并在主线程中处理结果。完整代码包括线程池队列、主线程检查及线程安全的操作队列管理,确保多线程操作的稳定性和安全性。
|
11月前
|
NoSQL Redis
单线程传奇Redis,为何引入多线程?
Redis 4.0 引入多线程支持,主要用于后台对象删除、处理阻塞命令和网络 I/O 等操作,以提高并发性和性能。尽管如此,Redis 仍保留单线程执行模型处理客户端请求,确保高效性和简单性。多线程仅用于优化后台任务,如异步删除过期对象和分担读写操作,从而提升整体性能。
208 1
|
存储 消息中间件 资源调度
C++ 多线程之初识多线程
这篇文章介绍了C++多线程的基本概念,包括进程和线程的定义、并发的实现方式,以及如何在C++中创建和管理线程,包括使用`std::thread`库、线程的join和detach方法,并通过示例代码展示了如何创建和使用多线程。
172 1
C++ 多线程之初识多线程
|
Java 开发者
在Java多线程编程中,创建线程的方法有两种:继承Thread类和实现Runnable接口
【10月更文挑战第20天】在Java多线程编程中,创建线程的方法有两种:继承Thread类和实现Runnable接口。本文揭示了这两种方式的微妙差异和潜在陷阱,帮助你更好地理解和选择适合项目需求的线程创建方式。
242 3

热门文章

最新文章