【多线程-从零开始-肆】线程安全、加锁和死锁

简介: 【多线程-从零开始-肆】线程安全、加锁和死锁

进程状态

进程状态:

  • 就绪:正在 CPU 上执行,或者随时可以去 CPU 上执行
  • 阻塞:暂时不能参与 CPU 的执行

Java 的线程,对应状态做了更详细的区分,不仅仅是就绪和阻塞了

六种状态:

  1. NEW
  • 当前 Thread 对象虽然有了,但是内核的线程还没有(还没调用过 start)
  1. TERMINATE
  • 当前 Thread 对象虽然还在,但是内核的线程已经销毁(线程已经结束)
  1. RUNNABLE
  • 就绪状态,正在 CPU 上运行 + 随时可以去 CPU 上运行
  1. BLOCKED
  • 阻塞状态
  • 锁竞争引起的阻塞
  1. TIMED_WAITING
  • 阻塞状态
  • 有超时时间的等待,比如 sleep 或者 join 带参数版本
  1. WAITING
  • 阻塞状态
  • 没有超时时间
  • 通过 jconsole 可以直接看到线程的状态
  • 学习线程状态主要是为了调试,比如,遇到某个代码功能没有执行,就可以通过观察对应线程的状态,看是否是因为一些原因阻塞了

线程安全

是什么

罪魁祸首是:线程的调度是随机的


在多个线程同时执行某个代码的时候,可能会引起一些奇怪的 bug。理解了线程安全,才能避免/解决上述的 bug

因为多个线程并发执行引起的 bug,称为“线程安全问题”或者“线程不安全”

public class Demo8 {  
    private static int count = 0;  
  
    public static void main(String[] args) throws InterruptedException {  
        Thread t1 = new Thread(() -> {  
            for (int i = 0; i < 5000; i++) {  
                count++;  
            }        
        });        
        Thread t2 = new Thread(() -> {  
            for (int i = 0; i < 5000; i++) {  
                count++;  
            }        
        });        
        t1.start();  
        t2.start();  
  
        t1.join();  
        t2.join();  
        System.out.println(count);  
    }
}
  • 此时打印出来的结果不等于 10000,并且每一次都不一样
  • 这个写法是 t1 和 t2 并发执行,产生了 bug

若将 join 执行的时机改一下,就不会产生这种 bug

public class Demo8 {  
    private static int count = 0;  
  
    public static void main(String[] args) throws InterruptedException {  
        Thread t1 = new Thread(() -> {  
            for (int i = 0; i < 5000; i++) {  
                count++;  
            }        
        });        
        Thread t2 = new Thread(() -> {  
            for (int i = 0; i < 5000; i++) {  
                count++;  
            }        
        });        
        t1.start();  
        t1.join();  
        
        t2.start();  
        t2.join();  
        System.out.println(count);  
    }
}
  • 此时打印出来的结果就一直为 10000
  • 这个写法本质上相当于 t1 先执行,执行完之后 t2 再执行,t1 和 t2 是串行执行的

为什么

  • 上面代码中的count++操作,在CPU 看来,是三个指令
  1. 把内存中的数据读取到 CPU 寄存器—— load
  2. 把 CPU 寄存器里的数据+1—— add
  3. 把寄存器的值,写回内存—— save
    由于不同架构的 CPU,有不同的指令集,不同的指令集里都有不同的指令,针对这三个操作,不同 CPU 里的对应指令名称肯定是不同的
  • CPU 在调度执行线程的时候,说不上啥时候就会把线程给切换走(抢占式执行,随机调度),指令是 CPU 最基本的单位,要调度,至少把当前线程执行完,不会执行一般调度走
  • 但是 count++是三个指令,可能会出现 CPU 执行了其中的一个或者两个或者三个指令调度走的情况
  • 基于上面的情况,两个线程同时对 count 进行++,就容易出现 bug

  • 只要 t1 和 t2 的三个指令执行不是连在一起的,就都会出现 bug,只有两种情况能正常执行
  • 出现 bug 之后,count 的大小永远小于 10000,但也有可能小于 5000
  • 因为可能出现 t1++一次的过程中,t2++两次,这样得到的结果,正常应该++3 次,而实际只++1 次

综上,原因为:

  1. 线程在操作系统中,随机调度,抢占式执行
  2. 多个线程,同时修改同一个变量
  3. 修改操作不是“原子“的(比如++就是三个指令)
  4. 内存可见性
  5. 指令重排序

解决方案

  • 上面的第一个原因无法干预,操作系统内核负责的工作,应用层的程序员无法干预
  • 第二个原因如果禁止变量修改,也是第一种解决线程安全的思路,但普适性不高,因为是否可行要看实际需求
  • 解决线程安全问题,最主要的办法就是把“非原子”的修改,变成“原子”的

加锁

  • 此处的加锁并不是真的让 count++变成原子的,也没有干预线程的调度,只不是通过这种加锁的方式,使一个线程在执行 count++的过程中,其他的线程的 count++不能插队进来
  • 把非原子的修改操作,打包成一个整体,变成原子的操作
  • 在 Java 中,提供了一个synchornized关键字,来完成加锁操作
  • 这是一个关键字,不是函数,后面的() 并非参数,而是需要指定一个“锁对象”,然后通过“锁对象”来进行后续的判定
  • () 里的对象可以指定任何对象
  • {}里面的代码,就是要打包到一起的,() 里面还可以放任意的其他代码,包括调用别的方法啥的,只要是合法的 Java 代码,都是可以放的
public class Demo8 {  
    private static int count = 0;  
    private static Object locker = new Object();  
  
    public static void main(String[] args) throws InterruptedException {  
        Thread t1 = new Thread(() -> {  
            for (int i = 0; i < 5000; i++) {  
                synchronized(locker){  
                    count++;  
                };            
            }        
        });        
        Thread t2 = new Thread(() -> {  
            for (int i = 0; i < 5000; i++) {  
                synchronized (locker){  
                    count++;  
                }            
            }        
        });        
        t1.start();  
        t2.start();  
  
        t1.join();  
        t2.join();  
        System.out.println(count);  
    }
}
  • 由于 t1 和 t2 都是针对 locker 对象加锁,t1 先加锁,就加锁成功了,于是 t1 继续执行 () 里面的代码(进厕所,执行上厕所的操作)
  • t2 后加锁的,发现 locker 对象已经被别人先锁了,就只能等(说明现在厕所有人,于是只能排队等待)
  • 又因为 t1 的 unlock 一定是在 save 之后,确保了 t2 执行 load 的时候,t1 已经 save
  • 这两者的++操作不会穿插执行了,也就不会相互覆盖掉对方的结果了
  • 这里本质上是将随机的并发执行过程变成了串行执行

  • 锁对象肯定是个对象,不能拿 int、double 这种内置类型写到() 里面,但是其他类型,只要是 Object 或者其子类,都可以。例如:一个字符串 s = “hello”,一个链表 list… 都行
  • 锁对象作用,就是用来区分多个线程是否针对“同一个对象”加锁
  • 是针对同一个对象的话就会出现“阻塞”(锁竞争/锁冲突)
  • 不是针对一个对象加锁,就不会出现“阻塞”,两个线程仍然是随机调度的并发执行
  • 锁对象,填哪个对象不重要,多个线程是否是同一个锁对象才重要

注意:

  • 加锁后的代码,本质上比 join 的串行执行效率是要高很多的
  • 加锁只是把线程中的一小部分逻辑变成“串行执行”,剩下的其他部分,仍然是可以并发执行的
Thread t1 = new Thread(() -> {  
    for (int i = 0; i < 5000; i++) {  
        synchronized(locker){  
            count++;  
        };    
    }
});  
Thread t2 = new Thread(() -> {  
    for (int i = 0; i < 5000; i++) {  
        synchronized (locker){  
            count++;  
        }    
    }
});
  • 这里面只是 count++是串行执行的,而 for 循环、比较、i++都是并发执行的
  • 只有锁里面的是串行的,外面的仍然能并发执行
  • 引入多线程并发,就是为了提高效率,引入锁之后,相当于一个线程中,小部分工作是不得不串行,但仍有大部分工作是可以并发的。虽然不如整体都并发效率高,但是肯定比整体都串行效率高

如果是三个线程针对同一个对象加锁,也是类似的情况

  • 其中某个线程先加上锁,另外两个线程阻塞等待,(哪个线程拿到锁,这个过程是不可预期的)
  • 拿到锁的线程释放了锁之后,剩下两个线程谁先拿到锁呢?也是不确定的
  • 此处 synchronizedJVM 提供的功能,synchronized 底层实现就是 JVM 中,通过 C++ 来实现的。进一步的,也是依靠操作系统提供的 API 实现的加锁,操作系统的 API 则是来自于 CPU 上支持的特殊指令来实现的
  • 系统原生的加锁 API 和很多编程语言的加锁操作的封装方式是两个函数:lock()unlock()
  • 像 Java 这种通过synchronized关键字,来同时完成加锁/解锁的,比较少见
  • 原生的这种做法,最大的问题在于 unlock 可能执行不到,后面排队想用这个锁的就用不了(占着坑不拉屎)
  • Java 中的 synchronized 是进入代码块就加锁,出了代码块就解锁,无论是 return 还是抛出异常,不管以哪种方式出了代码块都会自动解锁,有效避免了没有执行解锁操作的情况

类对象:

  • 一个 Java 进程中,一个类的对象是只有唯一一个的
  • 类对象也是对象,也能写到 synchronized() 里面
  • 写类对象和写其他对象没有任何本质区别
  • 换句话说,写成类对象,就是偷懒的做法,不想创建单独的锁对象了,就可以拿类对象来客串一下
Thread t1 = new Thread(() -> {  
    for (int i = 0; i < 5000; i++) {  
        synchronized(Demo8.class){  
            count++;  
        }    
    }
});

synchronized() 还可以修饰一个方法

class  Counter {  
    public  int count = 0;  
    synchronized public void add() {  
        count++;  
    }
    
    //等价于
    public void add() {
      synchronized (this) {
        count++;
      }
    }
}
  • 针对这个写法,锁对象就是 this,谁调用 add 谁就是锁对象
  • 在这里调用 add 的都是 counter,所以他们是同一个锁对象
synchronized public static void func() {
  //错
}
//对
public static void func() {
  synchronized (Counter.class)
}
  • static 方法没有 this
  • static 方法也叫类方法,和具体的实例无关,只是和类相关
  • 此时 static 方法和类对象相关,此时的写法就是给类对象加锁
  • 并非是写了 synchronized 就一定线程安全,还是得看代码咋写
  • 锁是需要的时候才使用,不需要的时候不要使用,用锁是会付出代价的(性能代价)
  • 使用锁,就可能触发阻塞,一旦某个线程阻塞,啥时候能恢复阻塞,继续执行,是不可预期的(可能需要非常多的时间)

synchronized 的几种使用方式:

  1. synchronized(){},() 里面指定锁对象
  2. synchronized 修饰一个普通的方法,相当于针对 this 加锁
  3. synchronized 修饰一个静态方法,相当于针对对应的类对象加锁

理解锁对象的作用,可以把任意的 Object/Object 子类的对象作为锁对象。锁对象是啥不重要,重要的是两个线程的锁对象是否是同一个。是同一个才会出现阻塞/锁竞争,不是同一个是不会出现的

死锁

使用锁的过程中,一种典型的、严重的 bug

一、一个线程针对一把锁,连续加锁两次

class  Counter {  
    public  int count = 0;  
    public void add() {  
        //随后调用add方法,又尝试对counter加锁  
        //但counter已经被加锁了,如果再次尝试对counter加锁,就会出现阻塞等待  
        synchronized (this){  
            count++;  
        }    
    }
}  
  
public class Demo9 {  
    public static void main(String[] args) throws InterruptedException {  
        Counter counter = new Counter();  
        Thread t1 = new Thread(() -> {  
            for (int i = 0; i < 5000; i++) {  
                //首先执行到这里,对counter加锁成功  
                synchronized (counter){  
                    counter.add();  
                }            
            }        
        });        
    Thread t2 = new Thread(() -> {  
            for (int i = 0; i < 5000; i++) {  
                synchronized (counter){  
                    counter.add();  
                }            
            }        
        });  
        t1.start();  
        t2.start();  
        t1.join();  
        t2.join();  
        System.out.println(counter.count);  
    }
}
  • 里面的 synchronized 想要拿到锁,就需要外面的 synchronized 释放锁
  • 外面的 synchronized 要释放锁,就需要执行到 }
  • 要想执行到 } ,就需要执行完这里的 add
  • 但是 add 阻塞着呢~

  • 但是上面的运行结果霉运造成死锁,是因为 Java 为了减少程序员写出死锁的概率,引入了特殊机制,解决上述的死锁问题——“可重入锁

可重入锁:

synchronized 是“可重入锁”,针对上述一个线程连续加锁两次的情况做了特殊处理。C++/Python 中的锁就没有这样的功能

  • 加锁的时候,需要判定当前这个锁是否是已经被占用的状态
  • 可重入锁就是在所中额外记录一下,当前是哪个线程对这个锁加锁了
  • 对于可重入锁来说,发现加锁的线程就是当前锁的持有线程,并不会真正进行任何加锁操作,也不会进行任何“阻塞操作”,而是直接放行,往下执行代码
  • 比如你向一个女生表白了,她同意了,那你就对她加锁了,她的持有人就是你
  • 再有人对她加锁的时候,她就会进行判定,看当前这个要加锁的人,是不是她的持有人
  • 若是隔壁老王找到她说“美女,我好喜欢你”,那她就会告诉他“你是个好人”
  • 若是你找到她说“我好喜欢你”,那她就会说“我也好喜欢你”
//真加锁
synchronized (this) {
  //直接放行,不会真加锁
  synchronized (this){
  }
}

二、两个线程两把锁

  • 若有两个线程 1 和 2,两把锁 A 和 B
  • 线程 1 先针对 A 加锁,线程 2 针对 B 加锁
  • 线程 1 不释放锁 A 的情况下,再针对 2 加锁;同时,线程 2 在不释放 B 的情况下针对 A 加锁

  • 比如你和你女朋友出去吃饺子,她拿的醋,你拿的酱油
  • 你说:你把醋给我,我用完了给你
  • 她说:凭什么,你把酱油给我,我用完了给你
  • 结果是你俩互不相让,僵持住了
  • 死锁往往是出现了“循环依赖
  • 这种死锁情况,可重入锁机制也无能为力
public class Demo1 {  
    private static Object locker1 = new Object();  
    private static Object locker2 = new Object();  
  
    public static void main(String[] args) {  
        Thread t1 = new Thread(() -> {  
            synchronized (locker1){  
                System.out.println("t1 加锁 locker1 完成");  
                try {  
                    Thread.sleep(1000);  
                } catch (InterruptedException e) {  
                    throw new RuntimeException(e);  
                }                
                synchronized (locker2){  
                    System.out.println("t1 加锁 locker2 完成");  
                }            
            }        
        });        
        Thread t2 = new Thread(() -> {  
            synchronized (locker2) {  
                System.out.println("t2 加锁 locker2 完成");  
                try {  
                    Thread.sleep(1000);  
                } catch (InterruptedException e) {  
                    throw new RuntimeException(e);  
                }  
                synchronized (locker1){  
                    System.out.println("t2 加锁 locker1 完成");  
                }            
            }       
        });        
        t1.start();  
        t2.start();  
    }
}
打印结果:
t1 加锁 locker1 完成
t2 加锁 locker2 完成
  • 代码中的 sleep 是为了确保 t1 和 t2 都先分别拿到了 locker1locker2,然后再分别拿对方的锁。如果没有 sleep,执行顺序就不可控,可能出现某个线程一口气拿到两把锁,另一个线程还没开始执行的情况,无法构造出死锁
  • 两个线程的第二次交叉加锁都没执行到,说明这两个线程都在第二次 synchronized 的时候阻塞住了,如果不人为干预,就会永远堵在这

三、有 N 个线程,M 个锁

经典模型:哲学家就餐问题:


死锁的四个必要条件

死锁的四个必要条件:(缺一不可)

  1. 锁是互斥的[锁的基本特性]
  • 基本特性,无法干预
  1. 锁是不可抢占的。线程 1 拿到了锁 A,如果线程 1 不主动释放 A,线程 2 就不能把 A 抢过来[锁的基本特性]
  • 基本特性,无法干预
  1. 请求和保持。线程 1 拿到锁 A 之后,在不释放 A 的前提下,去拿锁 B[代码结构]
  • 如何避免:
  • 先释放 A,再拿 B
  • 避免锁嵌套锁
  1. 循环等待/环路等待/循环依赖
  • 如何避免:
  • 一个简单有效的方法:给锁编号,1、2、3、4、…、N
    约定所有的线程在加锁的时候,都不许按照一定的顺序来加锁(比如,必须针对编号小的锁进行加锁,后针对编号大的锁进行加锁)
  • 约定加锁顺序
public class Demo1 {  
    private static Object locker1 = new Object();  
    private static Object locker2 = new Object();  
  
    public static void main(String[] args) {  
        Thread t1 = new Thread(() -> {  
            synchronized (locker1){  
                System.out.println("t1 加锁 locker1 完成");  
                try {  
                    Thread.sleep(1000);  
                } catch (InterruptedException e) {  
                    throw new RuntimeException(e);  
                }                
                synchronized (locker2){  
                    System.out.println("t1 加锁 locker2 完成");  
                }            
            }        
        });        
        Thread t2 = new Thread(() -> {  
            synchronized (locker1) {  
                System.out.println("t2 加锁 locker1 完成");  
                try {  
                    Thread.sleep(1000);  
                } catch (InterruptedException e) {  
                    throw new RuntimeException(e);  
                }  
                synchronized (locker2){  
                    System.out.println("t2 加锁 locker2 完成");  
                }            
            }        
        });       
        t1.start();  
        t2.start();  
    }
}
输出结果:
t1 加锁 locker1 完成
t1 加锁 locker2 完成
t2 加锁 locker1 完成
t2 加锁 locker2 完成
  • 将上锁的顺序都改为先上 locker1,再上 locker2 就能解决这里的死锁问题了


相关文章
|
1月前
|
存储 消息中间件 资源调度
C++ 多线程之初识多线程
这篇文章介绍了C++多线程的基本概念,包括进程和线程的定义、并发的实现方式,以及如何在C++中创建和管理线程,包括使用`std::thread`库、线程的join和detach方法,并通过示例代码展示了如何创建和使用多线程。
43 1
C++ 多线程之初识多线程
|
24天前
|
Java 开发者
在Java多线程编程中,创建线程的方法有两种:继承Thread类和实现Runnable接口
【10月更文挑战第20天】在Java多线程编程中,创建线程的方法有两种:继承Thread类和实现Runnable接口。本文揭示了这两种方式的微妙差异和潜在陷阱,帮助你更好地理解和选择适合项目需求的线程创建方式。
19 3
|
24天前
|
Java 开发者
在Java多线程编程中,选择合适的线程创建方法至关重要
【10月更文挑战第20天】在Java多线程编程中,选择合适的线程创建方法至关重要。本文通过案例分析,探讨了继承Thread类和实现Runnable接口两种方法的优缺点及适用场景,帮助开发者做出明智的选择。
16 2
|
24天前
|
Java
Java中多线程编程的基本概念和创建线程的两种主要方式:继承Thread类和实现Runnable接口
【10月更文挑战第20天】《JAVA多线程深度解析:线程的创建之路》介绍了Java中多线程编程的基本概念和创建线程的两种主要方式:继承Thread类和实现Runnable接口。文章详细讲解了每种方式的实现方法、优缺点及适用场景,帮助读者更好地理解和掌握多线程编程技术,为复杂任务的高效处理奠定基础。
28 2
|
24天前
|
Java 开发者
Java多线程初学者指南:介绍通过继承Thread类与实现Runnable接口两种方式创建线程的方法及其优缺点
【10月更文挑战第20天】Java多线程初学者指南:介绍通过继承Thread类与实现Runnable接口两种方式创建线程的方法及其优缺点,重点解析为何实现Runnable接口更具灵活性、资源共享及易于管理的优势。
28 1
|
24天前
|
安全 Java 开发者
Java多线程中的`wait()`、`notify()`和`notifyAll()`方法,探讨了它们在实现线程间通信和同步中的关键作用
本文深入解析了Java多线程中的`wait()`、`notify()`和`notifyAll()`方法,探讨了它们在实现线程间通信和同步中的关键作用。通过示例代码展示了如何正确使用这些方法,并分享了最佳实践,帮助开发者避免常见陷阱,提高多线程程序的稳定性和效率。
34 1
|
24天前
|
Java
在Java多线程编程中,`wait()` 和 `notify()/notifyAll()` 方法是线程间通信的核心机制。
在Java多线程编程中,`wait()` 和 `notify()/notifyAll()` 方法是线程间通信的核心机制。它们通过基于锁的方式,使线程在条件不满足时进入休眠状态,并在条件成立时被唤醒,从而有效解决数据一致性和同步问题。本文通过对比其他通信机制,展示了 `wait()` 和 `notify()` 的优势,并通过生产者-消费者模型的示例代码,详细说明了其使用方法和重要性。
24 1
|
1月前
|
Java 数据库连接 数据库
不同业务使用同一个线程池发生死锁的技术探讨
【10月更文挑战第6天】在并发编程中,线程池是一种常用的优化手段,用于管理和复用线程资源,减少线程的创建和销毁开销。然而,当多个不同业务场景共用同一个线程池时,可能会引发一系列并发问题,其中死锁就是最为严重的一种。本文将深入探讨不同业务使用同一个线程池发生死锁的原因、影响及解决方案,旨在帮助开发者避免此类陷阱,提升系统的稳定性和可靠性。
48 5
|
1月前
|
存储 前端开发 C++
C++ 多线程之带返回值的线程处理函数
这篇文章介绍了在C++中使用`async`函数、`packaged_task`和`promise`三种方法来创建带返回值的线程处理函数。
45 6
|
1月前
|
存储 运维 NoSQL
Redis为什么最开始被设计成单线程而不是多线程
总之,Redis采用单线程设计是基于对系统特性的深刻洞察和权衡的结果。这种设计不仅保持了Redis的高性能,还确保了其代码的简洁性、可维护性以及部署的便捷性,使之成为众多应用场景下的首选数据存储解决方案。
41 1