【多线程】线程安全问题原因与解决方案

简介: 线程不安全的原因及解决方案,synchronized,volatile

 目录

线程安全的概念

线程不安全示例

线程不安全的原因

   多个线程修改了同一个变量

   线程是抢占式执行的

   原子性

   内存可见性

   有序性

线程不安全解决办法

synchronized 关键字-监视器锁monitor lock

   synchronized 的特性

       互斥

       刷新内存

       可重入

   synchronized 使用示例

   Java 标准库中的线程安全类

volatile 关键字

   volatile 能保证内存可见性

   volatile 不保证原子性

   synchronized 也能保证内存可见性


线程安全的概念

如果多线程环境下代码运行的结果是符合我们预期的,即在单线程环境应该的结果,则说这个程序是线程安全的。

线程不安全示例

public class Insecurity {
    // 定义自增操作的对象
    private static Counter counter = new Counter();
    public static void main(String[] args) throws InterruptedException {
        // 定义两个线程,分别自增5万次
        Thread t1 = new Thread(() -> {
            for (int i = 0; i < 50000; i++) {
                counter.increment();
            }
        });
        Thread t2 = new Thread(() -> {
            for (int i = 0; i < 50000; i++) {
                counter.increment();
            }
        });
        // 启动线程
        t1.start();
        t2.start();
        // 等待自增完成
        t1.join();
        t2.join();
        // 打印结果
        System.out.println("count = " + counter.count);
    }
}
class Counter {
    public int count = 0;
    // 自增方法
    public void increment () {
        count++;
    }
}

image.gif

image.gif编辑

线程不安全的原因

   多个线程修改了同一个变量

上面的线程不安全的代码中, 涉及到多个线程针对 counter.count 变量进行修改。

counter.count 这个变量就是在堆上. 因此可以被多个线程共享访问.

   线程是抢占式执行的

多个线程在CPU上调度是随机的,顺序是不可预知的。

   原子性

要么都执行,要么都不执行。

    1. 从内存把数据读到 CPU
    2. 进行数据更新
    3. 把数据写回到 CPU

    image.gif编辑

       内存可见性

    可见性指, 一个线程对共享变量值的修改,能够及时地被其他线程看到.

    Java 内存模型 (JMM): Java虚拟机规范中定义了Java内存模型.

    目的是屏蔽掉各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的并发效果.

    image.gif编辑

      • 线程之间的共享变量存在 主内存 (Main Memory).
      • 每一个线程都有自己的 "工作内存" (Working Memory) .
      • 当线程要读取一个共享变量的时候, 会先把变量从主内存拷贝到工作内存, 再从工作内存读取数据.
      • 当线程要修改一个共享变量的时候, 也会先修改工作内存中的副本, 再同步回主内存.

      由于每个线程有自己的工作内存, 这些工作内存中的内容相当于同一个共享变量的 "副本". 此时修改线程1 的工作内存中的值, 线程2 的工作内存不一定会及时变化

         有序性

      有序性是指编译过程中,JVM调用本地接口,CPU执行指令过程中,指令的有序性。

      指令在特殊情况下会打乱顺序,并不是按程序员的预期去执行的。

      编译器对于指令重排序的前提是 "保持逻辑不发生变化". 这一点在单线程环境下比较容易判断, 但是在多线程环境下就没那么容易了, 多线程的代码执行复杂程度更高, 编译器很难在编译阶段对代码的执行效果进行预测, 因此激进的重排序很容易导致优化后的逻辑和之前不等价.

      线程不安全解决办法

      对于多线程修改同一个变量,在真实业务中都是修改同一个变量,无法避免。

      对于线程是抢占式执行的,CPU调度是随机的,这里CPU是硬件层面,没办法处理。

      剩下就是解决其他三个原因:

      public class Main {
          // 定义自增操作的对象
          private static Counter counter = new Counter();
          public static void main(String[] args) throws InterruptedException {
              // 定义两个线程,分别自增5万次
              Thread t1 = new Thread(() -> {
                  for (int i = 0; i < 50000; i++) {
                      counter.increment();
                  }
              });
              Thread t2 = new Thread(() -> {
                  for (int i = 0; i < 50000; i++) {
                      counter.increment();
                  }
              });
              // 启动线程
              t1.start();
              t2.start();
              // 等待自增完成
              t1.join();
              t2.join();
              // 打印结果
              System.out.println("count = " + counter.count);
          }
      }
      class Counter {
          public volatile int count = 0;
          // 自增方法
          public synchronized void increment () {
              count++;
          }
      }

      image.gif

      image.gif编辑

      synchronized 关键字-监视器锁monitor lock

         synchronized 的特性

             互斥

      synchronized 会起到互斥效果, 某个线程执行到某个对象的 synchronized 中时, 其他线程如果也执行到同一个对象 synchronized 就会阻塞等待

        • 进入 synchronized 修饰的代码块, 相当于 加锁
        • 退出 synchronized 修饰的代码块, 相当于 解锁

        synchronized用的锁是存在Java对象头里的。

        可以粗略理解成, 每个对象在内存中存储的时候, 都存有一块内存表示当前的 "锁定" 状态(类似于厕所的 "有人/无人").

        如果当前是 "无人" 状态, 那么就可以使用, 使用时需要设为 "有人" 状态.

        如果当前是 "有人" 状态, 那么其他人无法使用, 只能排队

        理解 "阻塞等待".

        针对每一把锁, 操作系统内部都维护了一个等待队列. 当这个锁被某个线程占有的时候, 其他线程尝试进行加锁, 就加不上了, 就会阻塞等待, 一直等到之前的线程解锁之后, 由操作系统唤醒一个新的线程, 再来获取到这个锁.

        注意:

          • 上一个线程解锁之后, 下一个线程并不是立即就能获取到锁. 而是要靠操作系统来 "唤醒". 这也就是操作系统线程调度的一部分工作.
          • 假设有 A B C 三个线程, 线程 A 先获取到锁, 然后 B 尝试获取锁, 然后 C 再尝试获取锁, 此时 B和 C 都在阻塞队列中排队等待. 但是当 A 释放锁之后, 虽然 B C 先来的, 但是 B 不一定就能获取到锁, 而是和 C 重新竞争, 并不遵守先来后到的规则.

          synchronized的底层是使用操作系统的mutex lock实现的.

                 刷新内存

          synchronized 的工作过程:

            1. 获得互斥锁
            2. 从主内存拷贝变量的最新副本到工作的内存
            3. 执行代码
            4. 将更改后的共享变量的值刷新到主内存
            5. 释放互斥锁

            所以 synchronized 也能保证内存可见性. 具体代码参见后面 volatile 部分.

                   可重入

            synchronized 同步块对同一条线程来说是可重入的,不会出现自己把自己锁死的问题;

            理解 "把自己锁死"

            一个线程没有释放锁, 然后又尝试再次加锁.

            代码示例

            在下面的代码中,

              • increase increase2 两个方法都加了 synchronized, 此处的 synchronized 都是针对 this 当前对象加锁的.
              • 在调用 increase2 的时候, 先加了一次锁, 执行到 increase 的时候, 又加了一次锁. (上个锁还没释放, 相当于连续加两次锁)

              这个代码是完全没问题的. 因为 synchronized 是可重入锁.

              static class Counter {
                  public int count = 0;
                  synchronized void increase() {
                      count++;
                 }
                  synchronized void increase2() {
                      increase();
                 }
              }

              image.gif

              在可重入锁的内部, 包含了 "线程持有者" "计数器" 两个信息.

                • 如果某个线程加锁的时候, 发现锁已经被人占用, 但是恰好占用的正是自己, 那么仍然可以继续获取到锁, 并让计数器自增.
                • 解锁的时候计数器递减为 0 的时候, 才真正释放锁. (才能被别的线程获取到)

                   synchronized 使用示例

                synchronized 本质上要修改指定对象的 "对象头". 从使用角度来看, synchronized 也势必要搭配一个具体的对象来使用.

                1) 直接修饰普通方法: 锁的 SynchronizedDemo 对象

                public class SynchronizedDemo {
                    public synchronized void methond() {
                   }
                }

                image.gif

                2) 修饰静态方法: 锁的 SynchronizedDemo 类的对象

                public class SynchronizedDemo {
                    public synchronized static void method() {
                   }
                }

                image.gif

                3) 修饰代码块: 明确指定锁哪个对象

                锁当前对象

                public class SynchronizedDemo {
                    public void method() {
                        synchronized (this) {
                       }
                   }
                }

                image.gif

                锁类对象

                public class SynchronizedDemo {
                    public void method() {
                        synchronized (SynchronizedDemo.class) {
                       }
                   }
                }

                image.gif

                   Java 标准库中的线程安全类

                Java 标准库中很多都是线程不安全的. 这些类可能会涉及到多线程修改共享数据, 又没有任何措施.

                  • ArrayList
                  • LinkedList
                  • HashMap
                  • TreeMap
                  • HashSet
                  • TreeSet
                  • StringBuilder

                  但是还有一些是线程安全的. 使用了一些锁机制来控制.

                    • Vector (不推荐使用)
                    • HashTable (不推荐使用)
                    • ConcurrentHashMap
                    • StringBuffer

                    StringBuffer 的核心方法都带有 synchronized

                    还有的虽然没有加锁, 但是不涉及 "修改", 仍然是线程安全的

                      • String

                      volatile 关键字

                         volatile 能保证内存可见性

                      volatile 修饰的变量, 能够保证 "内存可见性".

                      代码在写入 volatile 修饰的变量的时候,

                        • 改变线程工作内存中volatile变量副本的值
                        • 将改变后的副本的值从工作内存刷新到主内存

                        代码在读取 volatile 修饰的变量的时候,

                          • 从主内存中读取volatile变量的最新值到线程的工作内存中
                          • 从工作内存中读取volatile变量的副本

                          前面我们讨论内存可见性时说了, 直接访问工作内存(实际是 CPU 的寄存器或者 CPU 的缓存), 速度非常快, 但是可能出现数据不一致的情况.

                          加上 volatile , 强制读写内存. 速度是慢了, 但是数据变的更准确了.

                          代码示例

                          在这个代码中

                            • 创建两个线程 t1 t2
                            • t1 中包含一个循环, 这个循环以 flag == 0 为循环条件.
                            • t2 中从键盘读入一个整数, 并把这个整数赋值给 flag.
                            • 预期当用户输入非 0 的值的时候, t1 线程结束.
                            static class Counter {
                                public int flag = 0;
                            }
                            public static void main(String[] args) {
                                Counter counter = new Counter();
                                Thread t1 = new Thread(() -> {
                                    while (counter.flag == 0) {
                                        // do nothing
                                   }
                                    System.out.println("循环结束!");
                               });
                                Thread t2 = new Thread(() -> {
                                    Scanner scanner = new Scanner(System.in);
                                    System.out.println("输入一个整数:");
                                    counter.flag = scanner.nextInt();
                               });
                                t1.start();
                                t2.start();
                            }
                            // 执行效果
                            // 当用户输入非0值时, t1 线程循环不会结束. (这显然是一个 bug)

                            image.gif

                            t1 读的是自己工作内存中的内容.

                            t2 flag 变量进行修改, 此时 t1 感知不到 flag 的变化.

                            如果给 flag 加上 volatile

                            static class Counter {
                                public volatile int flag = 0;
                            }
                            // 执行效果
                            // 当用户输入非0值时, t1 线程循环能够立即结束.

                            image.gif

                               volatile 不保证原子性

                            volatile synchronized 有着本质的区别. synchronized 能够保证原子性, volatile 保证的是内存可见性.

                            代码示例

                            这个是最初的演示线程安全的代码.

                              • increase 方法去掉 synchronized
                              • count 加上 volatile 关键字.
                              static class Counter {
                                  volatile public int count = 0;
                                  void increase() {
                                      count++;
                                 }
                              }
                              public static void main(String[] args) throws InterruptedException {
                                  final Counter counter = new Counter();
                                  Thread t1 = new Thread(() -> {
                                      for (int i = 0; i < 50000; i++) {
                                          counter.increase();
                                     }
                                 });
                                  Thread t2 = new Thread(() -> {
                                      for (int i = 0; i < 50000; i++) {
                                          counter.increase();
                                     }
                                 });
                                  t1.start();
                                  t2.start();
                                  t1.join();
                                  t2.join();
                                  System.out.println(counter.count);
                              }

                              image.gif

                              此时可以看到, 最终 count 的值仍然无法保证是 100000.

                                 synchronized 也能保证内存可见性

                              synchronized 既能保证原子性, 也能保证内存可见性.

                              对上面的代码进行调整:

                                • 去掉 flag volatile
                                • t1 的循环内部加上 synchronized, 并借助 counter 对象加锁.
                                static class Counter {
                                    public int flag = 0;
                                }
                                public static void main(String[] args) {
                                    Counter counter = new Counter();
                                    Thread t1 = new Thread(() -> {
                                        while (true) {
                                            synchronized (counter) {
                                                if (counter.flag != 0) {
                                                    break;
                                               }
                                           }
                                            // do nothing
                                       }
                                        System.out.println("循环结束!");
                                   });
                                    Thread t2 = new Thread(() -> {
                                        Scanner scanner = new Scanner(System.in);
                                        System.out.println("输入一个整数:");
                                        counter.flag = scanner.nextInt();
                                   });
                                    t1.start();
                                    t2.start();
                                }

                                image.gif


                                相关文章
                                |
                                1月前
                                |
                                存储 消息中间件 资源调度
                                C++ 多线程之初识多线程
                                这篇文章介绍了C++多线程的基本概念,包括进程和线程的定义、并发的实现方式,以及如何在C++中创建和管理线程,包括使用`std::thread`库、线程的join和detach方法,并通过示例代码展示了如何创建和使用多线程。
                                48 1
                                C++ 多线程之初识多线程
                                |
                                30天前
                                |
                                Java 开发者
                                在Java多线程编程中,创建线程的方法有两种:继承Thread类和实现Runnable接口
                                【10月更文挑战第20天】在Java多线程编程中,创建线程的方法有两种:继承Thread类和实现Runnable接口。本文揭示了这两种方式的微妙差异和潜在陷阱,帮助你更好地理解和选择适合项目需求的线程创建方式。
                                20 3
                                |
                                30天前
                                |
                                Java 开发者
                                在Java多线程编程中,选择合适的线程创建方法至关重要
                                【10月更文挑战第20天】在Java多线程编程中,选择合适的线程创建方法至关重要。本文通过案例分析,探讨了继承Thread类和实现Runnable接口两种方法的优缺点及适用场景,帮助开发者做出明智的选择。
                                19 2
                                |
                                30天前
                                |
                                Java
                                Java中多线程编程的基本概念和创建线程的两种主要方式:继承Thread类和实现Runnable接口
                                【10月更文挑战第20天】《JAVA多线程深度解析:线程的创建之路》介绍了Java中多线程编程的基本概念和创建线程的两种主要方式:继承Thread类和实现Runnable接口。文章详细讲解了每种方式的实现方法、优缺点及适用场景,帮助读者更好地理解和掌握多线程编程技术,为复杂任务的高效处理奠定基础。
                                30 2
                                |
                                30天前
                                |
                                Java 开发者
                                Java多线程初学者指南:介绍通过继承Thread类与实现Runnable接口两种方式创建线程的方法及其优缺点
                                【10月更文挑战第20天】Java多线程初学者指南:介绍通过继承Thread类与实现Runnable接口两种方式创建线程的方法及其优缺点,重点解析为何实现Runnable接口更具灵活性、资源共享及易于管理的优势。
                                34 1
                                |
                                30天前
                                |
                                安全 Java 开发者
                                Java多线程中的`wait()`、`notify()`和`notifyAll()`方法,探讨了它们在实现线程间通信和同步中的关键作用
                                本文深入解析了Java多线程中的`wait()`、`notify()`和`notifyAll()`方法,探讨了它们在实现线程间通信和同步中的关键作用。通过示例代码展示了如何正确使用这些方法,并分享了最佳实践,帮助开发者避免常见陷阱,提高多线程程序的稳定性和效率。
                                38 1
                                |
                                30天前
                                |
                                Java
                                在Java多线程编程中,`wait()` 和 `notify()/notifyAll()` 方法是线程间通信的核心机制。
                                在Java多线程编程中,`wait()` 和 `notify()/notifyAll()` 方法是线程间通信的核心机制。它们通过基于锁的方式,使线程在条件不满足时进入休眠状态,并在条件成立时被唤醒,从而有效解决数据一致性和同步问题。本文通过对比其他通信机制,展示了 `wait()` 和 `notify()` 的优势,并通过生产者-消费者模型的示例代码,详细说明了其使用方法和重要性。
                                25 1
                                |
                                1月前
                                |
                                存储 前端开发 C++
                                C++ 多线程之带返回值的线程处理函数
                                这篇文章介绍了在C++中使用`async`函数、`packaged_task`和`promise`三种方法来创建带返回值的线程处理函数。
                                48 6
                                |
                                1月前
                                |
                                存储 运维 NoSQL
                                Redis为什么最开始被设计成单线程而不是多线程
                                总之,Redis采用单线程设计是基于对系统特性的深刻洞察和权衡的结果。这种设计不仅保持了Redis的高性能,还确保了其代码的简洁性、可维护性以及部署的便捷性,使之成为众多应用场景下的首选数据存储解决方案。
                                41 1
                                |
                                1月前
                                |
                                C++
                                C++ 多线程之线程管理函数
                                这篇文章介绍了C++中多线程编程的几个关键函数,包括获取线程ID的`get_id()`,延时函数`sleep_for()`,线程让步函数`yield()`,以及阻塞线程直到指定时间的`sleep_until()`。
                                25 0
                                C++ 多线程之线程管理函数