为什么线程协作的 wait() 方法需要写在循环里,你有想过吗?

简介: 那么问题是为啥这里是 while 而不是 if 呢?这个问题我最开始也想了很久,按理来说已经在 synchronized 块里面了嘛,就不需要了。这个也是我前面一直是这么认为的,直到最近看了一个 Stackoverflow 上的问题才对这个问题有了比较深入的理解。试想我们要试想一个有界的队列。那么常见的代码可以是这样:

问:为什么是 while 而不是 if ?

大多数人都知道常见的使用 synchronized 代码:

那么问题是为啥这里是 while 而不是 if 呢?这个问题我最开始也想了很久,按理来说已经在 synchronized 块里面了嘛,就不需要了。这个也是我前面一直是这么认为的,直到最近看了一个 Stackoverflow 上的问题才对这个问题有了比较深入的理解。

试想我们要试想一个有界的队列。那么常见的代码可以是这样:

注意到这里用的 if,那么我们来看看它会报什么错呢?

下面的代码用了 1 个线程来 put,10 个线程来 get:

这段代码很快或者说一开始就会报错:

java.lang.IndexOutOfBoundsException: Index: 0, Size: 0
at java.util.ArrayList.rangeCheck(ArrayList.java:653) 
at java.util.ArrayList.remove(ArrayList.java:492) 
at TestWhileWaitBuf.get(TestWhileWait.java:80)atTestWhileWait2.run(TestWhileWait.java:47) 
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142) 
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 
at java.lang.Thread.run(Thread.java:745)

很明显,在 remove 的时候报错了。那么我们来分析下:

假设现在有 A,B 两个线程来执行 get 操作,我们假设如下的步骤发生了:

1. A 拿到了锁 line 0。

2. A 发现 size==0, (line 1),然后进入等待,并释放锁 (line 2)。

3. 此时 B 拿到了锁,line0,发现 size==0,(line 1),然后进入等待,并释放锁 (line 2)。

4. 这个时候有个线程 C 往里面加了个数据 1,那么 notifyAll 所有的等待的线程都被唤醒了。

5. AB 重新获取锁,假设又是 A 拿到了。然后他就走到 line 3,移除了一个数据,(line4) 没有问题。

6. A 移除数据后想通知别人,此时 list 的大小有了变化,于是调用了 notifyAll (line5),这个时候就把 B 被唤醒了,那么 B 接着往下走。

7. 这时候 B 就出问题了,因为其实此时的竞态条件已经不满足了 (size==0)。B 以为还可以删除就尝试去删除,结果就跑了异常了。

那么 fix 很简单,在 get 的时候加上 while 就好了:

同样的,我们可以尝试修改 put 的线程数和 get 的线程数来发现如果 put 里面不是 while 的话也是不行的。

我们可以用一个外部周期性任务来打印当前 list 的大小,你会发现大小并不是固定的最大5:

这里我想应该说清楚了为啥必须是 while 还是 if 了。

问:什么时候用 notifyAll 或者 notify?

大多数人都会这么告诉你,当你想要通知所有人的时候就用 notifyAll,当你只想通知一个人的时候就用 notify。但是我们都知道 notify 实际上我们是没法决定到底通知谁的(都是从等待集合里面选一个)。那这个还有什么存在的意义呢?

在上面的例子中,我们用到了 notifyAll,那么下面我们来看下用 notify 是否可以工作呢?

下面的几点是 jvm 告诉我们的:

  1. 任何时候,被唤醒的来执行的线程是不可预知。比如有 5 个线程都在一个对象上,实际上我不知道 下一个哪个线程会被执行。
  2. synchronized 语义实现了有且只有一个线程可以执行同步块里面的代码。

那么我们假设下面的场景就会导致死锁:

P – 生产者 调用 put。

C – 消费者 调用 get。

1. P1 放了一个数字1。

2. P2 想来放,发现满了,在wait里面等了。

3. P3 想来放,发现满了,在 wait 里面等了。

4. C1 想来拿,C2,C3 就在 get 里面等着。

5. C1 开始执行,获取1,然后调用 notify 然后退出。

  • 如果 C1 把 C2 唤醒了,所以P2 (其他的都得等)只能在put方法上等着。(等待获取synchoronized (this) 这个monitor)。
  • C2 检查 while 循环发现此时队列是空的,所以就在 wait 里面等着。
  • C3 也比 P2 先执行,那么发现也是空的,只能等着了。

6. 这时候我们发现 P2、C2、C3 都在等着锁,最终 P2 拿到了锁,放一个 1,notify,然后退出。

7. P2 这个时候唤醒了P3,P3发现队列是满的,没办法,只能等它变为空。

8. 这时候没有别的调用了,那么现在这三个线程(P3, C2,C3)就全部变成 suspend 了,也就是死锁了。

本文就是愿天堂没有BUG给大家分享的内容,大家有收获的话可以分享下,想学习更多的话可以到微信公众号里找我,我等你哦。

相关文章
|
19天前
|
监控 测试技术 程序员
解决线程死循环问题的有效方法
作为开发者想必都清楚,多线程应用程序的开发为我们日常开发工作中提供了并发执行任务的能力,但线程死循环问题却是一个常见而令人头疼的挑战,因为线程死循环可能导致系统的不稳定性、资源浪费以及应用程序的异常运行,所以准确地定位和妥善处理线程死循环现象,并在编码阶段就避免潜在风险,成为开发人员必须面对的重要问题,线程死循环问题的解决不仅有助于提高系统的稳定性和可用性,还能优化资源利用和提升应用程序的性能,通过采取适当的预防和处理措施,开发人员能够避免线程陷入无尽的循环,并及时发现和解决潜在问题。那么本文就来分享一下关于如何处理线程死循环问题,以及如何在编码阶段规避潜在风险。
29 2
解决线程死循环问题的有效方法
|
2月前
|
Java 调度 C#
C#学习系列相关之多线程(一)----常用多线程方法总结
C#学习系列相关之多线程(一)----常用多线程方法总结
|
2月前
|
Java 测试技术
血的教训--如何正确使用线程池submit和execute方法
血的教训--如何正确使用线程池submit和execute方法
27 1
|
3月前
|
人工智能 Java API
Python 潮流周刊#28:两种线程池、四种优化程序的方法
Python 潮流周刊#28:两种线程池、四种优化程序的方法
24 1
|
3月前
|
Java 开发者
多线程编程范式(一) 协作范式
多线程编程范式(一) 协作范式
|
9天前
|
NoSQL
线程死循环的定位方法
线程死循环的定位方法
17 2
|
11天前
使用代理IP池实现多线程的方法
使用代理IP池实现多线程的方法
|
22天前
|
Java API 调度
【并发编程】Java线程常见方法的使用
【并发编程】Java线程常见方法的使用
|
2月前
|
Java 测试技术 Python
Python开启线程和线程池的方法
Python开启线程和线程池的方法
18 0
Python开启线程和线程池的方法
|
2月前
|
数据处理 调度 开发者
QML多线程魔法:探索不同方法,提升性能
QML多线程魔法:探索不同方法,提升性能
182 0