多线程学习时常出现的问题（一）高并发下的ArrayList和并发下诡异的HasMap

2022-04-01 428

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 多线程学习时常出现的问题（一）高并发下的ArrayList和并发下诡异的HasMap

高并发下的ArrayList

我们都知道，ArrayList是一个线程不安全的容器。如果在多线程中使用ArrayList，可能会导致程序出错。究竟可能引起哪些问题呢?试看下面的代码:

public class ArrayListMultiThread{
static ArrayList<Integer> al = new ArrayList<Integer> (10);public static class AddThread implements Runnable {
eOverride
public void run(){
for (int i=0;i<1000000; i++){
al .add(i);
public static void main(String[] args) throws InterruptedException {
Thread tl=new Thread(new AddThread());
Thread t2=new Thread(new AddThread());t1.start();
t2.start();
t1.join();t2.join();
System.out.println(al.size();

上述代码中，t1和t2两个线程同时向一个ArrayList中添加容器。它们各添加100万个元素，因此我们期望最后可以有200万个元素在 ArrayList中。但如果执行这段代码，则可能得到三种结果。
第一，程序正常结束，ArrayList 的最终大小确实200万。这说明即使并行程序有问题，也未必会每次都表现出来。
第二，程序抛出异常。

Exception in thread "Thread-0" java.lang.ArrayIndexOutOfBoundsException:22
at java.util.Arraylist.add(ArrayList.java: 441)
at geym.conc.ch2.notsafe.ArrayListMultiThread$AddThread.run(ArrayListMultiThread.java:12)
at java. lang. Thread.run (Thread.java:724)1000015

这是因为ArrayList在扩容过程中，内部一致性被破坏，但由于没有锁的保护，另外一个线程访问到了不一致的内部状态，导致出现越界问题。
第三，出现了一个非常隐蔽的错误，比如打印如下值作为ArrayList 的大小。

1246772

这是由于多线程访问冲突，使得保存容器大小的变量被多线程不正常的访问，同时两个线程也对ArrayList 中的同一个位置进行赋值导致的。如果出现这种问题，那么很不幸，你就得到了一个没有错误提示的错误。并且，它们未必是可以复现的。
注意:改进的方法很简单，使用线程安全的Vector代替ArrayList即可。

并发下诡异的HasMap

HashMap同样不是线程安全的。当你使用多线程访问HashMap时，也可能会遇到意想不到的错误。不过和ArrayList不同，HashMap的问题似乎更加诡异。

public class HashMapMultiThread {
static Map<string,String> map = new HashMap<String, String>();
public static class AddThread implements Runnable {
int start=0;
public AddThread(int start){
this.start=start;
)
coverride
public void run(){
for (int i = start; i<100000; i+=2){
map.put(Integer.toString(i), Integer.toBinarystring(i));
public static void main(String[] args) throws InterruptedException{
Thread tl=new Thread (new HashMapMultiThread.AddThread(0));
Thread t2=new Thread (new HashMapMultiThread.AddThread(1));
t1.start();t2.start();
t1.join();t2.join();
System.out.printin (map.size());
}}

上述代码使用t1和 t2两个线程同时对HashMap进行 put()方法操作。如果一切正常，则得到的map.size()方法就是 100 000。但实际上，你可能会得到以下三种情况（注意，这里使用JDK 7进行试验）。
第一，程序正常结束，并且结果也是符合预期的，HashMap 的大小为100 000。
第二，程序正常结束，但结果不符合预期，而是一个小于100 000的数字，比如98868。第三，程序永远无法结束。

前两种可能和ArrayList 的情况非常类似，因此不必过多解释。

而对于第三种情况，如果是第一次看到，我想大家一定会觉得特别惊讶，因为看似非常正常的程序，怎么可能就结束不了呢?

注意:请读者谨慎尝试以上代码，由于这段代码很可能占用两个CPU核，并使它们的CPU占有率达到100%。如果CPU性能较弱，则可能导致死机，因此请先保存资料，再进行尝试。

打开任务管理器，你会发现，这段代码占用了极高的 CPU，最有可能的表示是占用了两个CPU核，并使得这两个核的CPU使用率达到100%。这非常类似死循环的情况。
使用jstack 工具显示程序的线程信息，如下所示。其中 jps可以显示当前系统中所有的Java进程，而jstack可以打印给定Java进程的内部线程及其堆栈。

C:AUserslgeym >jps
14240 HashMapMultiThread1192 Jps
C:Userslgeym >jstack 14240

我们会很容易找到t1、t2和 main线程。

"Thread-1" prio=6 tid=0x00bb2800 nid=0x16e0 runnable [0x04baf000]java.lang.Thread.state: RUNNABLE
at java.util.HashMap.put(HashMap.java: 498)
at geym.conc.ch2.notsafe.HashMapMultiThread$AddThread.run
(HashMapMultiThread.java:26)
at java.lang. Thread.run(Thread.java:724)
"Thread-0" prio=6 tid=0x00bb0000 nid=0x1668 runnable [0x04d7000]java.lang. Thread.State: RUNNABLE
at java.util.HashMap.put (HashMap.java: 498)
at geym.conc.ch2.notsafe.HashMapMultiThread$AddThread.run(HashMapMultiThread.java:26)
at java.lang. Thread.run (Thread.java:724)
"main" prio=6 tid=0x00cOcc00 nid=0x16ec in 0bject.wait()[0x0102000]java.lang. Thread.state: WAITING (on object monitor)
at java.lang.0bject.wait (Native Method)
- waiting on <0x24930280>(a java.lang. Thread)at java.lang. Thread.join (Thread.java:1260)- locked <0x24930280> (a java.lang. Thread)at java.lang. Thread.join(Thread.java: 1334)
at geym. conc.ch2.notsafe.HashMapMultiThread.main(HashMapMultiThread.java:36)

可以看到，主线程main正处于等待状态，并且这个等待是由于 join()方法引起的，符合我们的预期。而t1和t2两个线程都处于Runnable状态,并且当前执行语句为HashMap.put()方法。查看put(方法的第498行代码，如下所示:

for (Entry<K, V>e= table[i]; e != null;e= e.next){
0bject k;
if (e.hash == hash &&((k = e.key)-= key Il key.equals (k))){
v oldvalue = e.value;
e.value = value;
e.recordAccess(this);return oldvalue;

可以看到，当前这两个线程正在遍历HashMap 的内部数据。当前所处循环乍看之下是一个迭代遍历，就如同遍历一个链表一样。但在此时此刻，由于多线程的冲突，这个链表的结构已经遭到了破坏，链表成环了!当链表成环时，上述的迭代就等同于一个死循环，图2.9展示了最简单的一种环状结构，key1和 key2互为对方的next元素。此时，通过next引用遍历，将形成死循环。
死循环的问题一旦出现，着实可以让你郁闷一下，但这个死循环的问题在JDK 8中已经不存在了。由于JDK8对HashMap的内部实现做了大规模的调整,因此规避了这个问题。即使这样，贸然在多线程环境下使用HashMap依然会导致内部数据不一致。最简单的解决方案就是使用ConcurrentHashMap 代替HashMap。

摘自JAVA高并发程序设计，推荐推荐

多线程学习时常出现的问题（一）高并发下的ArrayList和并发下诡异的HasMap

高并发下的ArrayList

并发下诡异的HasMap

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

多线程学习时常出现的问题（一）高并发下的ArrayList和并发下诡异的HasMap

高并发下的ArrayList

并发下诡异的HasMap

热门文章

最新文章

相关电子书