ThreadLocal Java多线程下的影分身之术

简介: 后来,我把c删掉,变成了下面这样。如果我现在想查h,按照上面getEntry的逻辑,是不是遍历到3就停了,所以找不到h了? getEntry的逻辑表面确实是这样,但实际上getEntryAfterMiss、remove、gets时都会直接或者间接调用expungeStaleEntry会对表里的数据做整理。expungeStaleEntry()除了利用弱引用的特性对tab中Entry做清理外,还会对之前Hash冲突导致后移的Entry重新安放位置。所以不可能出现下面这种tab排放的。

如果写过多线程的代码,你肯定考虑过线程安全问题,更进一步你可能还考虑在在线程安全的前提下性能的问题。大多数情况下大家用来解决线程安全问题都会使用同步,比如用synchron或者concurrent包提供的各种锁,当然这些都能解决问题。但有多线程做同步一定会涉及到资源争抢和等待的问题。java中各种同步方法都是提供一种准入机制,JVM会调用系统同步原语来保证临界区任意时刻只能有一个线程进入,那必然其他线程都得等待了,性能的瓶颈就在这同步上了。

 解决问题最好的方式是啥?当然是避免问题的发生了。ThreadLocal就是用这样一种方式提升性能的。ThreadLocal遍历会为每个线程单独维护一份值,某个线程对其做任何操作都不会影响其他的线程,这相当于这个对象在每个线程下面都有了一个分身。ThreadLocal是以Thread为维度实现的,所以多线程之间也不会有争抢和等待,从而避免同步变成瓶颈,下文我们会从源码的维度去看这些都是如何实现的。

 ThreadLocal也不是万金油,它也只能在多线程之间数据相互独立的情况下使用,如果是多线程间的数据同步,还得使用某个同步的方式。 我的理解,ThreadLocal是在临时变量完全不共享和全部变量完全共享之间取了个折中,在多线程数据一致的情况下完美的避免了资源争抢和等待,提高了性能。


如何使用

ThreadLocal的使用也很简单,直接new ThreadLocal<T>(); 就可以了,然后可以通过set()和get()分别设值和获取值。以下代码展示我如果使用ThreadLocal<Integer>如何为每个线程单独维护一个值的,而且线程之间也不会相互干扰。


public class Demo extends Thread {
    private static ThreadLocal<Integer> counter = new ThreadLocal<>();
    @Override
    public void run() {
        counter.set(ThreadLocalRandom.current().nextInt(100));
        System.out.println(Thread.currentThread().getName() + ":" + counter.get());
        try {
            Thread.sleep(2000 + ThreadLocalRandom.current().nextInt(3000));
        } catch (Exception e) {
            e.printStackTrace();
        }
        counter.set(counter.get()+100);
        System.out.println(Thread.currentThread().getName() + ":" + counter.get());
    }
    public static void main(String[] args) {
        for (int i = 0; i < 10; i++) {
            Thread thread = new Demo();
            thread.setName("Thread" + i);
            thread.start();
        }
    }
}


上面我用到了ThreadLocal的set和get方法,其运行结果如下,因为使用了随机数,可能每次运行解决会不一致。可以很明显看得出,虽然多线对统一个Object操作,但却没有影响到各自的值。

Thread1:42
Thread0:20
Thread2:18
Thread3:6
Thread4:76
Thread5:50
Thread6:81
Thread7:75
Thread8:48
Thread9:56
Thread4:176
Thread7:175
Thread1:142
Thread6:181
Thread2:118
Thread5:150
Thread0:120
Thread3:106
Thread9:156


除了set和get接口外,ThreadLocal还提供了remove(),该方法可以将当前线程的所有内容清除掉。另外还有一个ThreadLocal<S> withInitial()。



源码分析

接下来我们就从源码来剖析下ThreadLocal是如何实现不同线程下不同值的,首先我们来看下set()方法,这是我们在除了构造函数外第一个用的方法,它也承担着ThreadLocal初始化的任务。


 

public void set(T value) {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null) {
            map.set(this, value);
        } else {
            createMap(t, value);
        }
    }
    ThreadLocalMap getMap(Thread t) {
        return t.threadLocals;
    }
    void createMap(Thread t, T firstValue) {
        t.threadLocals = new ThreadLocalMap(this, firstValue);
    }


set()也非常简单,我顺便也把set()涉及到的两个方法贴上。set()首先获取当前线程t,然后从t中获取ThreadLocalMap,如果ThreadLocalMap为空就创建一个。ThreadLocalMap是ThreadLocal中比较核心的东西,稍后会详细介绍。上面代码很显然,ThreadLocalMap是将ThreadLocal作为map的key。虽然多线程下都是用同一个ThreadLocal对象作为Key的,但每次获取key对应的Value是从不同的Map中获取,


 

public T get() {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null) {
            ThreadLocalMap.Entry e = map.getEntry(this);
            if (e != null) {
                @SuppressWarnings("unchecked")
                T result = (T)e.value;
                return result;
            }
        }
        return setInitialValue();
    }


虽然多线程下都是用同一个ThreadLocal对象作为Key的,但每次获取key对应的Value是从不同的Map中获取,这就保证了多下次下value不会冲突。get方法在ThreadLocalMap未创建的情况下,还会调用setInitialValue()。


/**
     * Variant of set() to establish initialValue. Used instead
     * of set() in case user has overridden the set() method.
     *
     * @return the initial value
     */
    private T setInitialValue() {
        T value = initialValue();
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null) {
            map.set(this, value);
        } else {
            createMap(t, value);
        }
        if (this instanceof TerminatingThreadLocal) {
            TerminatingThreadLocal.register((TerminatingThreadLocal<?>) this);
        }
        return value;
    }


从代码上来看,其实就是初始化一下ThreadLocalMap然后返回一个默认的初始值null,这个和set的初始化很像,为什么不用set呢?注释里也解释了,是为了防止set()被重载,导致get方法的初始化失效。我感觉单纯从实现ThreadLocal上来说,get中最后不return setInitialValue();而是return null也是可以的。不是很理解代码作者为什么要这么写。

 ThreadLocal主要功能就是这么实现的,说白了就是对ThreadLocalMap的操作。ThreadLocalMap才是核心。


ThreadLocalMap

我总结看Java代码的方法,就是先看类的声明,然后按实际用途从每个方法入手看是怎么执行的。


static class ThreadLocalMap { }

```  

 ThreadLocalMap是直接声明在ThreadLocal内部的,其他地方就没法用了(其实外部也没必要用,轮map的功能,它实现也没有HashMap和Tree好)。另外,它没有实现Map接口,emmm 这就意味它不是一个标准的map了。  

```java
        static class Entry extends WeakReference<ThreadLocal<?>> {
            /** The value associated with this ThreadLocal. */
            Object value;
            Entry(ThreadLocal<?> k, Object v) {
                super(k);
                value = v;
            }
        }


ThreadLocalMap的Entry继承了WeakReference,这让我想到了WeakHashMap,这里用WeakReference的原因也很明确,就是想让Key在失效后,Map能主动清理相关的Entry。

ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
            table = new Entry[INITIAL_CAPACITY];
            int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
            table[i] = new Entry(firstKey, firstValue);
            size = 1;
            setThreshold(INITIAL_CAPACITY);
        }
        private void setThreshold(int len) {
            threshold = len * 2 / 3;
        }


ThreadLocalMap也有几个默认参数,初始容量INITIAL_CAPACITY,threshold是容量的2/3,就是如果Map中的Entry数量超过总容量的2/3,ThreadLocalMap对进行扩容。


   

private void set(ThreadLocal<?> key, Object value) {
            // We don't use a fast path as with get() because it is at
            // least as common to use set() to create new entries as
            // it is to replace existing ones, in which case, a fast
            // path would fail more often than not.
            Entry[] tab = table;
            int len = tab.length;
            int i = key.threadLocalHashCode & (len-1);
            for (Entry e = tab[i];
                 e != null;
                 e = tab[i = nextIndex(i, len)]) {
                ThreadLocal<?> k = e.get();
                if (k == key) {
                    e.value = value;
                    return;
                }
                if (k == null) {
                    replaceStaleEntry(key, value, i);
                    return;
                }
            }
            tab[i] = new Entry(key, value);
            int sz = ++size;
            if (!cleanSomeSlots(i, sz) && sz >= threshold)
                rehash();
        }


从set方法中我们就可以看出ThreadLocalMap和HashMap,TreeMap的设计不同之处。首先也是对Key求hash值做定位,但当遇到hash冲突的时候,它的选择不是开链,而是调用nextIndex往后移动,直到遇见某个entry为null或者其key和要插入的key一样。同时,插入的过程也会调用replaceStaleEntry对Map做清理,清理过程比较复杂,我们稍后说。插入后,如果size大于阀值,也会对整个map做扩容操作。


   

private Entry getEntry(ThreadLocal<?> key) {
            int i = key.threadLocalHashCode & (table.length - 1);
            Entry e = table[i];
            if (e != null && e.get() == key)
                return e;
            else
                return getEntryAfterMiss(key, i, e);
        }
        private Entry getEntryAfterMiss(ThreadLocal<?> key, int i, Entry e) {
            Entry[] tab = table;
            int len = tab.length;
            while (e != null) {
                ThreadLocal<?> k = e.get();
                if (k == key)
                    return e;
                if (k == null)
                    expungeStaleEntry(i);
                else
                    i = nextIndex(i, len);
                e = tab[i];
            }
            return null;
        }


因为刚刚说到ThreadLocalMap处理key冲突的方式是往后移,直到有空闲的位置。这样虽然实现简单,但查的时候问题就来了,根据hash值算出来的位置没有,并不意味着整个map里没有,所以得往后遍历,直到找到或者遍历到某个空Entry。如果你仔细想想可能就会发现问题,如果只是遍历到遇到null,而不是遍历整个tab,可能会漏掉。比如下面这个例子。

| 0 | 1 | 2 | 3 | 5 | 6 | 7 |  
  |   | a | b | c | d | e |   |


开始的时候,tab状态是这样的,现在我要插入一个h,其hashcode恰好是1,然而a已经在那了,按插入逻辑,h只能插到7的位置了,插入后如下。


| 0 | 1 | 2 | 3 | 5 | 6 | 7 |  
  |   | a | b | c | d | e | h |     


后来,我把c删掉,变成了下面这样。如果我现在想查h,按照上面getEntry的逻辑,是不是遍历到3就停了,所以找不到h了? getEntry的逻辑表面确实是这样,但实际上getEntryAfterMiss、remove、gets时都会直接或者间接调用expungeStaleEntry会对表里的数据做整理。expungeStaleEntry()除了利用弱引用的特性对tab中Entry做清理外,还会对之前Hash冲突导致后移的Entry重新安放位置。所以不可能出现下面这种tab排放的。


| 0 | 1 | 2 | 3 | 5 | 6 | 7 |  
  |   | a | b |   | d | e | h 
private int expungeStaleEntry(int staleSlot) {
            Entry[] tab = table;
            int len = tab.length;
            // expunge entry at staleSlot
            tab[staleSlot].value = null;
            tab[staleSlot] = null;
            size--;
            // Rehash until we encounter null
            Entry e;
            int i;
            for (i = nextIndex(staleSlot, len);
                 (e = tab[i]) != null;
                 i = nextIndex(i, len)) {
                ThreadLocal<?> k = e.get();
                if (k == null) {
                    e.value = null;
                    tab[i] = null;
                    size--;
                } else {
                    int h = k.threadLocalHashCode & (len - 1);
                    if (h != i) {
                        tab[i] = null;
                        // Unlike Knuth 6.4 Algorithm R, we must scan until
                        // null because multiple entries could have been stale.
                        while (tab[h] != null)
                            h = nextIndex(h, len);
                        tab[h] = e;
                    }
                }
            }
            return i;
        }


还有set中调用的replaceStaleEntry(),代码很长,其实也是保证key失效的Entry被清理,Hash冲突的key能放回正确的位置。


   

private void replaceStaleEntry(ThreadLocal<?> key, Object value,
                                       int staleSlot) {
            Entry[] tab = table;
            int len = tab.length;
            Entry e;
            // Back up to check for prior stale entry in current run.
            // We clean out whole runs at a time to avoid continual
            // incremental rehashing due to garbage collector freeing
            // up refs in bunches (i.e., whenever the collector runs).
            int slotToExpunge = staleSlot;
            for (int i = prevIndex(staleSlot, len);
                 (e = tab[i]) != null;
                 i = prevIndex(i, len))
                if (e.get() == null)
                    slotToExpunge = i;
            // Find either the key or trailing null slot of run, whichever
            // occurs first
            for (int i = nextIndex(staleSlot, len);
                 (e = tab[i]) != null;
                 i = nextIndex(i, len)) {
                ThreadLocal<?> k = e.get();
                // If we find key, then we need to swap it
                // with the stale entry to maintain hash table order.
                // The newly stale slot, or any other stale slot
                // encountered above it, can then be sent to expungeStaleEntry
                // to remove or rehash all of the other entries in run.
                if (k == key) {
                    e.value = value;
                    tab[i] = tab[staleSlot];
                    tab[staleSlot] = e;
                    // Start expunge at preceding stale entry if it exists
                    if (slotToExpunge == staleSlot)
                        slotToExpunge = i;
                    cleanSomeSlots(expungeStaleEntry(slotToExpunge), len);
                    return;
                }
                // If we didn't find stale entry on backward scan, the
                // first stale entry seen while scanning for key is the
                // first still present in the run.
                if (k == null && slotToExpunge == staleSlot)
                    slotToExpunge = i;
            }
            // If key not found, put new entry in stale slot
            tab[staleSlot].value = null;
            tab[staleSlot] = new Entry(key, value);
            // If there are any other stale entries in run, expunge them
            if (slotToExpunge != staleSlot)
                cleanSomeSlots(expungeStaleEntry(slotToExpunge), len);
        }


这么多复杂的代码,最后看个简单的resize(),ThreadLocalMap的resize相较于HashMap的简单多了,就是新建一个长度为当前2倍的tab,然后把当前tab中的每个entry重新计算index再插入新tab。


   

private void resize() {
            Entry[] oldTab = table;
            int oldLen = oldTab.length;
            int newLen = oldLen * 2;
            Entry[] newTab = new Entry[newLen];
            int count = 0;
            for (Entry e : oldTab) {
                if (e != null) {
                    ThreadLocal<?> k = e.get();
                    if (k == null) {
                        e.value = null; // Help the GC
                    } else {
                        int h = k.threadLocalHashCode & (newLen - 1);
                        while (newTab[h] != null)
                            h = nextIndex(h, newLen);
                        newTab[h] = e;
                        count++;
                    }
                }
            }
            setThreshold(newLen);
            size = count;
            table = newTab;
        }


看来看去,ThreadLocalMap想要实现的功能和WeakHashMap类似,为什么不直接使用WeakHashMap呢!!


使用场景

数据库连接

Cache

线程池

参考资料

ThreadLocal源码

简单理解ThreadLocal原理和适用场景,多数据源下ThreadLocal的应用

目录
相关文章
|
8天前
|
安全 Java 调度
Java编程时多线程操作单核服务器可以不加锁吗?
Java编程时多线程操作单核服务器可以不加锁吗?
23 2
|
1天前
|
Java 数据库 UED
Java的多线程有什么用
Java的多线程技术广泛应用于提升程序性能和用户体验,具体包括:提高性能,通过并行执行充分利用多核CPU;保持响应性,使用户界面在执行耗时操作时仍流畅交互;资源共享,多个线程共享同一内存空间以协同工作;并发处理,高效管理多个客户端请求;定时任务,利用`ScheduledExecutorService`实现周期性操作;任务分解,将大任务拆分以加速计算。多线程尤其适用于高并发和并行处理场景。
|
12天前
|
存储 缓存 Java
java线程内存模型底层实现原理
java线程内存模型底层实现原理
java线程内存模型底层实现原理
|
12天前
|
算法 安全 Java
JAVA并发编程系列(12)ThreadLocal就是这么简单|建议收藏
很多人都以为TreadLocal很难很深奥,尤其被问到ThreadLocal数据结构、以及如何发生的内存泄漏问题,候选人容易谈虎色变。 日常大家用这个的很少,甚至很多近10年资深研发人员,都没有用过ThreadLocal。本文由浅入深、并且才有通俗易懂方式全面分析ThreadLocal的应用场景、数据结构、内存泄漏问题。降低大家学习啃骨头的心理压力,希望可以帮助大家彻底掌握并应用这个核心技术到工作当中。
|
14天前
|
Java 开发者
Java中的多线程基础与应用
【9月更文挑战第22天】在Java的世界中,多线程是一块基石,它支撑着现代并发编程的大厦。本文将深入浅出地介绍Java中多线程的基本概念、创建方法以及常见的应用场景,帮助读者理解并掌握这一核心技术。
|
10天前
|
Java 调度
Java-Thread多线程的使用
这篇文章介绍了Java中Thread类多线程的创建、使用、生命周期、状态以及线程同步和死锁的概念和处理方法。
Java-Thread多线程的使用
|
13天前
|
Java 调度 开发者
Java中的多线程编程:从基础到实践
本文旨在深入探讨Java多线程编程的核心概念和实际应用,通过浅显易懂的语言解释多线程的基本原理,并结合实例展示如何在Java中创建、控制和管理线程。我们将从简单的线程创建开始,逐步深入到线程同步、通信以及死锁问题的解决方案,最终通过具体的代码示例来加深理解。无论您是Java初学者还是希望提升多线程编程技能的开发者,本文都将为您提供有价值的见解和实用的技巧。
15 2
|
15天前
|
Java 数据处理
Java中的多线程编程:从基础到实践
本文旨在深入探讨Java中的多线程编程,涵盖其基本概念、创建方法、同步机制及实际应用。通过对多线程基础知识的介绍和具体示例的演示,希望帮助读者更好地理解和应用Java多线程编程,提高程序的效率和性能。
19 1
|
8天前
|
Java 数据中心 微服务
Java高级知识:线程池隔离与信号量隔离的实战应用
在Java并发编程中,线程池隔离与信号量隔离是两种常用的资源隔离技术,它们在提高系统稳定性、防止系统过载方面发挥着重要作用。
6 0
|
10天前
|
Java 数据处理 调度
Java中的多线程编程:从基础到实践
本文深入探讨了Java中多线程编程的基本概念、实现方式及其在实际项目中的应用。首先,我们将了解什么是线程以及为何需要多线程编程。接着,文章将详细介绍如何在Java中创建和管理线程,包括继承Thread类、实现Runnable接口以及使用Executor框架等方法。此外,我们还将讨论线程同步和通信的问题,如互斥锁、信号量、条件变量等。最后,通过具体的示例展示了如何在实际项目中有效地利用多线程提高程序的性能和响应能力。
下一篇
无影云桌面