多线程与高并发学习:ThreadLocal源码详解

简介: 多线程与高并发学习:ThreadLocal源码详解

前言

保险出单场景中,业务员出单时后台需要根据业务员所在机构来决定业务流转,审计字段记录出单员信息等,这些在后端处理中需要多次用到,每笔订单都是独立对应一个业务线程,可以使用ThreadLocal将业务员代码存储到线程中,方便后续取值。

概述

我们知道想要启动一个新的线程,最终需要用到Thread类,一个Thread对应一个独立的线程。所以我们是不是可以在Thread中定义一个Map集合,最后以key-value的形式将内容存储到里面;我们在线程中想要拿到当前线程的引用对象,只需要调用Thread.currentThread()即可拿到实例,拿到实例后从其属性Map集合中进行取值即可,由于每个Thread都是独立的,这样就能做到线程间的隔离了。

8160fde63d956b371f3e9ad21f1ddd1.png

ThreadLocal往Thread容器中添加数据时,以自身对象作为存储的key,以自身对象左右取值的Key;

正文

案例

    public static void main(String[] args) {
        ThreadLocal<String > loginUserCode=new ThreadLocal<>();
        new Thread(()->{
            loginUserCode.set("100000");
            System.out.println(Thread.currentThread().getName()+":"+loginUserCode.get());
        }).start();
        new Thread(()->{
            System.out.println(Thread.currentThread().getName()+":"+loginUserCode.get());
            loginUserCode.set("200000");
            System.out.println(Thread.currentThread().getName()+":"+loginUserCode.get());
            Thread thread = Thread.currentThread();
        }).start();
    }

通过上面的案例知道ThreadLocal的基本用法。

数据存储结构

从上述的步骤中我们知道,Thread中肯定存储一个缓存容器用于存储数据,所以先看下其缓存的实现

ThreadLocalMap的源码比较多,这里我就挑比较重点属性的出来讲解;

static class ThreadLocalMap {
    private Entry[] table;
    //默认Enrty[]容量
    private static final int INITIAL_CAPACITY = 16;
      static class Entry extends WeakReference<ThreadLocal<?>> {
              /** The value associated with this ThreadLocal. */
              Object value;
              Entry(ThreadLocal<?> k, Object v) {
                //将key值包装成弱引用进行存储
                  super(k);
                  value = v;
              }
       }
}

看过HashMap源码的同学看这部分应该会比较容易点,这里的Entry继承了弱引用修饰的ThreadLocal。

ThreadLocal: set(T value)方法

    public void set(T value) {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null) {
            map.set(this, value);
        } else {
            createMap(t, value);
        }
    }
    ThreadLocalMap getMap(Thread t) {
        return t.threadLocals;
    }
    void createMap(Thread t, T firstValue) {
        t.threadLocals = new ThreadLocalMap(this, firstValue);
    }
  1. 获取当前线程
  2. 从当前线程中获取缓存对象
  3. 判断该缓存对象是否被初始化,没有则创建一个容器并赋值
  4. 将当前的ThreadLocal对象作为key,与value存入缓存中
        private void set(ThreadLocal<?> key, Object value) {
            // We don't use a fast path as with get() because it is at
            // least as common to use set() to create new entries as
            // it is to replace existing ones, in which case, a fast
            // path would fail more often than not.
            Entry[] tab = table;
            int len = tab.length;
            //计算出当前对象在数组中的下标,这里相当于取模效果
            int i = key.threadLocalHashCode & (len-1);
      //看是否出现Hash冲突的情况
            for (Entry e = tab[i];
                 e != null;
                 e = tab[i = nextIndex(i, len)]) {
                ThreadLocal<?> k = e.get();
        //如果其k值对象一样,证明是修改操作,直接复制即可
                if (k == key) {
                    e.value = value;
                    return;
                }
        //由于是弱引用,之前的key可能被垃圾回收,所以存储为null的,情况。
        //所以这里需要重新选址和清理一些垃圾
                if (k == null) {
                    replaceStaleEntry(key, value, i);
                    return;
                }
            }
      //走到这里,证明数组中不存在hash冲突的情况,这里创建一个对象并存入数组中
            tab[i] = new Entry(key, value);
            //当前存储容量+1
            int sz = ++size;
            //如果没有清理垃圾的情况发生,并且容量超过阈值大小了,需要进行扩容
            if (!cleanSomeSlots(i, sz) && sz >= threshold)
              //扩容。容量为当前旧数组的2倍
                rehash();
        }

综上所述:


根据当前ThreadLocal计算Hash值,并进行与运算,得到数组下标

判断当前数组对应下标是否有值,没有则创建一个新的enrty对象进行存储,并尝试进行垃圾回收和扩容

如果数组对应下标已经有值了,则是hash冲突了,判断是否存在key值相等的情况,如果存在则直接覆盖

如果当前key值不相等,此时使用线性寻址法找出对应的下标位置

对key值为null的垃圾进行回收。

        private void replaceStaleEntry(ThreadLocal<?> key, Object value,
                                       int staleSlot) {
            Entry[] tab = table;
            int len = tab.length;
            Entry e;
            // Back up to check for prior stale entry in current run.
            // We clean out whole runs at a time to avoid continual
            // incremental rehashing due to garbage collector freeing
            // up refs in bunches (i.e., whenever the collector runs).
            //存储当前下标志
            int slotToExpunge = staleSlot;
            //往前找,找出被垃圾回收的ThreadLocal对应的下标值
            for (int i = prevIndex(staleSlot, len);
                 (e = tab[i]) != null;
                 i = prevIndex(i, len))
                if (e.get() == null)
                    slotToExpunge = i;
            // Find either the key or trailing null slot of run, whichever
            // occurs first
            //在数组中一直往后寻找,看是否能找到key一致的位置
            for (int i = nextIndex(staleSlot, len);
                 (e = tab[i]) != null;
                 i = nextIndex(i, len)) {
                ThreadLocal<?> k = e.get();
                // If we find key, then we need to swap it
                // with the stale entry to maintain hash table order.
                // The newly stale slot, or any other stale slot
                // encountered above it, can then be sent to expungeStaleEntry
                // to remove or rehash all of the other entries in run.
                //找到位置,将该位置的值与之前ThreadLocal为null的位置进行互换
                //这里主要让数据在数组中尽可能连城一块,减少碎片化
                if (k == key) {
                    e.value = value;
          //将当前key为null的位置与真正存储值的数据进行互换,减少碎片化
                    tab[i] = tab[staleSlot];
                    tab[staleSlot] = e;
                    // Start expunge at preceding stale entry if it exists
                    //判断在hash冲突位置的前面是否存在垃圾数据,
                    //存在时 则两者不等,从最前面开始进行扫描清理垃圾
                    if (slotToExpunge == staleSlot)
                        slotToExpunge = i;
                    //垃圾清理
                    cleanSomeSlots(expungeStaleEntry(slotToExpunge), len);
                    return;
                }
                // If we didn't find stale entry on backward scan, the
                // first stale entry seen while scanning for key is the
                // first still present in the run.
                if (k == null && slotToExpunge == staleSlot)
                    slotToExpunge = i;
            }
            // If key not found, put new entry in stale slot
            //如果key不存在,则创建一个新的,放入数组中
            tab[staleSlot].value = null;
            tab[staleSlot] = new Entry(key, value);
            // If there are any other stale entries in run, expunge them
            //判断前面位置是否存在垃圾数据,存在则从最前面开始清理,否则不需要处理
            if (slotToExpunge != staleSlot)
                cleanSomeSlots(expungeStaleEntry(slotToExpunge), len);
        }

综上所述:


找出当前hash冲突位置前面是否存在key为null(被垃圾回收)的脏数据

一直往后找,看是否存在key相等的位置,有则将该位置的数据与hash冲突位置进行互换,减少内存空间的碎片化

垃圾清理,判断清理的位置是否在hash冲突位置的前面,如果是则从前面开始清理

        private int expungeStaleEntry(int staleSlot) {
            Entry[] tab = table;
            int len = tab.length;
            // expunge entry at staleSlot
            tab[staleSlot].value = null;
            tab[staleSlot] = null;
            size--;
            // Rehash until we encounter null
            Entry e;
            int i;
            //一直往后找,找到位置为null的数组下标
            for (i = nextIndex(staleSlot, len);
                 (e = tab[i]) != null;
                 i = nextIndex(i, len)) {
                ThreadLocal<?> k = e.get();
                //如果是垃圾数据,则清理。
                if (k == null) {
                    e.value = null;
                    tab[i] = null;
                    size--;
                } else {
                    int h = k.threadLocalHashCode & (len - 1);
                    //看是否存在Hash冲突的情况
                    if (h != i) {
                      //将当前位置的值清理掉
                      //重新在hash冲突处往后寻找一个地址为null的数据进行存储
                      //因为前面可能存在清理过的位置,这样的好处是减少碎片化,将数据尽量往前面靠近
                        tab[i] = null;
                        // Unlike Knuth 6.4 Algorithm R, we must scan until
                        // null because multiple entries could have been stale.
                        while (tab[h] != null)
                            h = nextIndex(h, len);
                        tab[h] = e;
                    }
                }
            }
            return i;
        }

综上所述:

  1. 从参数下标处开始扫描,如果数组位置没有存储数据,则返回该下标
  2. 如果key已经被回收了,此时将该位置的空间进行清理
  3. 如果存在hash冲突的情况,将当前位置空间清理掉,重新在hash冲突处往后再寻找一个空的空间进行存储,这样的好处是让数据能连续,避免过度碎片化
        private boolean cleanSomeSlots(int i, int n) {
            boolean removed = false;
            Entry[] tab = table;
            int len = tab.length;
            do {
                i = nextIndex(i, len);
                Entry e = tab[i];
                if (e != null && e.get() == null) {
                    n = len;
                    removed = true;
                    i = expungeStaleEntry(i);
                }
            } while ( (n >>>= 1) != 0);
            return removed;
        }

由于整个可能存在碎片化过多的情况,而expungeStaleEntry()方法遇到位置为空时,就结束清理。所以需要配合cleanSomeSlots()方法进行指数次清理。我理解使用指数次清理的方法可能清理不是特别干净,但是相对整个数组的扫描效率要高得多,数组过大时,整组扫描清理的方法会过度消耗时间。

ThreadLocal:get()方法

    public T get() {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null) {
            ThreadLocalMap.Entry e = map.getEntry(this);
            if (e != null) {
                @SuppressWarnings("unchecked")
                T result = (T)e.value;
                return result;
            }
        }
        return setInitialValue();
    }
  1. 获取当前线程
  2. 从当前线程中获取缓存对象
  3. 判断该缓存对象是否被初始化,没有则创建一个容器并赋默认值
  4. ThreadLocal对象作为key从缓存对象中获取值
        private Entry getEntry(ThreadLocal<?> key) {
            int i = key.threadLocalHashCode & (table.length - 1);
            Entry e = table[i];
            if (e != null && e.get() == key)
                return e;
            else
                return getEntryAfterMiss(key, i, e);
        }

ThreadLocal:remove()方法

     public void remove() {
         ThreadLocalMap m = getMap(Thread.currentThread());
         if (m != null) {
             m.remove(this);
         }
     }
        private void remove(ThreadLocal<?> key) {
            Entry[] tab = table;
            int len = tab.length;
            int i = key.threadLocalHashCode & (len-1);
            for (Entry e = tab[i];
                 e != null;
                 e = tab[i = nextIndex(i, len)]) {
                if (e.get() == key) {
                    e.clear();
                    //释放当前数组位置空间,并进行垃圾清理
                    expungeStaleEntry(i);
                    return;
                }
            }
        }

总结

Thread中定义了ThreadLocalMap 容器用于存储当前线程数据,ThreadLocalMap 的数据结构采用数组的方法,不像HashMap采用数组+链表的方法,所以在产生hash冲突时,两者的处理方法不一样。ThreadLocalMap中Key为弱引用的ThreadLocal对象,当发生GC时,该对象会被清理,而此时key所对应的value为强引用,所以就存在key=null,value不为null的情况,如果线程持续时间长,value得不到回收就会存在内存泄漏,如果出现大量线程,可能还会引发内存溢出。


所以ThreadLocalMap中定义了一些回收策略,对key为null的垃圾进行清理后,可能会导致数组中存在大量不连续的null的空间,整个数组碎片化验证。所以在expungeStaleEntry()方法中,对垃圾清理的同时,也会有对应策略重新计算下标,将数组存储尽量连续性;


目录
相关文章
|
20天前
|
监控 Java 数据库连接
线程池在高并发下如何防止内存泄漏?
线程池在高并发下如何防止内存泄漏?
|
20天前
|
缓存 监控 Java
Java 线程池在高并发场景下有哪些优势和潜在问题?
Java 线程池在高并发场景下有哪些优势和潜在问题?
|
2月前
|
存储 缓存 Java
什么是线程池?从底层源码入手,深度解析线程池的工作原理
本文从底层源码入手,深度解析ThreadPoolExecutor底层源码,包括其核心字段、内部类和重要方法,另外对Executors工具类下的四种自带线程池源码进行解释。 阅读本文后,可以对线程池的工作原理、七大参数、生命周期、拒绝策略等内容拥有更深入的认识。
136 29
什么是线程池?从底层源码入手,深度解析线程池的工作原理
|
1月前
|
Java Linux
【网络】高并发场景处理:线程池和IO多路复用
【网络】高并发场景处理:线程池和IO多路复用
45 2
|
1月前
|
存储 运维 API
源码解密协程队列和线程队列的实现原理(一)
源码解密协程队列和线程队列的实现原理(一)
35 1
|
1月前
|
存储 安全 API
源码解密协程队列和线程队列的实现原理(二)
源码解密协程队列和线程队列的实现原理(二)
33 1
|
2月前
|
监控 Java 调度
【Java学习】多线程&JUC万字超详解
本文详细介绍了多线程的概念和三种实现方式,还有一些常见的成员方法,CPU的调动方式,多线程的生命周期,还有线程安全问题,锁和死锁的概念,以及等待唤醒机制,阻塞队列,多线程的六种状态,线程池等
131 6
【Java学习】多线程&JUC万字超详解
|
2月前
|
消息中间件 安全 大数据
Kafka多线程Consumer是实现高并发数据处理的有效手段之一
【9月更文挑战第2天】Kafka多线程Consumer是实现高并发数据处理的有效手段之一
249 4
|
3月前
|
算法 安全 Java
深入解析Java多线程:源码级别的分析与实践
深入解析Java多线程:源码级别的分析与实践
|
1月前
|
存储 消息中间件 资源调度
C++ 多线程之初识多线程
这篇文章介绍了C++多线程的基本概念,包括进程和线程的定义、并发的实现方式,以及如何在C++中创建和管理线程,包括使用`std::thread`库、线程的join和detach方法,并通过示例代码展示了如何创建和使用多线程。
41 1
C++ 多线程之初识多线程

热门文章

最新文章