ThreadLocal原理解析

本文涉及的产品
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: ThreadLocal原理解析

hash冲突问题首先看一下ThreadLocal的这一段源码:

public class ThreadLocal<T> {
    // 创建ThreadLocal对象时立马初始化threadLocalHashCode
    private final int threadLocalHashCode = nextHashCode();
    // 所有ThreadLocal对象共享
    private static AtomicInteger nextHashCode =
        new AtomicInteger();
    // 魔数,自增步长
    private static final int HASH_INCREMENT = 0x61c88647;
    // 每次自增固定的值
    private static int nextHashCode() {
        return nextHashCode.getAndAdd(HASH_INCREMENT);
    }
}
复制代码
  • 根据上面代码的解析,可以看出,每次new一个ThreadLocal对象,threadLocalHashCode的值都会在上一个对象的threadLocalHashCode值基础上自增一个固定长度“0x61c88647”。
public void set(T value) {
        // 获取当前线程
        Thread t = Thread.currentThread();
        // 获取线程中的ThreadLocalMap容器对象
        ThreadLocalMap map = getMap(t);
        // 如果线程中已经有这个ThreadLocalMap容器对象了,那么直接把数据存进去
        if (map != null) {
            // 注意,这里的this指的就是当前的ThreadLocal对象本身
            map.set(this, value);
        } else {
            // 如果当前线程中还没有这个ThreadLocalMap容器对象,那么就现在创建一个
            createMap(t, value);
        }
    }
// 说明ThreadLocalMap是线程中的一个对象
ThreadLocalMap getMap(Thread t) {
        return t.threadLocals;
    }
// 创建一个ThreadLocalMap容器对象,并且赋值给指定线程
void createMap(Thread t, T firstValue) {
        t.threadLocals = new ThreadLocalMap(this, firstValue);
    }
// 创建ThreadLocalMap容器对象
ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
            // 初始化table数组
            table = new Entry[INITIAL_CAPACITY];
            // 通过threadLocalHashCode计算目标索引值
            int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
            // 把ThreadLocal对象作为key,需要存储在线程中的数据作为value
            table[i] = new Entry(firstKey, firstValue);
            size = 1;
            setThreshold(INITIAL_CAPACITY);
        }
复制代码
  • 通过上述代码,可以看出:
  • 每一个线程中都会有一个ThreadLocalMap容器,这个容器就是一个【key:value】数组。
  • ThreadLocal是把自己本身作为key,存储对象作为value。
  • 每一个ThreadLocal对象都有不同的threadLocalHashCode,以便于它们更好地离散分布在ThreadLocalMap中。
  • 一个ThreadLocal对象在一个线程中,只能存储一个对象

1920e494198c4b45a556abe4720cadc4_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

  • 如果ThreadLocal达到一定数量,通过threadLocalHashCode & (INITIAL_CAPACITY - 1)的算法计算目标索引值,必定会存在两个不同的ThreadLocal命中同一个索引值的情况。
private void set(ThreadLocal<?> key, Object value) {
            Entry[] tab = table;
            int len = tab.length;
            // 计算索引值
            int i = key.threadLocalHashCode & (len-1);
            // 在这个for循环中,只判断了
            // 1.索引值下的key是否和当前ThreadLocal相等
            // 2.索引值下的key是否为null
            // 那么剩下的情况就是产生了hash冲突的情况
            for (Entry e = tab[i];
                 e != null;
                 // 3.如果产生hash冲突了,那么需要计算下一个目标索引位置下的Entry
                 e = tab[i = nextIndex(i, len)]) {
                // 获取目标索引值下的key
                ThreadLocal<?> k = e.get();
                // 1.如果和当前的ThreadLocal是一个对象,那么直接取值
                if (k == key) {
                    e.value = value;
                    return;
                }
                // 2.如果这个索引值下的key已经被回收掉了,那么肯定是直接覆盖掉这个位置
                if (k == null) {
                    // replaceStaleEntry里面做了一些清理工作
                    replaceStaleEntry(key, value, i);
                    return;
                }
            }
            tab[i] = new Entry(key, value);
            int sz = ++size;
            if (!cleanSomeSlots(i, sz) && sz >= threshold)
                rehash();
        }
// 写一个索引值就是一直向后自增,超过了整个容器大小,又回到索引0位置。
// 注意:容器是有扩容策略的,如果ThreadLocal数量不是特别多的话,一般是不会到0索引位的。
 private static int nextIndex(int i, int len) {
            return ((i + 1 < len) ? i + 1 : 0);
        }
// 检查是否需扩容
private void rehash() {
  expungeStaleEntries();
  // 检查是否大于等于四分之三
  if (size >= threshold - threshold / 4)
    // 扩容
    resize();
}
// 扩容就是创建一个原来长度两倍的数组
private void resize() {
  Entry[] oldTab = table;
  int oldLen = oldTab.length;
  int newLen = oldLen * 2;
  Entry[] newTab = new Entry[newLen];
  int count = 0;
  for (Entry e : oldTab) {
    if (e != null) {
      ThreadLocal<?> k = e.get();
      if (k == null) {
        e.value = null; // Help the GC
      } else {
        int h = k.threadLocalHashCode & (newLen - 1);
        while (newTab[h] != null)
          h = nextIndex(h, newLen);
        newTab[h] = e;
        count++;
      }
    }
  }
  setThreshold(newLen);
  size = count;
  table = newTab;
}
复制代码
  • 所以在ThreadLocalMap中,一旦出现hash冲突的情况,就会通过线性探测的方式寻找下一个可以存放数据的位置。
    get()方法也是一样,如果发现目标位置的key与当前的ThreadLocal不是一个对象,那么也会通过线性探测的方式寻找目标位置,直至满足条件。
  • 内存泄漏问题
    首先,如果我们的线程不会循环使用的话,本身是不存在内存泄漏的问题的。因为线程属性threadLocals会随着线程的消亡被回收,也就不可能内存泄漏。
    因为线程资源宝贵,为了减少线程的创建,对线程做了循环利用。那么就会导致线程中的threadLocals在下一次使用前还有[key:value]键值对,并且因为一直有一个强引用指定value,那么gc并不会导致value的回收,在不断的循环利用过程中,必然会导致更多的value被创建而不被gc回收,最终导致内存泄漏。
    1.如果Entry中的key使用强引用的话,那么需要使用者手动将ThreadLocal置为null,否则ThreadLocal对象始终会有一个强引用被ThreadLocalMap持有,那么永远不会被回收,导致内存泄漏。
    2.如果Entry中的key使用弱引用的话,当ThreadLocal没有被任何对象任何强引用的时候,也就是该被回收的时候,那么就直接被回收了,不会因为ThreadLocalMap持有它的弱引用,导致它一直无法被回收而造成内存泄漏。
    其实从设计层面来说的话,也体现了ThreadLocal的封装性,既然不让开发者关心具体的key如何操作,那么自身内部就应该保证使用ThreadLocal的内存安全性,而不应该让使用者来处理和关心ThreadLocalMap对ThreadLocal的引用问题。

为了证明一下只要ThreadLocal没有任何其他强引用,那么经过gc后就会立马被回收,我写了下面这段代码:

public static void main(String[] args) throws InterruptedException {
        CountDownLatch countDownLatch = new CountDownLatch(1);
        new Thread(
                        () -> {
                            // 创建一个ThreadLocal对象
                            ThreadLocal<String> threadLocal = new ThreadLocal<>();
                            threadLocal.set("hello world");
                            // 让ThreadLocal对象没有任何强引用
                            threadLocal = null;
                            System.gc();
                            // 获取当前线程
                            Thread currentThread = Thread.currentThread();
                            // 可以在这一行打断点,查看currentThread里面的threadLocals对象
                            countDownLatch.countDown();
                        })
                .start();
        countDownLatch.await();
    }
复制代码


10259bdbe42c4b6c82757b829b4fb8cf_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

如上图所示,gc后referent属性值为null,说明此时Entry中的key已经被回收了,但是value依然存在。

如何处理value的强引用?

可参照以下模版:

ThreadLocal<String> threadLocal = new ThreadLocal<>();
try{
  threadLocal.set("hello world");
  // todo
}finally{
  threadLocal.remove();
}
复制代码

无论key是强引用还是弱引用,threadLocal都必须要在代码逻辑执行完毕后调用remove()将value的强引用删掉,否则就会导致内存泄漏。

也就是说,ThreadLocal不需要开发者关心key的回收问题,开发者只需要关心自己操作的value的回收问题即可。内部的归内部管理,外部的归外部管理,各司其职。


相关文章
|
5天前
|
存储 缓存 算法
HashMap深度解析:从原理到实战
HashMap,作为Java集合框架中的一个核心组件,以其高效的键值对存储和检索机制,在软件开发中扮演着举足轻重的角色。作为一名资深的AI工程师,深入理解HashMap的原理、历史、业务场景以及实战应用,对于提升数据处理和算法实现的效率至关重要。本文将通过手绘结构图、流程图,结合Java代码示例,全方位解析HashMap,帮助读者从理论到实践全面掌握这一关键技术。
33 13
|
23天前
|
运维 持续交付 云计算
深入解析云计算中的微服务架构:原理、优势与实践
深入解析云计算中的微服务架构:原理、优势与实践
56 1
|
1月前
|
运维 持续交付 虚拟化
深入解析Docker容器化技术的核心原理
深入解析Docker容器化技术的核心原理
45 1
|
24天前
|
存储 供应链 算法
深入解析区块链技术的核心原理与应用前景
深入解析区块链技术的核心原理与应用前景
47 0
|
1月前
|
算法 Java 数据库连接
Java连接池技术,从基础概念出发,解析了连接池的工作原理及其重要性
本文详细介绍了Java连接池技术,从基础概念出发,解析了连接池的工作原理及其重要性。连接池通过复用数据库连接,显著提升了应用的性能和稳定性。文章还展示了使用HikariCP连接池的示例代码,帮助读者更好地理解和应用这一技术。
58 1
|
27天前
|
JavaScript 前端开发 API
Vue.js响应式原理深度解析:从Vue 2到Vue 3的演进
Vue.js响应式原理深度解析:从Vue 2到Vue 3的演进
54 0
|
1月前
|
API 持续交付 网络架构
深入解析微服务架构:原理、优势与实践
深入解析微服务架构:原理、优势与实践
28 0
|
1月前
|
存储 供应链 物联网
深入解析区块链技术的核心原理与应用前景
深入解析区块链技术的核心原理与应用前景
|
1月前
|
存储 供应链 安全
深度解析区块链技术的核心原理与应用前景
深度解析区块链技术的核心原理与应用前景
39 0
|
1月前
|
供应链 安全 分布式数据库
探索区块链技术:从原理到应用的全面解析
【10月更文挑战第22天】 本文旨在深入浅出地探讨区块链技术,一种近年来引起广泛关注的分布式账本技术。我们将从区块链的基本概念入手,逐步深入到其工作原理、关键技术特点以及在金融、供应链管理等多个领域的实际应用案例。通过这篇文章,读者不仅能够理解区块链技术的核心价值和潜力,还能获得关于如何评估和选择适合自己需求的区块链解决方案的实用建议。
72 0

推荐镜像

更多
下一篇
DataWorks