ThreadLocal原理解析

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介: ThreadLocal原理解析

hash冲突问题首先看一下ThreadLocal的这一段源码:

public class ThreadLocal<T> {
    // 创建ThreadLocal对象时立马初始化threadLocalHashCode
    private final int threadLocalHashCode = nextHashCode();
    // 所有ThreadLocal对象共享
    private static AtomicInteger nextHashCode =
        new AtomicInteger();
    // 魔数,自增步长
    private static final int HASH_INCREMENT = 0x61c88647;
    // 每次自增固定的值
    private static int nextHashCode() {
        return nextHashCode.getAndAdd(HASH_INCREMENT);
    }
}
复制代码
  • 根据上面代码的解析,可以看出,每次new一个ThreadLocal对象,threadLocalHashCode的值都会在上一个对象的threadLocalHashCode值基础上自增一个固定长度“0x61c88647”。
public void set(T value) {
        // 获取当前线程
        Thread t = Thread.currentThread();
        // 获取线程中的ThreadLocalMap容器对象
        ThreadLocalMap map = getMap(t);
        // 如果线程中已经有这个ThreadLocalMap容器对象了,那么直接把数据存进去
        if (map != null) {
            // 注意,这里的this指的就是当前的ThreadLocal对象本身
            map.set(this, value);
        } else {
            // 如果当前线程中还没有这个ThreadLocalMap容器对象,那么就现在创建一个
            createMap(t, value);
        }
    }
// 说明ThreadLocalMap是线程中的一个对象
ThreadLocalMap getMap(Thread t) {
        return t.threadLocals;
    }
// 创建一个ThreadLocalMap容器对象,并且赋值给指定线程
void createMap(Thread t, T firstValue) {
        t.threadLocals = new ThreadLocalMap(this, firstValue);
    }
// 创建ThreadLocalMap容器对象
ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
            // 初始化table数组
            table = new Entry[INITIAL_CAPACITY];
            // 通过threadLocalHashCode计算目标索引值
            int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
            // 把ThreadLocal对象作为key,需要存储在线程中的数据作为value
            table[i] = new Entry(firstKey, firstValue);
            size = 1;
            setThreshold(INITIAL_CAPACITY);
        }
复制代码
  • 通过上述代码,可以看出:
  • 每一个线程中都会有一个ThreadLocalMap容器,这个容器就是一个【key:value】数组。
  • ThreadLocal是把自己本身作为key,存储对象作为value。
  • 每一个ThreadLocal对象都有不同的threadLocalHashCode,以便于它们更好地离散分布在ThreadLocalMap中。
  • 一个ThreadLocal对象在一个线程中,只能存储一个对象

1920e494198c4b45a556abe4720cadc4_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

  • 如果ThreadLocal达到一定数量,通过threadLocalHashCode & (INITIAL_CAPACITY - 1)的算法计算目标索引值,必定会存在两个不同的ThreadLocal命中同一个索引值的情况。
private void set(ThreadLocal<?> key, Object value) {
            Entry[] tab = table;
            int len = tab.length;
            // 计算索引值
            int i = key.threadLocalHashCode & (len-1);
            // 在这个for循环中,只判断了
            // 1.索引值下的key是否和当前ThreadLocal相等
            // 2.索引值下的key是否为null
            // 那么剩下的情况就是产生了hash冲突的情况
            for (Entry e = tab[i];
                 e != null;
                 // 3.如果产生hash冲突了,那么需要计算下一个目标索引位置下的Entry
                 e = tab[i = nextIndex(i, len)]) {
                // 获取目标索引值下的key
                ThreadLocal<?> k = e.get();
                // 1.如果和当前的ThreadLocal是一个对象,那么直接取值
                if (k == key) {
                    e.value = value;
                    return;
                }
                // 2.如果这个索引值下的key已经被回收掉了,那么肯定是直接覆盖掉这个位置
                if (k == null) {
                    // replaceStaleEntry里面做了一些清理工作
                    replaceStaleEntry(key, value, i);
                    return;
                }
            }
            tab[i] = new Entry(key, value);
            int sz = ++size;
            if (!cleanSomeSlots(i, sz) && sz >= threshold)
                rehash();
        }
// 写一个索引值就是一直向后自增,超过了整个容器大小,又回到索引0位置。
// 注意:容器是有扩容策略的,如果ThreadLocal数量不是特别多的话,一般是不会到0索引位的。
 private static int nextIndex(int i, int len) {
            return ((i + 1 < len) ? i + 1 : 0);
        }
// 检查是否需扩容
private void rehash() {
  expungeStaleEntries();
  // 检查是否大于等于四分之三
  if (size >= threshold - threshold / 4)
    // 扩容
    resize();
}
// 扩容就是创建一个原来长度两倍的数组
private void resize() {
  Entry[] oldTab = table;
  int oldLen = oldTab.length;
  int newLen = oldLen * 2;
  Entry[] newTab = new Entry[newLen];
  int count = 0;
  for (Entry e : oldTab) {
    if (e != null) {
      ThreadLocal<?> k = e.get();
      if (k == null) {
        e.value = null; // Help the GC
      } else {
        int h = k.threadLocalHashCode & (newLen - 1);
        while (newTab[h] != null)
          h = nextIndex(h, newLen);
        newTab[h] = e;
        count++;
      }
    }
  }
  setThreshold(newLen);
  size = count;
  table = newTab;
}
复制代码
  • 所以在ThreadLocalMap中,一旦出现hash冲突的情况,就会通过线性探测的方式寻找下一个可以存放数据的位置。
    get()方法也是一样,如果发现目标位置的key与当前的ThreadLocal不是一个对象,那么也会通过线性探测的方式寻找目标位置,直至满足条件。
  • 内存泄漏问题
    首先,如果我们的线程不会循环使用的话,本身是不存在内存泄漏的问题的。因为线程属性threadLocals会随着线程的消亡被回收,也就不可能内存泄漏。
    因为线程资源宝贵,为了减少线程的创建,对线程做了循环利用。那么就会导致线程中的threadLocals在下一次使用前还有[key:value]键值对,并且因为一直有一个强引用指定value,那么gc并不会导致value的回收,在不断的循环利用过程中,必然会导致更多的value被创建而不被gc回收,最终导致内存泄漏。
    1.如果Entry中的key使用强引用的话,那么需要使用者手动将ThreadLocal置为null,否则ThreadLocal对象始终会有一个强引用被ThreadLocalMap持有,那么永远不会被回收,导致内存泄漏。
    2.如果Entry中的key使用弱引用的话,当ThreadLocal没有被任何对象任何强引用的时候,也就是该被回收的时候,那么就直接被回收了,不会因为ThreadLocalMap持有它的弱引用,导致它一直无法被回收而造成内存泄漏。
    其实从设计层面来说的话,也体现了ThreadLocal的封装性,既然不让开发者关心具体的key如何操作,那么自身内部就应该保证使用ThreadLocal的内存安全性,而不应该让使用者来处理和关心ThreadLocalMap对ThreadLocal的引用问题。

为了证明一下只要ThreadLocal没有任何其他强引用,那么经过gc后就会立马被回收,我写了下面这段代码:

public static void main(String[] args) throws InterruptedException {
        CountDownLatch countDownLatch = new CountDownLatch(1);
        new Thread(
                        () -> {
                            // 创建一个ThreadLocal对象
                            ThreadLocal<String> threadLocal = new ThreadLocal<>();
                            threadLocal.set("hello world");
                            // 让ThreadLocal对象没有任何强引用
                            threadLocal = null;
                            System.gc();
                            // 获取当前线程
                            Thread currentThread = Thread.currentThread();
                            // 可以在这一行打断点,查看currentThread里面的threadLocals对象
                            countDownLatch.countDown();
                        })
                .start();
        countDownLatch.await();
    }
复制代码


10259bdbe42c4b6c82757b829b4fb8cf_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.png

如上图所示,gc后referent属性值为null,说明此时Entry中的key已经被回收了,但是value依然存在。

如何处理value的强引用?

可参照以下模版:

ThreadLocal<String> threadLocal = new ThreadLocal<>();
try{
  threadLocal.set("hello world");
  // todo
}finally{
  threadLocal.remove();
}
复制代码

无论key是强引用还是弱引用,threadLocal都必须要在代码逻辑执行完毕后调用remove()将value的强引用删掉,否则就会导致内存泄漏。

也就是说,ThreadLocal不需要开发者关心key的回收问题,开发者只需要关心自己操作的value的回收问题即可。内部的归内部管理,外部的归外部管理,各司其职。


相关文章
|
2月前
|
存储 缓存 算法
HashMap深度解析:从原理到实战
HashMap,作为Java集合框架中的一个核心组件,以其高效的键值对存储和检索机制,在软件开发中扮演着举足轻重的角色。作为一名资深的AI工程师,深入理解HashMap的原理、历史、业务场景以及实战应用,对于提升数据处理和算法实现的效率至关重要。本文将通过手绘结构图、流程图,结合Java代码示例,全方位解析HashMap,帮助读者从理论到实践全面掌握这一关键技术。
113 14
|
3月前
|
运维 持续交付 云计算
深入解析云计算中的微服务架构:原理、优势与实践
深入解析云计算中的微服务架构:原理、优势与实践
134 3
|
6天前
|
机器学习/深度学习 算法 数据挖掘
解析静态代理IP改善游戏体验的原理
静态代理IP通过提高网络稳定性和降低延迟,优化游戏体验。具体表现在加快游戏网络速度、实时玩家数据分析、优化游戏设计、简化更新流程、维护网络稳定性、提高连接可靠性、支持地区特性及提升访问速度等方面,确保更流畅、高效的游戏体验。
52 22
解析静态代理IP改善游戏体验的原理
|
3天前
|
编解码 缓存 Prometheus
「ximagine」业余爱好者的非专业显示器测试流程规范,同时也是本账号输出内容的数据来源!如何测试显示器?荒岛整理总结出多种测试方法和注意事项,以及粗浅的原理解析!
本期内容为「ximagine」频道《显示器测试流程》的规范及标准,我们主要使用Calman、DisplayCAL、i1Profiler等软件及CA410、Spyder X、i1Pro 2等设备,是我们目前制作内容数据的重要来源,我们深知所做的仍是比较表面的活儿,和工程师、科研人员相比有着不小的差距,测试并不复杂,但是相当繁琐,收集整理测试无不花费大量时间精力,内容不完善或者有错误的地方,希望大佬指出我们好改进!
46 16
「ximagine」业余爱好者的非专业显示器测试流程规范,同时也是本账号输出内容的数据来源!如何测试显示器?荒岛整理总结出多种测试方法和注意事项,以及粗浅的原理解析!
|
1月前
|
机器学习/深度学习 自然语言处理 搜索推荐
自注意力机制全解析:从原理到计算细节,一文尽览!
自注意力机制(Self-Attention)最早可追溯至20世纪70年代的神经网络研究,但直到2017年Google Brain团队提出Transformer架构后才广泛应用于深度学习。它通过计算序列内部元素间的相关性,捕捉复杂依赖关系,并支持并行化训练,显著提升了处理长文本和序列数据的能力。相比传统的RNN、LSTM和GRU,自注意力机制在自然语言处理(NLP)、计算机视觉、语音识别及推荐系统等领域展现出卓越性能。其核心步骤包括生成查询(Q)、键(K)和值(V)向量,计算缩放点积注意力得分,应用Softmax归一化,以及加权求和生成输出。自注意力机制提高了模型的表达能力,带来了更精准的服务。
|
2月前
|
存储 物联网 大数据
探索阿里云 Flink 物化表:原理、优势与应用场景全解析
阿里云Flink的物化表是流批一体化平台中的关键特性,支持低延迟实时更新、灵活查询性能、无缝流批处理和高容错性。它广泛应用于电商、物联网和金融等领域,助力企业高效处理实时数据,提升业务决策能力。实践案例表明,物化表显著提高了交易欺诈损失率的控制和信贷审批效率,推动企业在数字化转型中取得竞争优势。
120 16
|
2月前
|
网络协议 安全 网络安全
探索网络模型与协议:从OSI到HTTPs的原理解析
OSI七层网络模型和TCP/IP四层模型是理解和设计计算机网络的框架。OSI模型包括物理层、数据链路层、网络层、传输层、会话层、表示层和应用层,而TCP/IP模型则简化为链路层、网络层、传输层和 HTTPS协议基于HTTP并通过TLS/SSL加密数据,确保安全传输。其连接过程涉及TCP三次握手、SSL证书验证、对称密钥交换等步骤,以保障通信的安全性和完整性。数字信封技术使用非对称加密和数字证书确保数据的机密性和身份认证。 浏览器通过Https访问网站的过程包括输入网址、DNS解析、建立TCP连接、发送HTTPS请求、接收响应、验证证书和解析网页内容等步骤,确保用户与服务器之间的安全通信。
172 3
|
3月前
|
JavaScript 前端开发 API
Vue.js响应式原理深度解析:从Vue 2到Vue 3的演进
Vue.js响应式原理深度解析:从Vue 2到Vue 3的演进
117 17
|
3月前
|
运维 持续交付 虚拟化
深入解析Docker容器化技术的核心原理
深入解析Docker容器化技术的核心原理
83 1
|
3月前
|
存储 供应链 算法
深入解析区块链技术的核心原理与应用前景
深入解析区块链技术的核心原理与应用前景
100 0

热门文章

最新文章

推荐镜像

更多