JAVA并发编程系列(12)ThreadLocal就是这么简单|建议收藏

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
注册配置 MSE Nacos/ZooKeeper,118元/月
云原生网关 MSE Higress,422元/月
简介: 很多人都以为TreadLocal很难很深奥,尤其被问到ThreadLocal数据结构、以及如何发生的内存泄漏问题,候选人容易谈虎色变。 日常大家用这个的很少,甚至很多近10年资深研发人员,都没有用过ThreadLocal。本文由浅入深、并且才有通俗易懂方式全面分析ThreadLocal的应用场景、数据结构、内存泄漏问题。降低大家学习啃骨头的心理压力,希望可以帮助大家彻底掌握并应用这个核心技术到工作当中。

字节1面面试官:说说ThreadLocal的内存泄漏问题?

     很多人都以为TreadLocal很难很深奥,尤其被问到ThreadLocal数据结构、以及如何发生的内存泄漏问题,候选人容易谈虎色变。 日常大家用这个的很少,甚至很多近10年资深研发人员,都没有用过ThreadLocal。本文由浅入深、并且才有通俗易懂方式全面分析ThreadLocal的应用场景、数据结构、内存泄漏问题。降低大家学习啃骨头的心理压力,希望可以帮助大家彻底掌握并应用这个核心技术到工作当中。


一、ThreadLocal是什么?

    ThreadLocal顾名思义:线程本地变量。它是一个泛型类,每个线程可以独立持有自己的本地变量,没有线程安全问题。每个线程只能访问修改自己的本地变量。


//T,支持创建任意类型的线程本地变量
ThreadLocal<T> threadLocal = new ThreadLocal<>();

用法非常简单,这里先列出来它的方法,后面详细说说实现。


//1、设置线程本地变量值
threadLocal.set(value);
//2、读取变量值
T value = threadLocal.get();
//3、线程执行结束前,调用该方法,清空变量,避免内存泄漏
threadLocal.remove();

是不是很简单,就三个,真的没有再多了(JDK8)!你看是不是?

而且提供了remove方法,大家最害怕的内存泄漏,其实是可以主动避免的。


二、ThreadLocal的应用场景

    保持由浅入深,通俗易懂一贯做法,我们先讲应用场景,再探索源码、数据结构、算法、原理优缺点顺序进行分析。

2.1 线程隔离场景

     比如A线程持有的ThreadLocal变量,不想让B线程去读取和修改。无代码不成文,我们直接上代码,代码都有详细的步骤介绍,大家一看就懂。


package lading.java.mutithread;
/**
 * 模拟主线程持有的线程本地变量ThreadLocal,其他线程无法读取。
 * 此外,每个线程无法修改其他线程的本地变量,但是可以设置别的线程定义的本地变量
 */
public class Demo014ThreadLocal {
    //1、主线程定义的一个线程本地变量
    public static ThreadLocal<String> mainThreadLocalVar = new ThreadLocal<>();
    public static void main(String[] args) {
        //2、主线程设置本地线程变量值为:I am main Thread
        mainThreadLocalVar.set("I am main Thread");
        System.out.println(Thread.currentThread().getName() + "设置了本地变量:" + mainThreadLocalVar.get());
        //3、新建一个线程【老六】
        new Thread(() -> {
            //4、去读取主线程定义初始化的mainThreadLocalVar,看是否能读取
            System.out.println(Thread.currentThread().getName() + "读取主线程定义的本地变量,值为:" + mainThreadLocalVar.get());
            if (mainThreadLocalVar.get() == null) {
                System.out.println(Thread.currentThread().getName() + "确实没读到主线程定义的本地变量!");
            }
            //5、老六尝试去在主线程的本地变量新增一个变量值【I am old Six】
            mainThreadLocalVar.set("I am old Six");
            //6、看能否读取成功
            System.out.println(Thread.currentThread().getName() + "设置了自己的本地变量,值为:" + mainThreadLocalVar.get());
        }, "老六").start();
        //7、主线程休眠2s,等老六线程设置本地变量,主线程再读自己的本地变量看是否被修改
        try {
            Thread.sleep(2000);
        } catch (InterruptedException e) {
            throw new RuntimeException(e);
        }
        //8、老六线程也设置了自己的本地变量值,是新增还是覆盖主线程的变量?
        System.out.println(Thread.currentThread().getName() + "在老六设置了本地变量后,自己的本地变量值为:" + mainThreadLocalVar.get());
    }
}

运行结果:


在这里我们发现:每个线程无法修改其他线程的ThreadLocal本地变量,但是可以设置别的线程定义的Thread本地变量。

所以ThreadLocal变量具有非常好的隔离性,这个是如何做到的呢?

在第三部分,我们说说ThreadLocal的底层数据结构原理就懂了。比如数据库线程池,每个线程持有一个数据库连接,相互隔离互不影响。


2.2 变量在方法或类之间进行传递

   日常两个方法值传递,如果是通过方法返回值、或者某个参数,在并发场景下容易出现线程安全问题,而且这样增加方法和类的耦合度,代码写起来非常繁杂。比如后端开发应用,应用经常用到的链路追踪,一个请求进来,后续日志打印、以及第三方应用调用传递traceId,我们不可能在每个方法或类重复传递这个traceId,我们可以在FIlter过滤器里,定义一个LocalThread<String>变量,存好这个traceId。然后大家在log组件,线程执行打印的时候,统一读取这个traceId,就能保证日志链路连接起来。


三、ThreadLocal的数据结构原理

    在2.1里说到ThreadLocal的真正威力,本地变量是并发安全的。那是如何实现的呢?我们看看TheadLocal的源码,实际就是一个ThreadLocalMap的数据结构。

    我们看的是JDK1.8版本。我们看它的set()方法源码。


public void set(T value) {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null)
            map.set(this, value);
        else
            createMap(t, value);
    }

是不是很简单?

线程设置本地变量值,是在ThreadLocalMap里设置,它又是啥呢?我们继续看createMap(t, value);


//这个线程本地变量第一次被线程设置值
    void createMap(Thread t, T firstValue) {
        t.threadLocals = new ThreadLocalMap(this, firstValue);
    }
    
    //new ThreadLocalMap(this, firstValue)的源码如下
     ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
            //按初始化大小,初始化数组
            table = new Entry[INITIAL_CAPACITY];
            //计算数据应该存放的hash索引位置
            int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
            //在Entity table数组的i位置,存这个线程本地变量
            table[i] = new Entry(firstKey, firstValue);
            //数组大小改成1
            size = 1;
            setThreshold(INITIAL_CAPACITY);
        }

我们直接看createMap(t, value);就足够了,这里就是本地线程第一次set值。看到这里就能了解ThreadLocal的数据结构是ThreadLocalMap。它的key就是ThreadLocal本身。value就是要设置的值。

借用一个网上别人画的结构图,结构如下。

在2.1 我们看到多个线程并发下,主线程定义的ThreadLocal变量,别的线程也可以设置值,但是读不到主线程的值。

这是因为,ThreadLocalMap是一个Entity table数组。而每个元素都是特定线程独有的k-v键值对。彼此修改和读取都只能操作自己所在位置的数组元素。


四、经典必问:内存泄漏问题

  首先给部分新人说明一下,什么是内存泄漏?

内存泄漏,就是动态分配的内存,由于某些原因导致永远无法释放,导致内存浪费,最终导致程序变慢或者崩溃。

顺便提一下内存溢出,也就是OOM,这个是内存分配不够用,无法分配新内存给程序导致系统崩溃。

那ThreadLocal如何导致内存泄漏呢?

在上文部分三中,我们没有细说数组Entity的结构,这里我们必须细看一下发现,Entity数组里面的元素,key是弱引用,value是强引用

记住这个:ThreadLocal线程本地变量底层数据结构ThreadLocalMap的key是弱引用,value是强引用。

那什么是弱引用、强引用?

     日常我们常用常见的对象、变量,都是强引用。对象和变量如果没有被引用,就会被GC回收。而通过WeakReferentce定义的变量或对象,就是弱引用,GC回收器一旦发现它,不过是否有被引用、以及当前内存是否够用,都会直接被回收。


//这几个都是强引用
        ThreadLocal<String> threadLocal = new ThreadLocal<>();
        int a = 44;
        Object hh = new Object();
        
        //用WeakReference泛型类定义的就是弱引用
        WeakReference<String> weakObject = new WeakReference<>("aaa");

那线程的这个本地变量,key是弱引用、value是强引用是如何发生内存泄漏呢?

场景1:线程执行完,没有调用remove()方法。gc发生时,key因为是弱引用直接被回收,但是value是强引用,没有被回收,导致长期滞留在Entity里。

场景2:线程正在执行,然后发生了GC,垃圾回收器发现key是弱引用,直接把key变成null,回收掉。那这回value又变成了没有key指向的孤儿。加上是强引用,继续滞留在ThreadLocalMap 的Entity里,久而久之就有内存泄漏发生。


//ThreadLocal,在set方法里,有加这个 cleanSomeSlots(i, sz)方法,就是清除那些key为空的无效变量值
 if (!cleanSomeSlots(i, sz) && sz >= threshold)
                rehash();

总结:不管线程是否执行完,ThreadLocalMap Entity[]数组里的value,由于是强引用都可能发生内存泄漏。

所以使用ThreadLocal发生内存泄漏根本原因就是:没有手动调用remove()方法删除对应value值。

最后的最后,我们一定要注意在finally{}调用remove()方法,及时清空线程本地变量。

   OK,今天就分享到这,明天我们分享Future。至今我们已经完成分享synchronized、volatile、CAS、AQS、ReentrantLock、Semaphore、CountDownLatch、CyclicBarrier、并发锁、Condition、线程池等多个核心原理。

推荐阅读本系列其他核心分享:

1、《JAVA并发编程系列(11)线程池底层原理架构剖析》

2、《JAVA并发编程系列(10)Condition条件队列-并发协作者》

3、《JAVA并发编程系列(9)CyclicBarrier循环屏障原理分析》

相关文章
|
11天前
|
设计模式 安全 Java
Java编程中的单例模式:理解与实践
【10月更文挑战第31天】在Java的世界里,单例模式是一种优雅的解决方案,它确保一个类只有一个实例,并提供一个全局访问点。本文将深入探讨单例模式的实现方式、使用场景及其优缺点,同时提供代码示例以加深理解。无论你是Java新手还是有经验的开发者,掌握单例模式都将是你技能库中的宝贵财富。
15 2
|
6天前
|
JSON Java Apache
非常实用的Http应用框架,杜绝Java Http 接口对接繁琐编程
UniHttp 是一个声明式的 HTTP 接口对接框架,帮助开发者快速对接第三方 HTTP 接口。通过 @HttpApi 注解定义接口,使用 @GetHttpInterface 和 @PostHttpInterface 等注解配置请求方法和参数。支持自定义代理逻辑、全局请求参数、错误处理和连接池配置,提高代码的内聚性和可读性。
|
8天前
|
安全 Java 编译器
JDK 10中的局部变量类型推断:Java编程的简化与革新
JDK 10引入的局部变量类型推断通过`var`关键字简化了代码编写,提高了可读性。编译器根据初始化表达式自动推断变量类型,减少了冗长的类型声明。虽然带来了诸多优点,但也有一些限制,如只能用于局部变量声明,并需立即初始化。这一特性使Java更接近动态类型语言,增强了灵活性和易用性。
89 53
|
7天前
|
存储 安全 Java
Java多线程编程的艺术:从基础到实践####
本文深入探讨了Java多线程编程的核心概念、应用场景及其实现方式,旨在帮助开发者理解并掌握多线程编程的基本技能。文章首先概述了多线程的重要性和常见挑战,随后详细介绍了Java中创建和管理线程的两种主要方式:继承Thread类与实现Runnable接口。通过实例代码,本文展示了如何正确启动、运行及同步线程,以及如何处理线程间的通信与协作问题。最后,文章总结了多线程编程的最佳实践,为读者在实际项目中应用多线程技术提供了宝贵的参考。 ####
|
4天前
|
监控 安全 Java
Java中的多线程编程:从入门到实践####
本文将深入浅出地探讨Java多线程编程的核心概念、应用场景及实践技巧。不同于传统的摘要形式,本文将以一个简短的代码示例作为开篇,直接展示多线程的魅力,随后再详细解析其背后的原理与实现方式,旨在帮助读者快速理解并掌握Java多线程编程的基本技能。 ```java // 简单的多线程示例:创建两个线程,分别打印不同的消息 public class SimpleMultithreading { public static void main(String[] args) { Thread thread1 = new Thread(() -> System.out.prin
|
6天前
|
存储 缓存 安全
在 Java 编程中,创建临时文件用于存储临时数据或进行临时操作非常常见
在 Java 编程中,创建临时文件用于存储临时数据或进行临时操作非常常见。本文介绍了使用 `File.createTempFile` 方法和自定义创建临时文件的两种方式,详细探讨了它们的使用场景和注意事项,包括数据缓存、文件上传下载和日志记录等。强调了清理临时文件、确保文件名唯一性和合理设置文件权限的重要性。
16 2
|
7天前
|
Java UED
Java中的多线程编程基础与实践
【10月更文挑战第35天】在Java的世界中,多线程是提升应用性能和响应性的利器。本文将深入浅出地介绍如何在Java中创建和管理线程,以及如何利用同步机制确保数据一致性。我们将从简单的“Hello, World!”线程示例出发,逐步探索线程池的高效使用,并讨论常见的多线程问题。无论你是Java新手还是希望深化理解,这篇文章都将为你打开多线程的大门。
|
7天前
|
安全 Java 编译器
Java多线程编程的陷阱与最佳实践####
【10月更文挑战第29天】 本文深入探讨了Java多线程编程中的常见陷阱,如竞态条件、死锁、内存一致性错误等,并通过实例分析揭示了这些陷阱的成因。同时,文章也分享了一系列最佳实践,包括使用volatile关键字、原子类、线程安全集合以及并发框架(如java.util.concurrent包下的工具类),帮助开发者有效避免多线程编程中的问题,提升应用的稳定性和性能。 ####
33 1
|
11天前
|
存储 设计模式 分布式计算
Java中的多线程编程:并发与并行的深度解析####
在当今软件开发领域,多线程编程已成为提升应用性能、响应速度及资源利用率的关键手段之一。本文将深入探讨Java平台上的多线程机制,从基础概念到高级应用,全面解析并发与并行编程的核心理念、实现方式及其在实际项目中的应用策略。不同于常规摘要的简洁概述,本文旨在通过详尽的技术剖析,为读者构建一个系统化的多线程知识框架,辅以生动实例,让抽象概念具体化,复杂问题简单化。 ####
|
10天前
|
设计模式 安全 Java
Java编程中的单例模式深入解析
【10月更文挑战第31天】在编程世界中,设计模式就像是建筑中的蓝图,它们定义了解决常见问题的最佳实践。本文将通过浅显易懂的语言带你深入了解Java中广泛应用的单例模式,并展示如何实现它。