码农的世界从来不缺乏名词。如果没有,我们就强行弄上几个。这些名词有垂直领域的知识缩写,也有水平领域的抽象划分。有的行云流水无比顺畅,有的晦涩难懂如便秘。
在java的并发编程里,就有一个比较晦涩的名词,叫做线程封闭。在以往的技术交流中,经常有人提到这个东西。那它到底是何方神圣,又有什么用的功效呢?
你去搜索一下网络上的文章,都会给你三个选项。
1)Ad-hoc线程封闭。
2)栈封闭。
3)ThreadLocal类。
这些知识,戳破了那层窗户纸,内容其实并不复杂。可怕的是这些名词,为了记住它们真是蛋碎了一地。
意义?
我们都知道,一个变量如果被多个线程所使用,势必会引入同步问题。除了同步关键字,java引入了多种技术来达到多线程的同步问题,包括wait、notify,可重入Lock,AQS等。这种编程方式会增加程序的复杂性,使得代码容易发生bug。
如果有一些数据,仅仅和线程有关,对线程外的数据是不可见的,那代码写起来就美好的多。实现了这种效果的技术,就统一称为线程封闭(thread confinement)。
这是前提。接下来我们来看实现。
栈封闭
栈封闭属于强行凑概念的一个范畴,它对写代码的人其实是不可见的,它是JVM里虚拟机栈或者本地方法栈的默认行为。其实,我们早就知道这个结果:成员变量是线程共享的,而局部变量是线程相关的。
很简单的道理,但背后的原理需要深入了解JVM。为了了解这个功能,我们需要对JVM的内存区域划分有一个初步的了解。
JVM除了存储空间最大的堆,还有线程相关的,正在运行的栈。栈封闭指的就是与线程相关的栈的相关行为。
我们稍微回忆一下上图中的内存划分,栈封闭指的就是图中彩色部分与线程相关的内存区域。
我们也可以再往下深挖一下。
虚拟机栈上的基本数据,其实是一种称作栈帧的东西。你可以把栈帧理解成某个方法的执行。
在每个方法压栈后,其中存在局部变量表、操作数栈、动态连接、返回地址等信息。我们的局部变量,其实就是存在与这些地方。由于它们的祖先,最终只会指向一个线程,所以它们的作用范围就被封闭了。
如上图所示,局部变量和某个线程的关系。java中还有个线程执行的内存模型JMM,不过那是对变量的复制和同步,说的不是一回事。
ThreadLocal
其实,java提供给开发者唯一的线程封闭API,就是ThreadLocal。
Thread类中,有一个成员变量threadLocals
,存放了与本线程相关的所有自定义信息。对这个变量的定义在Thread,而操作却在ThreadLocal类中。
public T get() { Thread t = Thread.currentThread(); ThreadLocalMap map = getMap(t); ... } ThreadLocalMap getMap(Thread t) { return t.threadLocals; } 复制代码
关于ThreadLocal的用法有很多,比如常用的,每个线程生成一个线程不安全的SimpleDateFormat
。
ThreadLocal<SimpleDateFormat> sdf = new ThreadLocal<SimpleDateFormat>(); sdf.set(new SimpleDateFormat()); 复制代码
关于ThreadLocal不做过多介绍,直接查看jdk源代码即可获取所有加成。
Ad-hoc
这些信息大多来源于《JAVA并发编程》一书。我特地搜索了一下Ad-hoc
这个名字的意思。
Ad-hoc模式就和以前的直连双绞线概念一样,是P2P的连接,所以无法与其它网络中的节点进行沟通,减少了干扰。 英文中作为形容词有“特别的”,“临时”的含义。
实在是无法理解为什么要用到这样的命名。
这种方式,完全靠实现者控制,所以非常脆弱。
好吧,看来还是老老实实用ThreadLocal好了。
End
我们看一下这三种方式的归宿。其中一种是JVM内部实现的,原理方面的知识;Ad-hoc是告诉用户这种线程封闭式很困难的,赶紧放弃;到最后,我们的手里就只剩下了ThreadLocal了。
我仿佛看到了ThreadLocal在胜利的招手,同时我的名词字典里又多了几个:线程封闭、栈封闭、Ad-hoc。