首先,futex不是个完整的锁,它是“支持实现userspace的锁的building block“。也就是说,如果你想实现一个mutex,但不想把整个mutex都弄到内核里面去,可以通过futex来实现。但futex本身主要就是俩系统调用futex_wait和futex_wake.
为了更好的解释这个问题,这里先梳理下锁本身是怎么工作的。
一个完整的锁需要解决几个问题:
争抢到一个内存,如果抢到了就算是得到了锁,可以继续干活;
如果没抢到,可以选择:
继续抢(spin)
调用某个系统调用把自己挂起来排队
别的线程释放锁后,会通知排队挂起来的一个或几个线程。醒过来的线程再去重复第一步。
早期的锁,所有这些步骤都是内核态的。但后来大家发现,步骤1用CAS在用户态就可以干了。而多线程大部分的时候抢锁都是没有竞争的,一抢就能抢到。一下子没抢到多抢几次大概率也能抢到了。
那么能不能用一直做spin,永远不做2.2和3呢?答案是不行的。如果遇到了竞争,这也就意味着大量空耗CPU。
因此后来的锁的设计一般都优化成了这样:
1. 在用户态写一段代码来抢锁,典型的实现是用CAS把一个指定的变量从0变成1。如果抢到了就结束了。此时是用户态的。
2. 如果抢不到,就看看是不是锁的持有者就是自己。如果是,也算是抢到了(当然要对变量做特殊的标记)。否则就spin几次重新抢。这也是用户态的。
3. 如果重试了N次,实在抢不到,此时调用futex_wait进入内核态,去把自己挂起+排队,等着被释放锁的线程futex_wake。
所以只有3进入内核态了。考虑到大部分情况都不是竞争很激烈的情况下,3根本就不用做。这样的锁的设计避免了由于系统调用导致的上下文切换,无疑很大的提高了效率。
Ok, 回到Java。Java的synchronized用JVM的monitor实现。而monitor实现内部用到了pthread_mutex和pthread_cond。这俩是pthread标准接口,实现在glibc里。而这俩的内部实现在Linux上目前都用到了futex。所以整体可以理解为futex帮助Java在Linux上实现了synchronized在内核那部分阻塞的功能;同时用户态的抢锁,重入控制等功能由JVM自己实现。两块代码共同提供了完整的synchronized功能。
所以当我们随便写一段synchornized会阻塞的Java代码:
publicclassTestFutex{ privateInteger a =newInteger(1); synchronizedvoidshowA(){ System.out.println(a);try{ Thread.sleep(3000); }catch(InterruptedException e) { } }classTextendsThread{ @Override publicvoidrun(){ showA(); } }publicTnewThread(){ returnnewT(); }publicstaticvoidmain(String[] args){ TestFutex tf =newTestFutex(); T t1 = tf.newThread(); T t2 = tf.newThread(); t1.start(); t2.start(); } } 并用strace去查看效果,你就会看到: root@ba32a8cedf75:/test# strace -e futex java TestFutex futex(0x7f8dacc130c8, FUTEX_WAKE_PRIVATE, 2147483647) = 0 futex(0x7f8dad64e9d0, FUTEX_WAIT, 97, NULL1 …… 顺便说一句,基于AQS实现的JUC的那些ReentrantLock,Semaphore等内部也是类似的。其LockSupport.park内部用的也是这套东西。