前提概要
并发并不一定只依赖多线程的技术,但编程领域里谈论并发大多数情况下都与线程脱离不了关系。
线程的介绍
线程是比进程更轻量级的调度执行单位,线程的引入可以把一个进程的资源分配和执行调度分开,各个线程既可以共享进程资源(内存地址,文件IO等),又可以独立调度(线程是CPU调度执行的基本单位)。
线程的实现
线程的实现方式主要有三种方式:使用内核线程实现,使用用户线程实现和使用用户线程加轻量级进程混合实现。
内核线程实现
内核线程(KLT,Kernel-Level Thread),直接由操作系统内核(Kernel,即内核)支持的线程。
- 内核来完成线程切换,内核通过操纵调度器(Scheduler)对线程进行调度,并负责将线程的任务映射到各个处理器上。
- 每个内核线程(逻辑内核)可以视为内核(物理内核)的一个分身,这样操作系统就有能力同时处理多件事情,支持多线程的内核叫做多线程内核(物理内核中有多个逻辑内核)。
轻量级进程技术(LWP)
- 程序一般不会去直接使用内核线程,而是去使用内核线程的一种高级接口——轻量级进程(LWP),即通常意义上的线程。
- 一个进程可以拥有多个轻量级进程,每个轻量级进程又有与之对应的内核线程(KLT)
- 由于每个轻量级进程都由一个内核线程支持,因此只有先支持内核线程,才能有轻量级进程。
- 轻量级进程与内核线程之间1:1关系称为一对一的线程模型。
- 通过内核调度器进行调度相关的内核线程去分配到不同的cpu处理器区执行(物理处理器)
- 内核线程保证了每个轻量级进程都成为一个独立的调度单元,即使有一个轻量级进程在系统调用中阻塞了,也不会影响整个进程的继续工作。
轻量级进程技术局限
基于内核线程实现,因此各线程操作等需要系统调用,系统调用代价高,需要在用户态和内核态来回切换,其次,每个轻量级进程都需要一个内核线程的支持,因此轻量级进程要消耗一定的内核资源,如内核线程的栈空间,因此一个系统支持轻量级进程的数量是有限的。
使用用户线程实现
广义上,内核线程以外,就是用户线程:轻量级进程也算用户线程,但轻量级进程的实现始终是建立在内核上的,许多操作都要进行系统调度,效率会受到限制。
狭义上,用户线程指完全建立在用户空间的线程库上。这种线程不需要切换内核态,效率非常高且低消耗,也可以支持规模更大的线程数量,部分高性能数据库中的多线程就是由用户线程实现的。
这种进程与用户线程之间 1:N 的关系称为一对多的线程模型。
- 用户线程优势在于不需要系统内核支援,劣势也在于没有系统内核的支援,所有的线程操作都是需要用户程序自己处理。
- 阻塞处理等问题的解决十分困难,甚至不可能完成。所以使用用户线程会非常复杂。
用户线程加轻量级进程混合实现
本质是内核线程与用户线程混合使用,可以使用内核提供的线程调度功能及处理器映射,并且用户线程的系统调用要通过轻量级进程来完成,大大降低整个进程被完全阻塞的风险。
用户线程与轻量级进程比例是N:M。
Java中的线程
Java中的线程对象用Thread类来表示,Thread类的所有关键方法都声明了native的,意味着这个方法没有使用或无法使用平台无关的手段来实现,也有可能是为了执行效率。
不同版本Java中的线程的实现
- JDK1.2之前:绿色线程—纯用户线程。
- JDK1.2之后:基于操作系统原生线程模型来实现。Sun JDK,它的Windows版本和Linux版本都使用一对一的线程模型实现,Java线程就映射到一条轻量级进程之中。Solaris同时支持一对一和多对多。
Java线程调度
线程调度是指系统为线程分配处理器使用权的过程,主要调度方式分两种:分别是协同式线程调度和抢占式线程调度。
- 协同式线程调度,线程执行时间由线程本身来控制,线程把自己的工作执行完之后,要主动通知系统切换到另外一个线程上。最大好处是实现简单,且切换操作对线程自己是可知的,没啥线程同步问题。坏处是线程执行时间不可控制,如果一个线程有问题,可能一直阻塞在那里。
- 抢占式调度,每个线程将由系统来分配执行时间,线程的切换不由线程本身来决定(Java中,Thread.yield()可以让出执行时间,但无法获取执行时间)。线程执行时间系统可控,也不会有一个线程导致整个进程阻塞。
Java线程调度就是抢占式调度。
- 系统能给某些线程多分配一些时间,给一些线程少分配一些时间,可以通过设置线程优先级来完成。
- Java语言一共10个级别的线程优先级(Thread.MIN_PRIORITY至Thread.MAX_PRIORITY),在两线程同时处于ready状态时,优先级越高的线程越容易被系统选择执行。但优先级并不是很靠谱,因为Java线程是通过映射到操作系统的原生线程上来实现的,所以线程调度最终还是取决于操作系统。
状态转换
ZJava定义了5种线程状态,在任意一个点一个线程只能有且只有其中一种状态。无限等待和等待可以算在一起。所以共五种。
- 新建(New):创建后尚未启动的线程。
- 运行(Runnable):Runnable包括操作系统线程状态中的Running和Ready,也就是处于此状态的线程有可能正在执行,也有可能等待CPU为它分配执行时间。线程对象创建后,其他线程调用了该对象的start()方法。该状态的线程位于“可运行线程池”中,变得可运行,只等待获取CPU的使用权。即在就绪状态的进程除CPU之外,其它的运行所需资源都已全部获得。
- 无限期等待(Waiting):该状态下线程不会被分配CPU执行时间,要等待被其他线程显式唤醒。如没有设置timeout的object.wait()方法和Thread.join()方法,以及LockSupport.park()方法。
- 限期等待(Timed Waiting):不会被分配CPU执行时间,不过无须等待被其他线程显式唤醒,在一定时间之后会由系统自动唤醒。如Thread.sleep(),设置了timeout的object.wait()和thread.join(),LockSupport.parkNanos()以及LockSupport.parkUntil()方法。
- 阻塞(Blocked):线程被阻塞了。与等待状态的区别是:阻塞在等待着获取到一个排他锁,这个事件将在另外一个线程放弃这个锁的时候发生;而等待则在等待一段时间,或唤醒动作的发生。在等待进入同步区域时,线程将进入这种状态。
阻塞状态是线程因为某种原因放弃CPU使用权,暂时停止运行。直到线程进入就绪状态,才有机会转到运行状态。(yield或者synchronized同步锁)的场景
阻塞的情况分三种:
- (1)、等待阻塞:运行的线程执行wait()方法,该线程会释放占用的所有资源,JVM会把该线程放入“等待池”中。进入这个状态后,是不能自动唤醒的,必须依靠其他线程调用notify()或notifyAll()方法才能被唤醒,即无限期等待,此外还有LockSupport.park()以及先关的Thread.join中的本质就是调用了thread(Object)的wait方法
- (2)、**同步阻塞:运行的线程在获取对象的同步锁时,若该同步锁被别的线程占用,则JVM会把该线- 程放入“锁池”中(synchronized)。 **
- (3)、其他阻塞:运行的线程执行sleep()或join()方法,或者发出了I/O请求时,JVM会把该线程置为阻塞状态。当sleep()状态超时、join()等待线程终止或者超时、或者I/O处理完毕时,线程重新转入就绪状态。即限期等待。此外还有LockSupport.park(timeout)等
- 结束(Terminated):线程执行完了或者因异常退出了run()方法,该线程结束生命周期。
这种情况下,五个状态分为 新建,就绪,运行,阻塞,终止,如下图所示。