进程 的引入是为了更好地使多道程序并发执行,提高资源利用率和系统吞吐量;
线程(Threads) 的引入是为了减小程序在并发执行时付出的时空开销,提高操作系统并发性能。
一. 基本概念
- 线程: ---->轻量级的进程,是一个基本的CPU执行单元,也是程序执行流的最小单元。
- 结构:由线程ID,程序计数器(PC),寄存器集合,堆栈 组成。
线程是进程中的一个实体,是被系统独立调度和分派的基本单位。
- 线程特点:
- 线程本身不拥有系统资源,只拥有一点儿运行中必不可少的资源,可以于同属一个进程的线程共享进程的全部资源。
- 一个线程可以创建,撤销另一个线程,同一个进程的线程之间可以并发执行。
- 线程之间的相互制约,使得 线程呈现出间断性。
- 线程也具有:就绪,阻塞,运行三种基本状态。
引入线程后,进程内涵变为:只作为除CPU以外的系统资源的分配单元。线程成为CPU的分配单元
一个进程内部发生线程切换只需要消耗较少的时空开销。
二. 线程与进程的比较
- 调度
- 进程的调度上下文切换开销大。
- 线程切换代价远低于进程。
- 同一进程中,线程切换不会引起进程切换;但不同进程的线程切换会引起进程切换。
- 并发性:
- 引入线程后,不仅不同进程可以并发执行;同一个进程的多个线程可以并发执行,不同进程的线程也可以并发执行。
使得操作系统并发性更好,提高了资源利用率和系统吞吐量。
- 拥有资源:
- 进程是OS中拥有系统资源的最基本单位,线程不具有系统资源
- 线程可以访问隶属进程的系统资源:表现在同一个进程的不同线程具有相同的地址空间。
- 独立性:
- 每个进程具有独立的地址空间和资源,除了共享全局变量,不允许其他进程访问。
- 每个进程的线程对其他进程不可见。
- 系统开销:
- 创建/撤销进程时,系统需要分配和回收PCB以及其他资源,开销大。
- 线程的创建/撤销 和 切换 开销很小。因此线程之间的同步与通信容易实现,甚至无需OS干预。
- 支持多处理器系统:
- 传统单线程进程:不管多少个CPU,进程只能运行在一个CPU上
- 多线程进程:可以将进程的多个线程分配到多个CPU上执行。
三. 线程的属性
- 线程是一个轻型实体,每个线程都有一个唯一标识符和一个线程控制块(记录线程执行的寄存器和栈结构等状态)
- 不同的线程可以执行相同的程序。【一个程序被多个用户调用时,OS将它们创建成不同的线程】
- 一个进程中线程共享该进程的资源
- 线程是CPU的独立调度单位。【单个CPU:多线程交替占用CPU;多个CPU:各个线程可以同时占用不同CPU】
- 线程创立后,会经历阻塞,就绪运行等状态的变化。
四. 线程的状态与切换
- 执行态:线程获得CPU而正在运行。
- 就绪态:只缺少CPU即可立即执行。
- 阻塞态:因某件事受阻(不单单是缺少CPU)处于暂停状态。
线程的状态转换与进程是一样的。
五. 线程的组织与控制
线程控制块(TCB)
结构:包括 ①线程标识符;②一组寄存器【PC,状态寄存器,通用寄存器】;③线程运行状态标识;④优先级;⑤线程专有存储区:线程切换时用于保护现场;
⑥堆栈指针:过程调用时保存局部变量和返回地址等。
同一进程的线程共享进程地址空间每个单元,因此一个线程可以读,写,清除另一个线程的堆栈。
线程创建
线程具有生命周期,由创建而产生,由调度而执行,终止而消亡。OS中存在用于创建线程和终止线程的函数(或系统调用)。
用户程序启动时候,通常只有一个名为 初始化线程的线程正在执行,用于创建新的线程。需要利用线程创建函数并提供相应的参数,如:指向线程主程序的入口指针,堆栈的的大小,线程优先级等。执行完毕后,将返回一个线程标识符。
线程终止
当一个线程完成任务(或被强行终止)后,由终止线程调用相应函数执行终止操作。但是有些线程(主要是系统线程)一旦建立就一直运行,不会被终止。
通常,线程被终止后并不立即释放占有的资源,只有当进程中所有线程执行分离函数后,线程才会与资源分离。
六. 线程的实现方式
用户级线程(User-Level-Thread,ULT)
早期的操作系统(如:早期Unix)只支持进程,不支持线程。当时的’线程“是由线程库实现的。
- 定义:”从用户视角能看到的线程“
- 特点:
- 线程管理(创建,撤销和切换等)所有工作由应用程序在用户空间(用户态)下完成,无需OS的干预。内核意识不到线程的存在。
- 应用程序可以通过线程库设计成多线程程序
- 优点:与操作系统平台无关;用户级线程切换在用户空间即可完成,不需要切换到内核态,线程管理系统开销小,效率高。
- 缺点:一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不能在多核处理机上并行运行。【内核分配给一个进程的只有一个CPU,因此进程中只有一个线程可以执行】
内核级线程(Kernel-Level-Thread,KLT)
组合方式
内核支持多个内核级线程的建立,调度和管理;同时允许用户建立,调度和管理用户级线程,这是用户级线程通过时分多路复用内核级线程实现的。
- 特点:同一进程的多个线程可以同时在多个CPU上并行执行。
拓展:线程库(thread library)
是为程序员提供创建和管理线程的API,实现线程库的主要方法:
用户级线程,内核级线程和组合方式线程链接简化图:
七. 多线程模型
在同时支持用户级线程和内核级线程的系统中,根据用户级线程和内核级线程连接方式的不同,分为以下三种模型。
多对一模型
一对一模型
多对多模型