2.11 cpu 的上下文切换
- 什么是CPU上下文
CPU 寄存器和程序计数器是 CPU 在运行任何任务前,所必须依赖的环境,这些环境就叫做 CPU 上下文。
CPU 上下文切换就是先把前一个任务的 CPU 上下文(CPU 寄存器和程序计数器)保存起来,然后加载新任务的上下文到这些寄存器和程序计数器,最后再跳转到程序计数器所指的新位置,重新加载指令数据,运行新任务。
系统内核会存储切换下来的上下文信息,当此任务再次被分配给 CPU 运行时,CPU 会重新加载这些上下文,这样就能保证任务原来的状态不受影响,让任务看起来还是连续运行。
上面说到所谓的「任务」,主要包含进程、线程和中断。所以,可以根据任务的不同,把 CPU 上下文切换分成:进程上下文切换、线程上下文切换和中断上下文切换。
2.12 协程的上下文切换
与熟悉的进程/线程切换类似,协程是用户自发的上下文切换和管理机制,所以也常被称为“用户态线程”。
而对于运行时的函数来讲,参数、返回值地址、函数栈、寄存器四个部分组成了运行时的全部信息,通过这些信息我们可以恢复任意函数的执行现场,我们称之为协程的上下文(context)。
也就是说,协程的上下文切换,本质上就是要保存旧的函数参数、返回值地址、函数栈以及寄存器,并加载新的函数数据,以达到新的协程运行环境跟旧的运行环境隔离,并且旧的运行环境可以恢复的目的。
2.13 线程的上下文切换
首先,线程是依托于进程而存在的,同一个进程内多个线程之间可以共享代码段、数据段以及打开的文件等资源,但每个线程各自都有一套独立的寄存器和栈,这样可以确保线程的控制流是相对独立的。
也就是说,线程的上下文切换主要分两种情况:新旧线程属于同一个进程,以及新旧进程不属于同一进程。
对于属于同一进程的两个线程的上下文切换来说,只需要切换线程私有的数据以及寄存器和栈信息即可。
对于不属于同一进程的线程上下文切换,他等同于进程的上下文切换。
2.14 进程的上下文切换
首先,进程的上下文也就是进程的运行时环境,他包含了虚拟内存、栈、全局变量等用户空间的资源,以及内核堆栈、寄存器等内核空间的资源
因为进程的运行时环境比较复杂,我们操作系统里面存在一个叫PCB(process control block),进程控制块的东西来存储进程的运行时环境。当发生进程上下文切换时,操作系统会保存旧进程的运行时数据到PCB里面,然后加载新的PCB,来达到新旧进程的运行时隔离的目的。
2.15 中断上下文切换
为了快速响应硬件的事件,中断处理会打断进程的正常调度和执行,转而调用中断处理程序,响应设备事件。而在打断其他进程时,就需要将进程当前的状态保存下来,这样在中断结束后,进程仍然可以从原来的状态恢复运行。
跟进程上下文不同,中断上下文切换并不涉及到进程的用户态。所以,即便中断过程打断了一个正处在用户态的进程,也不需要保存和恢复这个进程的虚拟内存、全局变量等用户态资源。中断上下文,其实只包括内核态中断服务程序执行所必需的状态,包括 CPU 寄存器、内核堆栈、硬件中断参数等。
对同一个 CPU 来说,中断处理比进程拥有更高的优先级,所以中断上下文切换并不会与进程上下文切换同时发生。同样道理,由于中断会打断正常进程的调度和执行,所以大部分中断处理程序都短小精悍,以便尽可能快的执行结束。
另外,跟进程上下文切换一样,中断上下文切换也需要消耗 CPU,切换次数过多也会耗费大量的 CPU,甚至严重降低系统的整体性能。所以,当你发现中断次数过多时,就需要注意去排查它是否会给你的系统带来严重的性能问题。
2.16 什么时候会发生进程的上下文切换
首先,明确一点的是,只有当进程的状态发生改变的时候,才会导致进程的上下文切换。 而导致进程状态发生改变的原因主要有以下三种:
- 系统调度导致
比如说,某操作系统采用时间片轮转法进程进程调度,当当前进程的时间片耗完之后,进程就从运行状态变为就绪状态,系统从就绪队列选择另外一个进程运行;
- 硬件中断导致
发生硬件中断时,CPU 上的进程会被中断挂起,转而执行内核中的中断服务程序;
- 进程主动挂起
当进程通过睡眠函数 sleep 这样的方法将自己主动挂起时,自然也会重新调度;
2.17 什么时候会发生线程的上下文切换
线程主要由六种状态,创建、运行、堵塞、等待、超时等待和结束六种状态。当线程状态改变的时候,就会发生上下文的切换。
2.18 什么时候会发生协程的上下文切换
因为协程是用户态线程,只运行在用户空间,也就是说,协程的切换并不受系统控制。所以切换由用户自己控制,由当前协程切换到其他协程由当前协程来控制。
2.19 为什么会有CPU的上下文切换
CPU上下文切换的本质原因,就是为了利用有限的CPU资源,去运行更多的任务,从而提高系统的吞吐量。
比如说,Linux 是一个多任务操作系统,它支持远大于 CPU 数量的任务同时运行。当然,这些任务实际上并不是真的在同时运行,而是因为系统在很短的时间内,将 CPU 轮流分配给它们,造成多任务同时运行的错觉。
而在每个任务运行前,CPU 都需要知道任务从哪里加载、又从哪里开始运行,也就是说,需要系统事先帮它设置好CPU 寄存器和程序计数器。