操作系统是一个复杂的软件,具备许多功能。其中,进程的管理与调度是与我们密切相关的。本文将对操作系统功能中进程管理与调度作出介绍。
*注意:为了便于理解,本文中谈到的进程,指的是仅包含一个线程的进程。
一、进程
进程(process):也叫任务,它是操作系统级别的一个基本概念,可以简单将其理解为“正在运行的程序”。操作系统执行加载到内存中的某个程序时,既包含该程序所需要的资源,同时还对这些资源进行基本的内存边界管理。
比如,在我们的资源管理器中,有一类文件是以 .exe 为后缀名的,这代表这这一个文件是一个可执行文件(可以理解为是一个程序)。当我们不去双击执行的时候,这个文件只是安静地躺在硬盘上;而当我们去运行它的时候,程序就跑起来了,在系统中形成了一个进程,操作系统便开始执行该程序所内含的逻辑。
在任务管理器中,我们可以查看到当前系统中有哪些进程。
win11操作系统下的进程页面
如图,该进程页面展示的就是笔者当前电脑上所运行的所有程序,也即进程。
二、 进程管理
1、进程管理的概念
电脑上有的进程往往是非常多的。进程一多,就需要操作系统进行管理。进程的管理分为两步:
描述一个进程。使用结构体或类,把一个进程所包含的信息表示出来。
组织这些进程。使用一定的数据结构,把这些结构体或对象放到一起。
可以用学校中学生的管理来类比系统中进程的管理。在学校里如何管理学生?通常会统计学生的信息,然后通过如表格这样的数据结构把学生的信息存放起来。当要开始一些后续的工作比如给学生发奖学金时,就可以遍历这些表格,查找到学生的信息。
同样的,进程管理的目的也是为了操作系统能更好地开展后续的一些其它工作。
2、进程结构体的核心属性
进程结构体也称作PCB(Process Control Block,进程控制块)。它包括以下几个核心的属性:
1、pid。每个进程的唯一的身份标识。
任务管理器进程页面可以通过PID搜索进程
2、内存指针。它描述当前进程所使用的内存是哪一部分。进程要跑起来,自然需要消耗一定的硬件资源,如内存。比如我们写了一段代码并运行,那么在系统中就会产生一个进程;而如果在代码中我们创建了变量,那这些变量就需要被分配一定的内存空间。那么就势必要管理一部分内存空间,以便我们的进程来使用。内存指针标识了当进程运行的时候,使用了哪些内存上的资源。
3、文件描述符表。硬盘上存储的数据,往往是以文件为单位来进行整理的。进程每打开一个文件,就会产生一个“文件描述符”。一个进程可能会打开多个文件,这就对应了一组“文件描述符”。把这些文件描述符放到一个顺序表这样的结构里,就构成了一个“文件描述符表”。文件描述符表标识了当进程运行的时候,使用了哪些硬盘上的资源。
由上面三个核心属性可知,进程的运行需要从操作系统那里申请资源,也即:进程是操作系统进行资源分配(包括但不限于内存资源、硬盘资源、CPU资源)的基本单位。类似于生活中政府给一个小区的居民发放物资,一个家庭一个家庭地分发,那么就可以说这里家庭就是物资分发的基本单位。
PCB的属性非常多,除了上面提到的三个,另外,与进程的调度、并发与并行相关的属性也很关键。
3、进程调度
(1)为什么需要进程调度?
每个程序相当于一组“二进制指令”的集合。我们通过文本编辑器的方式打开微信的可执行文件:
可能就会出现这样的提示。 这些二进制指令,就依靠CPU来运行。
CPU中有一个概念叫“核心数”。我们打开任务管理器的性能页面可以查询到计算机的核心数和逻辑处理器数,也就是我们通常所说的 x核x线程 。如下面的参数就表示计算机是12核16线程的。对于这个概念,可以这么理解:CPU里有12个干活的人,但有一些干活的人特别能干,一个顶俩(大小核),相当于12个人可以同时干16个人干的活。
这个参数也称为,12个物理核心,16个逻辑核心。
然而,CPU再能干,同一时间也只能干16人份的活。但是实际上,我们需要同时干的活有100个。实际上要干的任务多,干活的人少。
为了应对这样同时执行多任务的需求,CPU采取并行与并发两种方式。为了支持并行与并发,就需要系统能够实现进程调度。
下面先简单介绍一下并行与并发的基本概念。
(2)并行
同一时刻,两个核心,同时执行两个进程。此时这两个进程就是并行执行的。
并行
(3)并发
一个核心,先执行进程1,执行一会儿之后再去执行进程2,再执行一会儿之后,再去执行进程3……此时,虽然微观上进程1和进程2、进程3之间并不是同时执行的,但只要这里切换的速度足够快,那用户感知起来,进程1、2、3就是“同时”执行的。并发,就是微观上分布执行,宏观上同时执行的方式。
并发
通过并行+并发的方式,16个核心也可以同时执行100 个任务了。很多时候也把并发+并行结合,统称作并发。这完全由操作系统自身控制的,用户是感知不到的。
为了实现这样的切换能够高效、有条不紊,我们需要有合理的进程调度机制。
(4)进程结构体中辅助进行进程调度的属性
在 二.2 中,我们介绍了PCB里描述内存资源使用情况的内存指针,以及描述硬盘资源使用情况的文件描述符表,这里就要介绍描述CPU资源相关的属性。这些属性,都是辅助进行进程调度的。
1、进程状态。简单认为,进程的状态主要有就绪态和阻塞态这两种。
就绪态:该进程已经准备好,随时可上CPU执行。
阻塞态:该进程暂时无法上CPU执行。
2、进程的优先级。进程之间的调度不一定是“公平”的,有的需要优先调度。
3、进程的上下文。概括来讲,“上下文”就是描述当前程序执行到哪里了的这样一个“存档记录”。进程在暂时离开CPU的时候,就要把当前的运行结果进行存档,等下次该进程再次回到CPU的时候,再恢复之前的存档,这样该进程就能从上次的结果继续向后执行了。注意,如果进程已经结束,就不会有存档了。
所谓“上下文”,它具体指的是,进程运行过程中CPU内部一系列寄存器的值。寄存器的种类有很多,其中最典型的作用就是保存当前进程执行的中间结果,包括程序具体运行到了哪一条指令。进程离开CPU,就需要把这些寄存器的值保存到PCB的上下文字段中(存档);同一进程下次再回到CPU,再把PCB中的值恢复到寄存器中(读档)。
4、进程的记账信息。用于统计每个进程在CPU上执行了多久,这是进程调度的一个参考依据。
4、进程结构体的组织结构
操作系统双向链表这样的结构来组织PCB。创建了一个进程,就是创建了一个链表的表结点;销毁一个进程,就是销毁了一个表结点。遍历进程列表,就是遍历链表。