🌎进程状态【上】
前言:
为了搞明白正在运行的进程是什么意思,我们有必要了解进程的不同状态,那么话不多说,开始我们今天的话题!
🚀发现进程的状态
我们按照上次所说的创建子进程,分别执行不同的工作:
1 #include<stdio.h> 2 #include<stdlib.h> 3 #include<unistd.h> 4 #include<sys/types.h> 5 6 int main() 7 { 8 printf("before fork!\n"); 9 sleep(3); 10 printf("start fork!\n"); 11 sleep(1); 12 13 pid_t id = fork(); 14 if(id < 0) 15 { 16 perror("fork error!\n"); 17 exit(0); 18 } 19 20 if(id == 0)//子进程 21 { 22 int cnt = 6; 23 while(cnt) 24 { 25 printf("I'm child process, pid=%d\n", getpid()); 26 sleep(1); 27 cnt--; 28 } 29 exit(0); 30 } 31 //父进程 32 sleep(1); 33 int cnt = 5; 34 while(cnt) 35 { 36 printf("I'm father process, pid=%d\n", getpid()); 37 sleep(1); 38 cnt--; 39 } 40 41 return 0; 42 } ~
这里使用了 exit() 函数,我们以前可能在C语言里见到过它,只知道它可以退出程序。其实在Linux当中exit函数是 退出进程 接口:
它的作用是终止一个进程,而函数参数是 退出码(这个以后会谈),表示 退出状态。
那我们把程序运行起来之后,再使用监控脚本进行监控:
观察我们从监控脚本得出的结果,我们发现带有 STAT 的一栏里除了最后一项我标红的位置为 “Z” 外,其他的状态都是 “S+” 状态,并且在标红的这一行,的最后,出现了 <defunct> 的字样。
这个就是我们今天要说的——进程状态。
🚀运行队列
进程的状态,一定是与CPU如何执行有关的,所以在了解进程状态之前,有必要先了解CPU如何执行进程。
我们说过,程序运行起来时就是一个进程,进程需要被CPU给执行,并且进程是以 循环队列 的形式被CPU执行,但是进程在CPU上并不是一直在执行的。
每一个进程都有自己的 时间片 ,也就是 每个进程运行最大时间,超过这个时间如果程序还没有被执行完毕,则强制退出,执行下一个进程,这个进程则重新排队等待CPU资源。
当然,有些情况下进程也许是在等待某些硬件资源,所以并不会一直执行,比如:
#include<stdio.h> int main() { int ind = 0; scanf("%d", &ind); printf("%d", ind); return 0; }
这个时候,程序此时就在等待我们硬件资源,也就是键盘的写入。
我们知道,进程 = task_struct + 可执行程序 ,那我们进程在排队的时候是 task_struct 在排队,还是可执行程序在排队,亦或是两者都排队呢?我们不妨讲个故事:
有一天,阿熊自信满满,觉得自己实力已经可以去闯闯了,于是阿熊连夜写了一份简历,第二天就向自己心仪的公司投递了过去,每天期待着答复。
这天,面试官手里拿着10份简历,按照面试官对应聘者的评价依次排放,筛选出自一半交给了hr,很幸运,阿熊居然没被刷下来,hr按照这个顺序依次比较,最后hr看着阿熊的简历坦然一笑…[未完]
其实,阿熊可以看为进程的代码和数据,而简历可以看作进程的PCB,而阿熊的简历被hr拿到的简历在一起的时候,其实就是进程排队的过程。
所以我们可以得出 结论:进程排队不是进程的可执行程序在排队,而是进程的PCB在排队!
于是就在当天晚上,阿熊收到了一封短信:“尊敬的阿熊,介于您出色的表现,已经进入我司人才库…” 然而就在阿熊一个人偷抹眼泪的时候,某个面试官正在骂骂咧咧投递自己的简历到另一家公司…[结束]
🚀进程排队
那么如何理解进程排队这件事情,进程排队本质上就是数据结构的双向链表,但是稍稍不同的是,这个指针指向的并不是下一个PCB的开始,而是PCB内部的一个指针。
那么如何通过PCB的中间链表去访问链表以上的属性信息呢?其实很简单:
struct task_struct { char ch1; char ch2; char ch3; }
假如我们要从 ch3 访问 ch1,只需要ch3 - 2,也就是根据ch3到ch1的 偏移量 来确定ch1的位置,同样,在PCB的内部也是根据偏移量来确定位置的。
那么在我们Linux内核中是如何确定偏移量的呢?
话说回来,进程排队的意义是什么?我们应该已经清楚了:只要是在排队,就一定是在等待某种资源!
🚀进程状态的表述
✈️状态在代码中的表示
我们都知道,Linux是使用C语言写的,而如何描述进程状态,其实就是使用 宏 来表示对应的状态,比如:
#define NEW 0 #define READY 1 #defien RUNNING 2 #define BLOCK 3 //... struct task_struct { int status;//就是上面定义的宏 //... }
现在,我们能把各个状态都具象化成宏了,而这些 状态决定了进程的后续动作,Linux中可能同时运行多个进程,OS就要根据进程的状态来决定下一步做什么。
以上可能是某个教材的进程状态图,我们接下来介绍的就是,运行、阻塞、和挂起 状态。
✈️运行状态
进程有一个状态叫做 运行状态,很多人以为只有当CPU执行到当前进程时,才能称为当前进程为运行状态,实则不然。
每一个CPU其实都有一个运行队列,比如:
struct runqueue{//运行队列 int count; task_struct *p;//指向进程 }
此时,整个队列的进程状态都为运行状态,而运行状态的意思是:
R(Running): 准备好被CPU随时调度。
✈️阻塞状态
进程有时会处于一种特殊的状态,阻塞状态 我们前面scanf等待硬件资源就会把进程拉入到一个 阻塞队列(Blocked Queue) 当中,表示正在阻塞等待某种硬件资源,当获得硬件资源后就会从阻塞队列中退出,链入到运行队列当中。
操作系统对下管理硬件资源,那么操作系统是如何管理这些硬件资源的?还是那六个字:先描述,再组织!
将硬件资源描述为一个个属性,将这些属性组织起来称为结构体,那么从此以后,操作系统对硬件的管理就变为了对这个结构体对象的管理。
struct device//硬件设备 { size_t type;//硬件类型,键盘、鼠标、磁盘,网卡等... //设备的操作方法 //状态 struct listnode node; task_struct *p;//指向进程 //... }
所以我们能得出的结论是:
当我们的进程在等待 软硬件资源 的时候,资源如果没有就绪,我们的进程PCB就只能: 1.将自己设置为阻塞状态。2.将自己的PCB链入等待资源的等待队列 (通常是资源竞争)。
✈️挂起状态
进程还存在一种挂起状态,这种状态与计算机内存有关系,当 计算机内存非常吃紧的时候,操作系统为了 保证向上提供良好的运行环境,所以操作系统一定会把需要等待资源的进程进行特殊处理,将内存资源释放一些,以便于 向上提供良好的环境。
比如说阻塞队列和等待队列,这些需要等待软硬件资源的进程,此时,这些进程不用我们的资源但是还占用我们的资源,所以OS就会将这些进程的代码和数据 唤入 到磁盘中的 swap分区。
其实这种挂起状态为 阻塞挂起,当然不排除有些教材里有其他挂起,但是我们就谈这一种。
唤出 仅仅是将进程的 代码和数据 唤出,进程的 task_struct 一定要保留在内存中,不然OS就没法确定这个进程的状态了。
可能在有些书里还有其他挂起,但是挂起的原因只有一个:一定是因为某种资源的紧缺才会挂起。
📒✏️总结
- 每个进程都有自己的进程状态,在C语言中以 宏 的方式体现,有了状态操作系统就知道下一步要做什么。
- 进程中存在许多队列,CPU执行的队列叫做 运行队列,阻塞等待软硬件资源的叫做 阻塞队列 和 等待队列。
- 进程排队是进程的 task_struct 在排队,而不是可执行程序在排队。并且只要是排队,就 一定是在等待某种资源分配。
- 挂起状态跟 内存有关,当内存状态吃紧时,将需要等待软硬件资源的进程的代码和数据唤出到 硬盘的 swap分区,需要时再唤入。
创作不易,如果这篇文章对您有帮助的话,还望留下一个小小的三连呀~~