『 Linux 』使用fork函数创建进程与进程状态的查看(上)https://developer.aliyun.com/article/1424455
🖥️ 通过系统调用创建子进程 fork() 🖥️
在unistd.h
头文件中,还包含了一个函数pid_t fork()
;
该函数可以在当前进程中创建子进程;
而该函数的返回值分为三种:
- 当该函数创建子进程失败则返回
-1
; - 当该进程为父进程时,该函数的返回值为子进程的PID;
- 当该进程为子进程时,该函数的返回值为0;
示例:
#include<iostream> #include<unistd.h> using namespace std; void test2(){ cout<<"it'a test"<<endl; fork(); cout<<"hello world"<<endl; } int main() { test2(); return 0; }
当运行这段程序后所得的结果为:
$ ./myproc it'a test hello world hello world
本质上的原因是因为这个函数创建了子进程,而父子进程中代码是共享的,所以第一句代码只执行了一次,而fork()
之后创建了子进程,第二句代码执行了两次的原因;
💻 那么为什么在fork()函数当中有两个返回值;
这里可以将fork()
函数的内部看成两种代码,分别是最后的返回以及其他代码;
pid_t fork(){ pid_t ret; //其他代码,主要用于创建子进程 return ret; }
从这里可以推断出,当该函数即将结束时,也就是在函数返回之前,其核心操作(创建子进程)已经结束;
当子进程被创建后代表将会多一个执行流用于最后一步的return
;
实际上在操作系统当中,会为每个CPU准备一个对应的运行队列,其中这个运行队列当中的各个节点就相当于一个pcb结构体,同时这个节点中还存储着其对应的代码及数据;
当一个进程被运行时将会被操作系统加载到该CPU的运行队列中,而CPU采用分时多任务的方式对这些进程进行操作;
当进程结束时这个进程将会被操作系统从运行队列中移出;
同时当子进程被创建之后将多一条执行流,而在接下来的代码当中是父进程先执行还是子进程先执行这是由操作系统的调度器来决定的;
在操作系统中不单单只有运行队列,在整体中CPU能算是一种资源,但是这个资源并不属于单单的一个进程,而是多个进程共用的;
对于其他的资源来说不同的资源都有着对应的队列(就绪队列,阻塞队列等),各个进程通过加载进对应的队列来实现对计算机当中各个资源的使用;
🔋 创建子进程后分区工作 🔋
在使用fork()
创建子进程后子进程与父进程都将共享代码,那么在共享代码的前提下如何使得创建子进程后提高整体效率?
从上文可知,该函数在创建子进程时将有三种返回值,即>0
父进程,==0
子进程,<0
创建进程失败;
可以在程序中使用分支语句根据不同的条件使得不同的进程来完成不同的工作;
示例:
#include<iostream> #include<unistd.h> using namespace std; void test3(){ pid_t ret = fork(); if(ret<0) cerr<<"fork fail"<<endl; if(ret==0) while(1){ cout<<"子进程 ret:"<<ret<<" PID: "<<getpid()<<" PPID: "<<getppid()<<endl; sleep(1); } if(ret>0)while(1){ cout<<"父进程 ret:"<<ret<<" PID: "<<getpid()<<" PPID: "<<getppid()<<endl; sleep(1); } } int main() { test3(); return 0; }
在该段代码中,使用了if
分支语句将子进程与父进程进行分流工作从而达到子进程与父进程不无意义的重复同一项工作;
##结果 子进程 ret:0 PID: 13412 PPID: 13411 父进程 ret:13412 PID: 13411 PPID: 13265 子进程 ret:0 PID: 13412 PPID: 13411 父进程 ret:13412 PID: 13411 PPID: 13265
🖥️ 进程状态 🖥️
在操作系统中,进程也被称作为任务,而一个任务他的状态不一定是持续的;同时在操作系统中进程拥有多种状态,称之为进程状态;
💻 操作系统的进程状态
在操作系统中常见的进程状态有几种:
- 新建状态
当一个进程正在被创建时,操作系统将会为其分配系统资源,并初始化该进程对应的PCB结构体;
- 运行状态
当一个进程已经被加载至运行队列当中,这个进程即为运行态,进程的运行态并不代表这个进程将一直占用这个CPU,会以一种分时多任务的方式将CPU逐个分配运行队列中的各个进程,同时在这个时候,进程拥有了CPU资源和其他的所需资源;
- 就绪状态
当一个进程已经被创建,且已经分配好了其他资源,但操作系统还并未给该进程分配CPU资源,即该进程并未被加载至运行队列当中称之为就绪状态;
- 阻塞状态
当一个进程既没有CPU资源也没有其他所需资源时称之为阻塞状态;举一个例子:当一个进程原本在运行队列当中,但是这个进程中的某段代码需要去访问除了CPU外的其他资源(例如输入输出设备或者是其他设备时),这个进程将会从原本的运行队列加载至其他队列,这个队列就称之为阻塞队列,此时这个进程的状态就称之为阻塞状态;
即等待非CPU资源就绪称之为阻塞状态(调用cin
但不输入数据);
- 挂起状态
相比于其他状态来说,挂起状态与CPU并没有太直接的关系;在计算机的磁盘当中,存在着一个swap
分区,这个分区就是为了当内存不足时使进程状态转化为挂起状态而准备的;
从上面可以知道,在队列当中的进程不仅仅是PCB结构体,由于各个进程要通过使用资源来操作自身的代码及数据可以得知一个进程中除了PCB结构体以外还包含着对应的代码以及数据;而挂起状态即为:
当内存严重吃紧时,操作系统会将这个进程所对应的代码及数据交换至磁盘中的swap
分区从而到达减轻内存的负担,当这个进程对应的代码及数据被交换至swap
分区时这个进程即为挂起状态;
- 阻塞挂起状态
阻塞挂起状态,顾名思义,就是既是阻塞状态也是挂起状态;
当一个进程在等待某种资源就绪时称这个进程的状态为阻塞状态,而当这个进程在等待某种资源时内存吃紧,导致该进程的代码与数据被操作系统移至磁盘的swap
分区时,称之为阻塞挂起状态;
💻 Linux操作系统下的进程状态
在该处为了查看进程状态我们可以使用shell脚本语言来循环ps axj
;
while : ; do ps axj | head -1 && ps axj | grep myproc | grep -v grep; sleep 1; done #其中grep myproc 中的myproc为该进程的关键字
$ while : ; do ps axj | head -1 && ps ajx | grep myproc | grep -v grep ; sleep 2; done PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND
//状态在kernel源码中的定义 /* * The task state array is a strange "bitmap" of * reasons to sleep. Thus "running" is zero, and * you can test for combinations of others with * simple bit tests. */ static const char * const task_state_array[] = { "R (running)", /* 0 */ "S (sleeping)", /* 1 */ "D (disk sleep)", /* 2 */ "T (stopped)", /* 4 */ "t (tracing stop)", /* 8 */ "X (dead)", /* 16 */ "Z (zombie)", /* 32 */ };
实际上在Linux中的进程状态在内核中是一个指针数组static const char * const task_state_array[]
;
🔋 R 运行状态(running) 🔋
运行状态并不意味着该进程一直正在运行当中,当多个进程需要共享即同时使用同一个CPU时将会以分时多任务的方式将该资源分配给多个进程;
就像是打篮球时每个球员对于球的控制都有一定的时间,该在控球时间限制内将球传给另一个球员或者是其他操作;
存在一个程序,其代码为:
void test4(){ while(1){ cout<<"hello world"<<endl; } } int main() { test4(); return 0; }
以前面的知识点可以知道当该程序运行时该进程应该为R
状态,也就是running
运行状态,而当运行这个程序后可以发现;
PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND 13383 16857 16857 13383 pts/2 16857 S+ 1002 0:00 ./myproc PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND
当程序运行后发现该状态为S+
状态,这是因为该程序当中该处调用了std::cout
,意思是在该进程当中将会去调用显示器,而在冯诺依曼体系中显示器属于外设,所以当该进程需要去调用外设时这个进程将从调度队列转移到阻塞队列,所以显示出的状态为S+
而不是R
;
当代码中的cout<<"hello world"<被注释后代表这个程序不需要调用CPU以外的资源,此时这个程序再次被运行时进程状态将会变成
R+
;
void test4(){ while(1){ //cout<<"hello world"<<endl; //将该行注释 } }
进程状态如下:
PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND 13383 31313 31313 13383 pts/2 31313 R+ 1002 0:00 ./myproc
此时的进程状态为
R+
;
同时该处的
R
状态对应着操作系统进程概念中的运行状态;
🔋 S 睡眠状态 (sleeping) 🔋
睡眠状态对应的是操作系统进程概念的阻塞状态,当一个进程在等待某种非CPU资源就绪时,称之为睡眠状态;
在测试运行状态的代码中也曾因为调用了外设出现了短暂的
sleeping
状态;
void test5(){ int a = 0; cin>>a;//调用流提取,表示在运行这个程序时需要等待输入设备输入数据 } int main() { test5(); return 0; }
这段代码使用了流提取,所以需要等待输入设备(键盘)进行输入;
当该程序运行后发现这个进程的状态为
S+
:
PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND 13383 2620 2620 13383 pts/2 2620 S+ 1002 0:00 ./myproc
但是该进程状态也被称作可中断睡眠(Interruptible sleep);
这里的可中断睡眠的意思即为可以被被动唤醒;
void test6(){ sleep(1000);//使用sleep使该进程主动睡眠 } int main() { test6(); return 0; }
当运行该程序时其进程的状态为
S+
的状态;
PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND 13383 4437 4437 13383 pts/2 4437 S+ 1002 0:00 ./myproc
从这里可以看出该进程的PID为
4437
;
而在这里若是使用
-19
信号使该进程被动唤醒;
kill -19 4439
PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND 13383 4437 4437 13383 pts/2 4437 S+ 1002 0:00 ./myproc PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND 13383 4437 4437 13383 pts/2 13383 T 1002 0:00 ./myproc
该进程的状态由
S+
转换为T
状态,此时该进程的睡眠状态也已被唤醒;
🔋 D 磁盘休眠状态(Disk sleep) 🔋
磁盘睡眠也称作不可中断睡眠状态(uninterruptible sleep),也被称作深度睡眠,顾名思义即不可被被动唤醒;
在绝大多数情况下,磁盘的睡眠状态是可以被唤醒的,那么对于这个所谓的磁盘休眠状态到底是一种什么样的状态?
当一个进程向磁盘读写数据时,若是这个数据量足够大,则这个进程需要在这个资源继续等待;在等待过程中若是该进程被打断,则容易出现磁盘数据与内存数据不一致的问题;
当内存严重吃紧时,操作系统将会选择性的杀死一些等待过长的没有进行有效操作的进程,若是在进程对磁盘进行读写时将该进程杀死则会出现上述问题;
所以当一个进程向磁盘进行读写时,为了保证数据的一致性,在读写结束之前,即该进程得到磁盘的回复之前,该进程都是一种不可被打断的
D 磁盘休眠状态
;
在这个情况下,即使使用
-9
号信号也不能将该进程杀死;
本质上来说,这个不可中断睡眠是操作系统对进程和硬件的一种保护机制;
这个状态下的进程通常会等待IO的结束,这里的IO可能是磁盘IO,网络IO,其他外设的IO;
🔋 T(t) 停止、暂停状态(tracing stopped) 🔋
该状态也被称为暂停状态和调试状态,将一个程序以
-g
的形式编译并使用GDB进行调试,在打断点之后运行该程序,该程序停止时其进程的状态即为t
状态;
PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND 7455 7542 7542 13383 pts/2 7455 t 1002 0:00 /home/root/Begin/my_-linux/Pr o23/Process1107/Test1121/myproc
🔋 T 停止、暂停状态(stopped) 🔋
可以通过发送
SIGSTOP
信号,即-19
号信号停止该进程;
当该进程处于停止状态时,可以通过发送
SIGCONT
状态使其继续运行;
PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND 13383 11260 11260 13383 pts/2 11260 S+ 1002 0:00 ./myproc PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND 13383 11260 11260 13383 pts/2 13383 T 1002 0:00 ./myproc PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND 13383 11260 11260 13383 pts/2 13383 S 1002 0:00 ./myproc
在调试过程中可以理解为当遇到断点时GDB向进程发送
SIGSTOP
信号从而达到实现暂停进程;
🔋 X 死亡状态(dead) 🔋
当一个进程已经结束(死亡),但操作系统未及时回收该进程的资源时,这个进程称为死亡状态;
在任务列表当中一般看不到这个状态,是因为这个状态的瞬时性太强,同时该状态只是一个返回状态;
🔋 前台进程 🔋
在上述的进程状态描述当中,实际上出现的进程状态中带了一个符号
+
;
譬如
S+
,R+
等等;
在操作系统当中,一般进程状态中带
+
的进程也被称作为前台进程;
前台进程占用的是命令行解释器,即当这个进程在运行时对应的终端不能对命令行进行解释;
同时前台进程可以直接使用
Ctrl
+C
来结束;
$ ./myproc test test test ^C
若是想将该进程变为后台进程,可以在运行该程序时在最后带上一个
&
符号;
当使用这种方法将进程以后台进程的形式运行时将会为使用者回显一次该进程的PID,方便使用者对该进程进行对应的操作;
同时,使用这种方式之后,进程将不再占用命令行解释器也不能使用
Ctrl
+C
结束,即命令行解释器可以正常使用;