前言
在前文中我们了解了fork函数的使用,以及写时拷贝机制的原理等,并且也学习了什么是僵尸进程,但是并没有具体讲到应如何处理僵尸进程,本次章节将对fork函数以及如何终止进程,还有僵尸进程的处理做更为详细的探讨。
进程创建
再谈fork函数
#include <unistd.h> pid_t fork(void);
返回值:创建子进程成功后,给子进程返回0,父进程返回子进程的pid,出错返回-1
pid_t 实际上就是int 的typedef
在调用fork函数的时候,会分配新的内存块和内核数据结构给子进程,并将父进程的部分数据结构内容拷贝给子进程(包括环境变量表)。
当调用fork函数之前,父进程独立运行,调用fork之后,会执行两个执行流,即父子进程共享fork函数之后的代码。
写时拷贝
写时拷贝可以说是一种“赌博式”的机制,在前文【进程地址空间】一文中已经具体的进行讲解。所谓写时拷贝实际上就是当一方进程想要对数据进行修改时,OS会在物理内存中重新开辟一块空间,并将原有物理空间的内容进行拷贝,最后将新空间的物理地址通过页表+MMU与原有虚拟地址重新建立映射关系。(给用户呈现的就是同一个地址却有两个不同的值)
进程终止
退出码
每一个进程在退出时都会有一个退出码,就好像我们写main函数时最后加上return 0,这就表示退出码为0。我们在Linux下可以通过echo $?指令查看最近的进程的退出码。
而对于各个退出码表示的含义,我们可以利用函数strerror,通过以下代码打印出来:
#include<stdio.h> #include<string.h> //退出码 int main() { int n=255; for(int i=0; i<n; ++i) { //strerror:将数字退出码转化为对应的字符串类型 printf("%d:%s\n",i,strerror(i)); } return 0; }
部分退出码含义(C语言标准)
还有一点需要注意的是,进程的退出码的数值范围一般都在0~255之内,假如超出了这个范围,则会返回退出码255。
退出方式
对于一个进程,我们除了可以通过外部指令(比如kill -9 pid或者ctrl c等)来终止进程,还可以通过内部实现的函数,来终止一个进程。常见的三个函数如下:
1、main函数中的return语句
该方法是最为常见的一种方法,当在main函数中执行return指令,则表示该进程终止,并返回return后面的退出码。不过这里需要注意的是,只有main函数中的return才表示进程终止。
2、exit函数
除了main函数中的return语句可以用来终止进程,实际上还可以通过函数exit用来终止该进程。exit与return的不同之处就在于,调用了exit之后,不管在哪个函数体(无论是普通函数,还是main函数)都会终止进程。
3、 _exit函数
_exit与exit看起来长得好像,那么它的作用是什么呢?与exit有什么区别吗?
实际上两者的共同点就是,两者都是当执行到该语句时,就会终止进程,唯一的区别就在于exit在终止进程之前会刷新缓冲区,而_exit则是直接结束进程。如下:
实际上,_exit是一个系统调用函数,需要 包含头文件<unistd.h>。而exit可以说是_exit的封装,如下:
退出结果
对于一个进程的退出结果,无非就以下三种情况:
程序正常退出,且执行结果正确
程序正常退出,且执行结果错误
程序异常
进程退出的进一步理解:OS在进程退出时,会释放该进程对应的内核数据结构+代码和数据(因此,僵尸进程问题的解决是必要的,否责会一直存在,占用系统空间资源,造成内存泄露)
进程等待
进程等待的原因
在前文进程状态中讲到了,子进程是要让父进程拿到自己的退出码以及退出状态,否则就算自己被kill掉了,也是处于一种僵尸状态(Z状态)存在着,直到父进程拿到自己的退出码以及退出状态,子进程才结束僵尸状态(bash的子进程由于bash有回收机制,所以不会出现僵尸进程)。
僵尸进程(Z)
对于父进程来说,子进程的执行结果是否正确并不重要,重要的是子进程的退出状态,即子进程是否是正常退出。而子进程的执行结果是否正确则是由程序员根据退出码自行判断。(注意:判断退出码是否正确的前提是进程是否正常退出)
对于僵尸进程问题的解决,父进程是通过进程等待的方式,回收子进程资源,获取子进程退出信息,从而解决僵尸进程问题。
总而言之,进程等待的目的只有两个,如下:
解决僵尸进程问题,避免内存泄漏(必须要做的)
获取子进程的退出结果(如果需要的话)
进程等待的方法
那么父进程应如何等待呢?实际上系统提供了函数,wait与waitpid函数。
wait函数
//头文件 #include<sys/types.h> #include<sys/wait.h> pid_t wait(int*status);
返回值:
等待成功->返回被等待进程pid,失败返回-1。
参数:
输出型参数,获取子进程退出状态,不关心结果则可以设置成为NULL
wait函数的使用很简单,接下来着重介绍waitpid函数的使用,该函数是我们比较常用的一个函数,用法相较于wait也稍微复杂了一些。
waitpid函数
为了更好更直观的认识该函数,我画了如下图解:
当然,仅仅只有图是不够的,接下来通过如下代码来演示进程等待的阻塞与非阻塞等待。
阻塞式等待
将waitpid的第三个参数设置为0,就表示阻塞式等待。所谓阻塞式等待,就是父进程运行到waitpid该处的指令时,不会再往后继续执行指令,而是处于阻塞状态,等到子进程退出时,才会继续执行后面的指令。
#include<stdio.h> #include<unistd.h> #include<sys/types.h> #include<sys/wait.h> #include<stdlib.h> int main() { pid_t id=fork(); if(id == 0) { //child int cnt=5; //子进程五秒后会退出 while(cnt) { printf("我是子进程,还有%ds退出,pid:%d\n",cnt,getpid()); --cnt; sleep(1); } if(cnt == 0)exit(111); else exit(-1); }
//父进程等待子进程退出(阻塞式等待)
printf("我开始等待子进程退出\n"); int status=0; pid_t w=waitpid(id,&status,0);//0表示阻塞式等待,只有子进程结束时,父进程才会执行后面的指令 //等待失败 if(w<0) { perror("wait fail"); return -1; }
//等待成功
printf("我是父进程,等待子进程成功,w:%d,子进程退出码:%d,退出信号:%d\n",w,(status>>8)&0xFF,status&0x7F); //status >> 8后得到低16位的高8位,& 0xFF则取到该8位对应的值,%d以十进制打印(退出码) //status &0x7F则是取到低7位的值,并以10进制打印(退出信号) }
先来看一下执行结果:
当然,我们不仅可以通过位运算获得子进程的退出码以及退出信号,也可以通过系统提供的宏来获取:
WIFEXITED(status):若子进程退出信号正常,则返回真,异常返回假(通常用0表示假,非0表示真)
WEXITSTATUS(status):查看退出码(用户自己根据退出码来判断是否执行结果正确,前提是退出信号正常)
非阻塞式等待
将waitpid的第三个参数设置为WNOHANG,就表示非阻塞式等待。所谓非阻塞式等待,就是父进程在执行waitpid指令时,假如子进程没有退出,则会给waitpid返回一个0,然后继续执行后面的指令。我们可以通过等待轮询的方式,来保证在等待子进程的同时,父进程得以做一些其他的事。如下:
#include<stdio.h> #include<unistd.h> #include<sys/types.h> #include<sys/wait.h> #include<stdlib.h> //非阻塞式等待 int main() { pid_t id=fork(); if(id == 0) { //child int cnt=3; //让子进程3秒后退出 while(cnt) { printf("我是子进程,还有%ds退出,pid:%d\n",cnt,getpid()); --cnt; sleep(1); } if(cnt == 0)exit(111); else exit(-1); } //father //等待轮询 while(1) { int status=0; //第三个参数设置为WNOHANG,表示非阻塞式等待,父进程可以执行后面的指令 pid_t tmp=waitpid(id,&status,WNOHANG); //等待失败 if(tmp < 0) { perror("wait fail\n"); exit(-1); } //子进程还未退出 else if(tmp == 0) { printf("子进程还未退出,我可以做其它的任务\n"); printf("执行任务-------\n"); sleep(1); } //子进程退出 else { printf("子进程已退出,父进程接受子进程返回信息,子进程退出码:%d,退出信号:%d\n",WEXITSTATUS(status),status&0x7F); break; } } return 0; }