前言
了解上一篇文章中的进程地址空间后,我们再来说说进程控制的概念,进程控制我们需要搞清楚三个问题:如何进程终止,如何解决僵尸进程问题以及写时拷贝的问题。
一、什么是写时拷贝
如果我们要在linux中创建进程,就需要利用fork函数,fork函数有两个返回值,父进程返回子进程pid,给子进程返回0,如果fork失败了就返回-1,当我们函数开始return的时候,函数的主体部分已经做完了,也就是说fork创建子进程,在fork返回的时候子进程已经创建好了甚至已经被操作系统调度了,代码本身是要被父子进程共享的,return也是语句所以也会被共享,这就会出现为什么会出现两个返回值,当我们用if else分流可以发现两个判断条件同时进行,那么为什么会有一个大于0的ID值和一个等于0的ID值呢,因为当创建子进程时,操作系统会给子进程创建相应的进程地址空间,创建对应的地址空间的时候我们对应的数据等经过虚拟地址通过页表映射到物理内存的本质就是写入,这个时候谁先返回谁就发生写时拷贝问题,这样就出现了返回两个不同的ID值。
通常父子代码共享,父子进程在不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份拷贝,如下图:
fork的常规用法:
1.一个父进程希望复制自己,使父子进程同时执行不同的代码段,例如:父进程等待客户端请求,生成子进程来处理请求。
2.一个父进程要执行一个不同的程序,例如子进程从fork返回后, 调用exec函数。
fork调用失败的原因:
1.系统中有太多的进程
2.实际用户的进程超出了限制
注意:创建进程是会消耗资源的。
我们上一篇已经充分了解了写时拷贝,下面我们进行进程控制的学习:
二丶进程控制
1.进程终止
进程退出一共有三个场景:
1.代码运行完毕,结果正确
2.代码运行完毕,结果不正确
表示代码运行正确与否可以通过main函数的返回值来判断,返回值也叫进程的退出码。如下图:
我们写了一个累加函数,当函数返回值等于5050就返回0也就是代码运行完毕,结果正确的情况。当返回值不是5050就是代码运行完毕结果不正确的情况,然后我们通过$?来获取进程的返回值用echo去打印这个返回值。
我们用echo打印返回值,$?只会保留最近一次进程的退出码,也就是说我们看第一个打印的结果即可,为什么结果不正确呢?因为我们在循环中写错了我们应该写成i<=top才对。如下图:
这个时候我们发现结果对了确实给我们返回了正确的结果,接下来我们看看系统中有哪些退出码:
在这里需要包含头文件#include <string.h>然后我们利用strerror函数打印退出码:
由于太多我们只取一部分即可,比如0就是运行成功,2就是没有这个文件或目录,下面我们验证一下:
当我们试图查看一个不存在的文件或目录时,报错与退出码2一致这就说明了程序的运行结果确实可以通过返回值来判断。
3.代码异常终止,比如进程崩溃等等
进程退出就是操作系统少了一个进程,操作系统要释放进程对应的内核数据结构+代码和数据。那么进程退出有哪些方式呢?
1.通过main函数return(其他函数return仅仅代表该函数返回)
2.exit函数退出,如下图:
exit(int code):code就代表进程退出码,等价于main函数return。
当然_exit也可以退出,如下图:
_exit()需要包含头文件#include <unistd.h>,我们将程序运行起来:
是否感觉exit与_exit没有区别呢?其实不是,这两个函数是有区别的我们看下图:
我们用同一份代码,打印hello的时候不要带\n。
在经过2秒后hello刷出来了,我们在用_exit试试:
当我们用_exit结束进程我们发现数据没有被缓冲区刷新出来,所以这两个函数的区别在于_exit是直接结束进程不刷新缓冲区。我们也可以理解为exit就是多加了个冲刷缓冲区功能的_exit,如下图:
2.进程等待
我们之前的文章说过,当子进程退出,父进程如果不管不顾,就可能造成僵尸进程的问题,进而造成内存泄漏。另外,进程一旦变成僵尸状态,那就无法杀掉进程,因为谁也没有办法杀掉一个死去的进程。最后,父进程派给子进程的任务完成的如何我们需要知道,比如:子进程运行完成,结果对还是不对,或者是否正常退出。父进程通过进程等待的方式,回收子进程资源,获取子进程退出信息。
我们通过man 2 wait命令查看wait的使用:
我们可以看到wait的返回值是pid_t通过手册我们知道wait返回的是接收到的子进程的pid,下面通过代码我们使用一下wait函数:
我们先包含相应的头文件,然后重新写一份代码:
此代码的意思是让子进程活5s然后父进程睡眠10秒在这期间子进程是僵尸状态,然后父进程苏醒接收子进程。然后我们运行起来:
上面是我们写的一个shell脚本用来监视进程,现在我们将程序运行起来:
我们发现和我们想的一样,刚开始父子进程都在运行,当子进程结束后进入僵尸状态,然后父进程沉睡了10秒后醒来将子进程回收,然后两个进程一起退出。
如果父进程在wait的时候,如果子进程没退出,父进程在干什么?其实很简单,父进程还是在等子进程,等子进程结束了父进程才会退出。在子进程没有退出的时候,父进程只能一直在调用waitpid进行等待,这种等待被称为阻塞等待
下面我们看看waitpid函数:
第一个参数:如果pid大于0就表示等待指定的进程,如果pid等于-1,等待任意一个子进程,与wait等效,而第二个参数status是一个输出型参数,也就是信号比如下面这样:
第三个参数一般不管输入0即可,而这个status我们一般看做位图结构,如下图:
int有32个比特位但是只要后16位,次低8位当做退出状态,最后7位为终止信号。还有1位我们先不做讲解。
下面我们用waitpid演示一下:
status右移8位按位与全1就能得到次低8位的值,status按位与上0x7F就得到了最低7位的值,这个时候我们再来运行:
这个时候我们发现确实拿到了子进程的退出码38,signal为0代表成功,下面我们故意弄一个异常看看:
虽然编译器提示但我们依旧运行,最终收到的异常信号为8,代表子进程出现异常,这种情况退出码是多少就不重要了因为已经异常了。
下面我们验证一下waitpid的三种不同返回情况:
我们通过返回值去判断父进程等待失败,正在等待以及等待成功三种情况。
下面我们写个程序让父进程在等待子进程的时候可以干一些其他有用的事情:
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <sys/types.h> #include <sys/wait.h> //const char* err_string[] = { // "success", // "error" //} //int add_to_top(int top) //{ // int sum =0; // for (int i = 0;i<=top;i++) // { // sum+=i; // } // return sum; // //} #define Task_Num 10 //预设一批任务 void sync_disk() { printf("这是一个刷新数据的任务!\n"); } void sync_log() { printf("这是一个同步日志的任务!\n"); } void net_send() { printf("这是一个进行网络发送的任务!\n"); } //要保存的任务相关的 typedef void (*func_t)(); //将一个函数指针重定义为void,也就是定义了一个函数指针类型 func_t other_task[Task_Num] = {NULL}; //函数指针数组 int LoadTask(func_t func) { int i = 0; for (;i<Task_Num;i++) { if (other_task[i]==NULL) { break; } } if (i==Task_Num) { return -1; } else { other_task[i]==func; } return 0; } void InitTask() { for (int i = 0;i<Task_Num;i++) other_task[i]==NULL; LoadTask(sync_disk); LoadTask(sync_log); LoadTask(net_send); } void RunTask() { for(int i = 0;i<Task_Num;i++) { if (other_task[i]==NULL) { continue; } other_task[i](); } } int main() { pid_t id = fork(); if (id==0) { //子进程 int cnt = 5; while (cnt) { printf("我是子进程,我还要%dS,pid:%d,ppid:%d\n",cnt--,getpid(),getppid()); sleep(1); // int a = 10; // a/=0; //子进程必定异常分母为0 } exit(38); } InitTask(); //父进程 while (1) { int status = 0; pid_t ret_id = waitpid(id,&status,WNOHANG); if (ret_id<0) { printf("waitpid error!\n"); exit(1); } else if(ret_id==0) { RunTask(); sleep(1); continue; } else { printf("我是父进程,等待子进程成功,pid:%d,ppid:%d,ret_id:%d,child exit status:%d,child exit signal:%d\n",getpid(),getppid(),ret_id, (status>>8)&0xFF,status & 0x7F); break; } } // int status = 0; // pid_t ret_id = waitpid(id,&status,0); // printf("我是父进程,等待子进程成功,pid:%d,ppid:%d,ret_id:%d,child exit status:%d,child exit signal:%d\n",getpid(),getppid(),ret_id,(status>>8)&0xFF,status & 0x7F); // sleep(5); // printf("hello world"); // sleep(2); // _exit(39); // int result = add_to_top(100); // if (result==5050) // { // return 0; // } // else{ // return 1; // } // for (int i = 0;i<=200;i++) // { // printf("%d:%s\n",i,strerror(i)); // //exit(123); // _exit(123); // } return 0; }
接下来我们运行起来:
通过上图我们发现父进程在等待子进程退出的时候确实可以干一些事情。
下面我们将代码修改一下,用WIFEXITED宏获取是否接收信号
WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)
从上图运行结果来看我们发现确实成功拿到了退出码0。
总结:
如果子进程已经退出,调用wait/waitpid时,wait/waitpid会立即返回,并且释放资源,获得子进程退出信息。
如果在任意时刻调用wait/waitpid,子进程存在且正常运行,则进程可能阻塞。
如果不存在该子进程,则立即出错返回。