fork()
ork()函数的实现在操作系统内部,函数准备返回的时候核心代码已经执行完,子进程早已经被创建,并且可能在操作系统的运行队列中准备被调度。fork后会两个执行流,父子进程代码是共享的,所以会被调度两次被父子进程各自执行return的。
fork也会调用失败:
系统中有太多的进程。
实际用户的进程数超过了限制
当一个进程调用fork函数后,内核会做几件事:
分配新的内存块和内核数据结构给子进程
将父进程部分数据结构内容拷贝给子进程
添加子进程到系统进程列表中
fork返回后,开始调度器调度
进程退出
进程退出总共会有三种情况:
代码运行完毕,结果正确
代码运行完毕,结果不正确
代码遇到异常终止执行
对于进程退出而言,可以有两种方法退出。一种就是正常的程序运行完毕终止执行,另一种就是程序遇到异常信号终止运行。
return 0中的0本质就是正常退出的意思,是退出码的其中一个。非0的退出码代表着程序出错误,每一个退出码都有不同的对应信息都有不同
除了return可以返回退出码退出程序外,exit和_exit也是可以的,不过这两者还是会有所区别的。
exit是库函数,_exit是系统调用
exit会刷新缓冲区,_exit不会。
进程等待
通过进程等待去解决僵尸进程(kill -9不能杀死僵尸进程):
父进程想要获取子进程的任务完成的程度如何就必须通过进程等待的方式,回收子进程资源,获取子进程退出信息
wait:
wait等待成功会返回被等待的进程的pid,失败则返回-1。如果不关心子进程退出状态参数给NULL
waitpid:
waitpid 相对于 wait 来说能够获取的信息就更多了,可以获取子进程的退出码和子进程返回的状态。
如果子进程是正常终止,那么返回的状态为0,如果收到了异常信号终止则非0
但是这里还要注意的是,waitpid 返回的子进程的数据是有自己的存储方式的。例如 waitpid 返回了一个变量 status 那么这个变量的高八位为退出状态,低八位为终止信号。
想要获取终止信号就得用这个值 & 0x7f;获取退出状态就得用这个变量 向右移动8位再 & 0xff
waitpid接收到了异常信号退出并返回异常信号的值,可以通过kill -l查看对应的异常信息
wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。如果传递NULL,表示不关心子进程的退出状态信息。
否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。
status不能简单的当作整形来看待,可以当作位图来看待
waitpid是系统调用以操作系统身份执行代码,把代码和退出信号设置进status,设置完毕之后把值输入status。等待的本质是检测子进程退出信息,将子进程退出信息通过status传回
阻塞等待是父进程在等待子进程退出时并不会再去做其他的事情
非阻塞等待则是父进程在等待时如果他检测到子进程还没有退出,那它就退出检测去做自己的事情。做完自己的事情后又会检测,直至检测到子进程退出
WNOHANG表示非阻塞,0表示阻塞
进程替换
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数 以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动进程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变
程序替换的本质就是将指定程序的代码和数据覆盖掉当前的代码和数据,让进程去执行新的程序,并不是创建新的进程去执行原来的程序。
替换的调用有:
execl的第一个参数是告诉系统要执行哪个程序,第二个是要怎么执行,后面的是可变参数列表
execl替换为系统中的ls程序并且执行方法带上了 -l 选项,因此第二次printf就不会执行了,已经被替换的程序覆盖掉。如果调用失败就没有发生替换,导致调用失败的原因可能有传入的程序不存在。
execl只有调用失败的返回值,没有调用成功的返回值
子进程的替换不会影响父进程,因为进程具有独立性
execlp不需要传入路径,只需要传入程序名,它会在环境变量中自动查找
execv需要传入路径,第二个参数是一个数组 因此可以把所有的执行参数放入到一个数据中然后传入数组
execvp和execv一样,只不过不需要带路径
execle最后的参数是环境变量必须传入。如果传入了自定义环境变量,那么系统本身的环境变量就不会出来了
exec系列的参数是相当于加载器,进程执行的时候exec先执行main后执行,exec系列函数将程序加载到内存中
以上函数全部都是execve系统调用接口的包装