1. fork
#include <unistd.h> pid_t fork(void);
子进程复制父进程的0到3g空间和父进程内核中的PCB,但id号不同。 fork调用一次返回两次
- 父进程中返回子进程ID
- 子进程中返回0
- 读时共享,写时复制
#include <sys/types.h> #include <unistd.h> #include <stdio.h> #include <stdlib.h> int main(void) { pid_t pid; char *message; int n; pid = fork(); if (pid < 0) { perror("fork failed"); exit(1); } if (pid == 0) { message = "This is the child\n"; n = 6; } else { message = "This is the parent\n"; n = 3; } for(; n > 0; n--) { printf(message); sleep(1); } return 0; }
1.1 进程相关函数
#include <sys/types.h> #include <unistd.h> pid_t getpid(void); //返回调用进程的PID号 pid_t getppid(void); //返回调用进程父进程的PID号
getpid/gteppid
#include <unistd.h> #include <sys/types.h> uid_t getuid(void); //返回实际用户ID uid_t geteuid(void); //返回有效用户ID
getuid
#include <unistd.h> #include <sys/types.h> gid_t getgid(void); //返回实际用户组ID gid_t getegid(void); //返回有效用户组ID
getgid
vfork
- 用于fork后马上调用exec函数
- 父子进程,共用同一地址空间,子进程如果没有马上exec而是修改了父进程出得到的变量值,此修改会在父进程中生效
- 设计初衷,提高系统效率,减少不必要的开销
- 现在fork已经具备读时共享写时复制机制,vfork逐渐废弃
2. exec族
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支), 子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的 用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建 新进程,所以调用exec前后该进程的id并未改变。
其实有六种以exec开头的函数,统称exec函数:
#include <unistd.h> int execl(const char *path, const char *arg, ...); int execlp(const char *file, const char *arg, ...); int execle(const char *path, const char *arg, ..., char *const envp[]); int execv(const char *path, char *const argv[]); int execvp(const char *file, char *const argv[]); int execve(const char *path, char *const argv[], char *const envp[]);
这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回,如果调用出错 则返回-1,所以exec函数只有出错的返回值而没有成功的返回值。
这些函数原型看起来很容易混,但只要掌握了规律就很好记。不带字母p(表示 path)的exec函数第一个参数必须是程序的相对路径或绝对路径,例如“/bin/ls”或“./ a.out”,而不能是“ls”或“a.out”。对于带字母p的函数:
如果参数中包含/,则将其视为路径名。 否则视为不带路径的程序名,在PATH环境变量的目录列表中搜索这个程序。 带有字母l(表示list)的exec函数要求将新程序的每个命令行参数都当作一个参数传
给它,命令行参数的个数是可变的,因此函数原型中有...,...中的最后一个可变参数应该是 NULL,起sentinel的作用。对于带有字母v(表示vector)的函数,则应该先构造一个指向 各参数的指针数组,然后将该数组的首地址当作参数传给它,数组中的最后一个指针也应该 是NULL,就像main函数的argv参数或者环境变量表一样。
对于以e(表示environment)结尾的exec函数,可以把一份新的环境变量表传给它,其 他exec函数仍使用当前的环境变量表执行新程序。
exec调用举例如下:
char *const ps_argv[] ={"ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL}; char *const ps_envp[] ={"PATH=/bin:/usr/bin", "TERM=console", NULL}; execl("/bin/ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL); execv("/bin/ps", ps_argv); execle("/bin/ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL, ps_envp); execve("/bin/ps", ps_argv, ps_envp); execlp("ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL); execvp("ps", ps_argv);
事实上,只有execve是真正的系统调用,其它五个函数最终都调用execve,所以execve 在man手册第2节,其它函数在man手册第3节。这些函数之间的关系如下图所示。
一个完整的例子:
#include <unistd.h> #include <stdlib.h> int main(void) { execlp("ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL); perror("exec ps"); exit(1); }
由于exec函数只有错误返回值,只要返回了一定是出错了,所以不需要判断它的 返回值,直接在后面调用perror即可。注意在调用execlp时传了两个“ps”参数,第一 个“ps”是程序名,execlp函数要在PATH环境变量中找到这个程序并执行它,而第二 个“ps”是第一个命令行参数,execlp函数并不关心它的值,只是简单地把它传给ps程 序,ps程序可以通过main函数的argv[0]取到这个参数。
调用exec后,原来打开的文件描述符仍然是打开的。利用这一点可以实现I/O重定向。 先看一个简单的例子,把标准输入转成大写然后打印到标准输出:
例 upper
/* upper.c */ #include <stdio.h> int main(void) { int ch; while((ch = getchar()) != EOF) { putchar(toupper(ch)); } return 0; }
例 wrapper
/* wrapper.c */ #include <unistd.h> #include <stdlib.h> #include <stdio.h> #include <fcntl.h> int main(int argc, char *argv[]) { int fd; if (argc != 2) { fputs("usage: wrapper file\n", stderr); exit(1); } fd = open(argv[1], O_RDONLY); if(fd<0) { perror("open"); exit(1); } dup2(fd, STDIN_FILENO); close(fd); execl("./upper", "upper", NULL); perror("exec ./upper"); exit(1); }
wrapper程序将命令行参数当作文件名打开,将标准输入重定向到这个文件,然后调用 exec执行upper程序,这时原来打开的文件描述符仍然是打开的,upper程序只负责从标准输 入读入字符转成大写,并不关心标准输入对应的是文件还是终端。运行结果如下:
- l 命令行参数列表
- p 搜素file时使用path变量
- v 使用命令行参数数组
- e 使用环境变量数组,不使用进程原有的环境变量,设置新加载程序运行的环境变量
3. 总结
本文介绍了进程原语:fork和exec。 fork调用一次返回两次:父进程中返回子进程ID ;子进程中返回0;读时共享,写时复制。