😊1. 进程替换的概念
我们在使用fork()系统调用之后,创建出来的子进程是对父进程的复制,也就是说子进程和父进程执行的是相同的程序,虽然说父子进程可能执行的是不同的代码分支(if else语句),但是程序流程是一样。我们要想在新创建的子进程中执行其他程序,需要调用一种exec函数来拉起一个新的进程。当进程调用一种exec函数的时候,该进程的用户空间代码和数据全部被新程序替换掉,从新程序的启动例程开始执行。需要注意的是,调用exec并不会创建新进程,而是一种进程替换,所以调用exec前后,进程本身的ID不会改变。
调用exec函数的时候,会把当前进程的 .text 和 .data 替换为所要加载的程序的 .text 和 .data ,然后让进程从新的进程的 .text 段的第一条指令开始执行,但是进程ID不变,也就是说壳子没变,但壳子里的东西变了。
exec开头的函数总共有6种,统称exec函数族,下面着重介绍exec函数族种中重要的几个函数原型。
😄2. exec函数族函数原型介绍
- 包含头文件及函数原型
#include <unistd.h> extern char **environ; int execl(const char *path, const char *arg, ...); int execlp(const char *file, const char *arg, ...); int execle(const char *path, const char *arg, ..., char * const envp[]); int execv(const char *path, char *const argv[]); int execvp(const char *file, char *const argv[]);
- 函数族介绍
The exec() family of functions replaces the current process image with a new process image. 用新的进程映像替换原来的进程映像。exec函数族的命令是有一定的规律的,l表示list,就是参数列表的意思;p代表PATH,所以带p的参数都是file,不带p的参数都是path;e代表环境变量,我们可以设置这个环境变量,比如execle()有一个参数envp[]就是设置环境变量的;v表示vector,我们可以把参数放到一个数组中,然后把数组传给execv()。 - 函数参数
- path:
- file:要执行的程序名。
- arg:参数列表,最后需要一个NULL作为结尾,这个NULL实际上就是一个哨兵,来告诉程序参数列表到此结束。另外参数arg是从arg[0]开始的,而arg[0]是这个程序本身,所以在写参数列表的时候需要先写一个程序本身来占位(实际上是个占位参数)。
- 返回值
If any of the exec() functions returns, an error will have occurred. The return value is -1, and errno will be set to indicate the error. exec函数只有在出错的时候才会返回,如果不出错就不会再返回回来了。
这里面重要的是前两个execl和execlp函数,它们都用于使用一个新的进程去替换原来的进程,也就是在新创建的进程中执行其他程序。execlp中的p是指PATH环境变量,在执行程序的时候execlp会使用PATH环境变量,这样在执行程序的时候就可以不用加路径了,因为它使用了环境变量PATH,通过这个环境变量就能够找到路径,而execl就需要加路径,通过它们的第一个参数也能看出来,execl第一个参数是path,而execlp第一个参数是file。
示例: 通过execlp函数使用来演示exec函数的返回值和参数
/************************************************************ >File Name : exec_test.c >Author : Mindtechnist >Company : Mindtechnist >Create Time: 2022年05月19日 星期四 19时36分51秒 ************************************************************/ #include <stdio.h> #include <stdlib.h> #include <unistd.h> int main(int argc, char* argv[]) { execlp("ls"/*用ls代替当前main进程*/, "ls"/*占位参数*/, \ "-lrt"/*参数列表,ls进程的参数*/, NULL/*哨兵,参数列表结束标志*/); /*只有出错才会返回,如果不出错的话,就不会再返回该程序*/ perror("execlp err"); /*测试execlp成功式是否会返回,如果这句话没有打印,说明没有返回*/ printf("test...\n"); return 0; }
这样我们在执行exec_test程序的时候会被直接替换为 ls -lrt 进程,并且我们的测试语句printf没有打印,这说明execlp()函数执行成功后不会返回。你可能会奇怪,这样执行的ls和直接在shell下执行ls不太一样,它没有用颜色区分出可执行文件(绿色),实际上shell下的ls是一个别名,别名中使用了自动颜色的参数
如果用execl()函数去实现,就要加路径名
int main() { /*根据写入的路径去搜索要执行的程序*/ execl("/bin/ls", "ls", "-l", "--color=auto", NULL); return 0; }
😆3. exec函数族的调用关系
我们在上面列出的5个exec函数最终都会调用execve系统调用,我们在查man手册的时候也能发现,上面5个在第3章,使用 man 3 execl 就可以把5个函数一块查到,而execve是一个系统调用,它在第二章。
#include <unistd.h> int execve(const char *filename, char *const argv[], char *const envp[]);
😋4. shell进程执行命令的原理
exec函数族的作用使用了替换进程的,但是exec函数有个特点就是,一旦执行成功就不会再返回了。试想一下,加入我们在shell下拉起一个进程,成功后就直接去到其它进程了,而不会再返回shell进程,这显然是不可行的。实际上shell是先fork()一个进程,然后在fork()创建的子进程中使用exec函数来拉起一个其它进程,这样fork()后的两个进程有一个是shell进程,一个是我们需要执行的进程,这才是exec函数的应用场景,也就是说exec函数族是和fork()函数一块使用的。实际上这也是shell执行命令的原理。