进程的程序替换(exec函数)【Linux】

简介: 进程的程序替换(exec函数)【Linux】


程序替换的原理

  进程的程序替换就是让子进程执行新程序, 执行全新的代码和数据,不再和父进程有瓜葛。

替换原理

  用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。

  • 也就是说程序替换的作用是为了完成一些特定的任务,需要去执行其他的程序。
  • 使用exec系列函数可以达到程序替换的目的。
  • 程序替换会重新创建虚拟地址,页表,然后将磁盘中的文件加载进物理内存。
  • 程序替换会自动释放原来的进程虚拟内存和页表。
  • 程序替换时, 虚拟地址空间和页表的映射会变化,PCB里的优先级等信息不变。

exec系列函数

  以下函数的参数末尾都一定需要带上一个==“NULL”==。

#include <unistd.h>
// path是要替换的程序文件路径+文件名,main函数的argv参数中是什么,这里就怎么写。
int execl(const char *path, const char *arg, ...);
// 会自动到环境变量PATH中根据file寻找新程序的文件,所以file可以直接写成文件名即可。
int execlp(const char *file, const char *arg, ...);
// 自己可以维护环境变量
int execle(const char *path, const char *arg, ...,char *const envp[]);
// 将命令装入数组中,下面的三个函数其余的跟上面的三个函数都是一样的。
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);

函数理解

  • 这些函数执行成功的话,则加载进新的程序,启动新程序并且从新程序的的开头开始执行,不再返回。
  • 如果执行成功,原程序中的后续代码将不再执行,因为eip(程序计数器),已经改变到新程序处。
  • 如果调用出错则返回-1.
  • 所以exec只有出错的返回值没有成功的返回。毕竟成功的返回值是无意义的。
  • 除了系统文件,也可以替换成自定义文件,如: .sh,python,java都可以调用。

命令理解(助记)

  • l(list) : 表示参数采用列表
  • v(vector) : 参数用数组
  • p(path) : 有p自动搜索环境变量PATH
  • e(env) : 表示自己维护环境变量

关于程序替换中环境变量的解释

  1. 当进行程序替换时,子进程对应的原始环境变量是从父进程中来的,bash拥有最原始的环境变量,后代进程可在其基础上添加并继承自己的父进程的环境变量。
  2. 环境变量被继承是一种默认行为,不受程序替换的影响。(程序替换只替换代码和数据,不替换环境变量)因为创建子进程都以父进程为模板,父子进程的环境变量指向同一块物理地址,所以一样。
  3. 如何让子进程获得环境变量。
  • 将父进程的环境变量原封不动的传递给子进程(1. 直接用。 2. 直接传)。
  • 想传递自己的环境变量,可以直接构建环境变量表,给子进程传递(是覆盖原来环境变量式的传递)
  • 新增传递(可以利用putenv()函数)。

exec函数之间的关系

  事实上,只有execve是真正的系统调用,其它五个函数最终都调用 execve,所以execve, man手册 第2节,其它函数在man手册第3节。这些函数之间的关系如下图所示。

下图exec函数族 一个完整的例子:

exec函数的使用

execl

int execl(const char *path, const char *arg, ...);

// test.cpp:
#include <iostream>
#include <unistd.h>
int main()
{
    pid_t fd = fork();
    if (fd == 0)
    {
        // child
        execl("/root/Y23_12_28/t", "t", "-start", NULL);
    }
    return 0;
}
#include <stdio.h>
int main(int argc, char *argv[])
{
    printf("%s %s\n", argv[0], argv[1]);
    printf("我是t.cpp进程\n");
    return 0;
}

execlp

int execlp(const char *file, const char *arg, ...);

此时我们打印环境变量PATH:

#include <stdio.h>
#include <unistd.h>
#include <cstdlib>
int main(int argc, char *argv[])
{
    printf("%s", getenv("PATH"));
    return 0;
}

打印当前的文件路径cwd:

  对比会发现PATH中没有cwd,若是直接使用execlp的话一定会报错。我们来试一下:

#include <stdio.h>
#include <unistd.h>
int main()
{
    pid_t fd = fork();
    if (fd == 0)
    {
        // child
        int ret = execlp("t", "t", "-start", NULL);
        if (ret < 0)
        {
            printf("execpl错误\n");
        }
    }
    return 0;
}

  果然报错了,原因是PATH中没有cwd,无法自动找到文件位置。所以我们需要添加环境变量,使用putenv()函数,使用这个函数需要注意的是,会将原来的PATH内容全部清除,然后再添加新的PATH。

//test.cpp:
#include <stdio.h>
#include <unistd.h>
#include <cstdlib>
int main()
{
    pid_t fd = fork();
    if (fd == 0)
    {
        char *old_PATH = getenv("PATH");
        char new_PATH[] = ":/root/Y23_12_28";
        char new1[1000];
        sprintf(new1, "PATH=%s%s", old_PATH, new_PATH);
        putenv(new1);
        // child
        int ret = execlp("t", "t", "-start", NULL);
        if (ret < 0)
        {
            printf("execpl错误\n");
        }
    }
    return 0;
}
//t.cpp:
#include <stdio.h>
#include <cstdlib>
#include <unistd.h>
#include <string.h>
int main(int argc, char *argv[])
{
    printf("%s %s\n", argv[0], argv[1]);
    printf("我是t.cpp进程\n");
    return 0;
}

  这里有一个需要注意的地方,就是合并新老PATH时,一定不要忘记PATH=%s%sPATH=

execle

int execle(const char *path, const char *arg, ...,char *const envp[]);

  多出来的这个e表明了可以自己设定环境变量:

// test.cpp
#include <stdio.h>
#include <unistd.h>
#include <cstdlib>
int main()
{
    pid_t fd = fork();
    if (fd == 0)
    {
        char *const envp[] = {"PATH=/root/Y23_12_28", "NULL"};
        // child
        int ret = execle("t", "t", "-start", NULL);
        if (ret < 0)
        {
            printf("execpl错误\n");
        }
    }
    return 0;
}

execv

int execv(const char *path, char *const argv[]);

  v表示使用数组来装载命令, 而不是vector;

#include <stdio.h>
#include <unistd.h>
#include <cstdlib>
int main()
{
    pid_t fd = fork();
    if (fd == 0)
    {
        // child
        char *arg[3] = {"t", "-start", "NULL"};
        int ret = execv("/root/Y23_12_28/t", arg);
        if (ret < 0)
        {
            printf("execpl错误\n");
        }
    }
    return 0;
}

  至于execvp和execve在这里就不过多赘述了。


    😄 创作不易,你的点赞和关注都是对我莫大的鼓励,再次感谢您的观看😄

相关文章
|
13天前
|
Linux
关于Linux目录访问函数总结
关于Linux目录访问函数总结
11 1
|
20天前
|
算法 Linux C++
【Linux系统编程】深入解析Linux中read函数的错误场景
【Linux系统编程】深入解析Linux中read函数的错误场景
196 0
|
20天前
|
存储 算法 Linux
【Linux系统编程】深入理解Linux目录扫描函数:scandir目录函数(按条件扫描目录
【Linux系统编程】深入理解Linux目录扫描函数:scandir目录函数(按条件扫描目录
33 0
|
21天前
|
消息中间件 Linux 调度
【Linux 进程/线程状态 】深入理解Linux C++中的进程/线程状态:阻塞,休眠,僵死
【Linux 进程/线程状态 】深入理解Linux C++中的进程/线程状态:阻塞,休眠,僵死
61 0
|
8天前
|
监控 Linux Shell
初识Linux下进程2
初识Linux下进程2
|
18天前
|
Linux Shell 调度
【Linux】进程排队的理解&&进程状态的表述&&僵尸进程和孤儿进程的理解
【Linux】进程排队的理解&&进程状态的表述&&僵尸进程和孤儿进程的理解
|
20天前
|
存储 Unix Linux
深入理解 Linux 系统下的关键网络接口和函数,gethostent,getaddrinfo,getnameinfo
深入理解 Linux 系统下的关键网络接口和函数,gethostent,getaddrinfo,getnameinfo
13 0
|
20天前
|
监控 Linux Shell
Linux 进程问题调查探秘:分析和排查频繁创建进程问题
Linux 进程问题调查探秘:分析和排查频繁创建进程问题
39 0
|
20天前
|
存储 Linux 程序员
【Linux C/C++ 堆内存分布】深入理解Linux进程的堆空间管理
【Linux C/C++ 堆内存分布】深入理解Linux进程的堆空间管理
66 0
|
20天前
|
存储 算法 Linux
【Linux 系统标准 进程资源】Linux 创建一个最基本的进程所需的资源分析,以及线程资源与之的差异
【Linux 系统标准 进程资源】Linux 创建一个最基本的进程所需的资源分析,以及线程资源与之的差异
24 0