Linux进程控制【进程程序替换】

简介: 子进程 在被创建后,共享的是 父进程 的代码,如果想实现自己的逻辑就需要再额外编写代码,为了能让 子进程 执行其他任务,可以把当前 子进程 的程序替换为目标程序,此时需要用到 Linux 进程程序替换相关知识子进程 替换为其他程序后,无法再执行原有程序,但 进程 始终为同一个

✨个人主页: Yohifo
🎉所属专栏: Linux学习之旅
🎊每篇一句: 图片来源
🎃操作环境: CentOS 7.6 阿里云远程服务器

  • Good judgment comes from experience, and a lot of that comes from bad judgment.

    • 好的判断力来自经验,其中很多来自糟糕的判断力。

    image.png

🌇前言

子进程 在被创建后,共享的是 父进程 的代码,如果想实现自己的逻辑就需要再额外编写代码,为了能让 子进程 执行其他任务,可以把当前 子进程 的程序替换为目标程序,此时需要用到 Linux 进程程序替换相关知识

子进程 替换为其他程序后,无法再执行原有程序,但 进程 始终为同一个

火爆全网的 ChatGTP 能否替换 “人类” ?

image.png


🏙️正文

1、为何要进行程序替换?

在学习相关函数前,先要弄清楚为何要进行程序替换?

  • 将运行中的程序看作一个 任务处理平台
  • 由我们发出指令,交给 任务处理平台 去完成
  • 因为每次发出的指令都可能不相同,所以 任务处理平台 中的代码不能固化
  • 为了解决这个问题,任务处理平台 可以通过创建子进程,让子进程完成对应指令
  • ==子进程实现对应指令依赖于程序替换==

==总结:== 程序替换的目的是让子进程帮我们执行特定任务

就像汽车拥有各种各样的轮胎,如越野时需要换上路面兼容性更好、更耐造的越野胎;日常家用时,舒适性更好、胎噪更小的轮胎显然就更合适了,针对不同的使用场景替换不同的轮胎,程序替换时也是这么个意思,执行特定任务

image.png

shell 外壳中的 bash 就是一个任务处理平台,当我们发出指令,如 lspwdtouch 等指令时后,bash 会创建子进程,将其替换为对应的指令程序并执行任务,就能实现各种指令

bash原理.gif

进程程序替换图解

  • Linux 中的指令都是用 C语言 写的可执行程序,所以可以进行替换
  • bash 运行后,输入 指令 本质上就是在进行程序替换

image.png

关于简易版 bash 的实现方法,将在下篇文章中揭晓


2、七大替换函数

进程程序替换函数共有七个,其中六个都是在调用函数6,因此函数6 execve 才是真正的系统级接口

image.png

各种替换函数间的关系

image.png

这些函数都属于 exec 替换家族,所以它们的返回值都一样

注意: 这七个函数只有在程序替换失败后才会有返回值,返回 -1,程序替换成功后不返回

程序都已经替换成功,后续代码也都将被替换,所以成功后的返回值也就没意义了

2.1、函数1 execl

首先是最简单的替换函数 execl

#include <unistd.h>

int execl(const char* path, const char* arg, ...);

函数解读

  • 返回值:替换失败返回 -1
  • 参数1:待替换程序的路径,如 /usr/bin/ls
  • 参数2:待替换程序的名称,如 ls
  • 参数3~N:待替换程序的选项,如 -a -l等,最后一个参数为 NULL,表示选项传递结束
  • ... 表示可变参数列表,可以传递多个参数

image.png

注意: 参数选项传递结束或不传递参数,都要在最后加上 NULL,类似于字符串的 '\0'

#include <stdio.h>
#include <unistd.h>

int main()
{
  //execl 函数
  printf("程序替换前,you can see me\n");
  int ret = execl("/usr/bin/ls", "ls", "-a", "-l", NULL);

  //程序替换多发生于子进程,也可以通过子进程的退出码来判断是否替换成功
  if(ret == -1)
    printf("程序替换失败!\n");

  printf("程序替换后,you can see me again?\n");
  return 0;
}

image.png

可以看出,函数 execl 中的 命令+选项+NULL 是以 链式 的方式进行传递的

image.png

2.2、函数2 execv

替换函数 execv 是以顺序表 vector 的方式传递 参数2~N

#include <unistd.h>

int execv(const char* path, char* const argv[]);

函数解读

  • 返回值:替换失败返回 -1
  • 参数1:待替换程序的路径,如 /usr/bin/ls
  • 参数2:待替换程序名及其命名构成的 指针数组,相当于一张表

image.png

注意: 虽然 execv 只需传递两个参数,但在创建 argv 表时,最后一个元素仍然要为 NULL

#include <stdio.h>
#include <stdlib.h> //exit 函数头文件
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

int main()
{
  //execv 函数
  pid_t id = fork();
  if(id == 0)
  {
    printf("子进程创建成功 PID:%d   PPID:%d\n", getpid(), getppid());
    char* const argv[] = 
    {
      "ls",
      "-a",
      "-l",
      NULL
    };    //argv 表,实际为指针数组

    execv("/usr/bin/ls", argv);

    printf("程序替换失败\n");
    exit(-1); //如果子进程有此退出码,说明替换失败
  }

  int status = 0;
  waitpid(id, &status, 0); //父进程阻塞等待
  if(WEXITSTATUS(status) != 255)
  {
    printf("子进程替换成功,程序正常运行 exit_code:%d\n", WEXITSTATUS(status));
  }
  else
  {
    printf("子进程替换失败,异常终止 exit_code:%d\n", WEXITSTATUS(status));
  }

  return 0;
}

正常运行的情况

image.png

错误运行的情况,改变 path

execv("/usr/bin", argv); //故意提供错误路径

image.png

execl 函数不同,execv 是以表的形式进行参数传递的

image.png

2.3、函数3 execlp

可能有的人觉得写 path 路径很麻烦,还有可能会写错,那么能否换成 自动挡 替换呢?

答案是可以的,execlp 函数在进行程序替换时,可以不用写 path 路径

#include <unistd.h>

int execlp(const char* file, const char* arg, ...);

函数解读

  • 返回值:替换失败返回 -1
  • 参数1:待替换程序名,如 lspwdclear
  • 参数2~N:可变参数列表,为命令的选项

execlp 就像是 execl 的升级版,可以自动到 PATH 变量中查找程序

注意: 只能在环境变量表中的 PATH 变量中搜索,如果待程序路径没有在 PATH 变量中,是无法进行替换的

#include <stdio.h>
#include <stdlib.h> //exit 函数头文件
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

int main()
{
  //execlp 函数
  pid_t id = fork();
  if(id == 0)
  {
    printf("you can see me\n");

    execlp("ls", "ls", "-a", "-l", NULL); //程序替换

    printf("you can see me again?");
    exit(-1);
  }

  int status = 0;
  waitpid(id, &status, 0);  //等待阻塞
  if(WEXITSTATUS(status) != 255)
    printf("子进程替换成功 exit_code:%d\n", WEXITSTATUS(status));
  else
    printf("子进程替换失败 exit_code:%d\n", WEXITSTATUS(status));

  return 0;
}

image.png

使用 execlp 替换程序更加方便,只要待替换程序路径位于 PATH 中,就不会替换失败

2.4、函数4 execvp

execv 加个 p 也能实现自动查询替换,即 execvp

#include <unistd.h>

int execvp(const char* file, char* const argv[]);

函数解读

  • 返回值:替换失败返回 -1
  • 参数1:待替换程序名,需要位于 PATH
  • 参数2:待替换程序名及其命名构成的 指针数组
#include <stdio.h>
#include <stdlib.h> //exit 函数头文件
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

int main()
{
  //execvp 函数
  pid_t id = fork();
  if(id == 0)
  {
    printf("子进程创建成功 PID:%d   PPID:%d\n", getpid(), getppid());
    char* const argv[] = 
    {
      "ls",
      "-a",
      "-l",
      NULL
    };

    execvp("ls", argv);

    printf("程序替换失败\n");
    exit(-1); //如果子进程有此退出码,说明替换失败
  }

  int status = 0;
  waitpid(id, &status, 0); //父进程阻塞等待
  if(WEXITSTATUS(status) != 255)
  {
    printf("子进程替换成功,程序正常运行 exit_code:%d\n", WEXITSTATUS(status));
  }
  else
  {
    printf("子进程替换失败,异常终止 exit_code:%d\n", WEXITSTATUS(status));
  }

  return 0;
}

image.png

假若参数1 file 的路径不在 PATH 中,程序会替换错误

execvp("a.out", argv);

image.png

如果想替换自己写的程序,那么只需要将路径添加至 PATH 中即可

2.5、函数5 execle

e 表示 env 环境变量表,可以将自定义或当前程序中的环境变量表传给待替换程序

#include <unistd.h>

int execl(const char* path, const char* arg, ..., char* const envp[]);

函数解读

  • 最后一个参数:替换成功后,待替换程序的环境变量表,可以自定义
char* const myenv[] = {"myval=100", NULL};  //自定义环境变量表

execle("./other/CPP", NULL, myenv); //程序替换

替换为自己写的程序 CPP

//当前源文件为 test.cc 即 C++源文件
// .xx 后缀也可以表示 C++源文件
#include <iostream>

using namespace std;

extern char** environ;    //声明环境变量表

int main()
{
  int pos = 0;
  //只打印5条
  while(environ[pos] && pos < 5)
  {
    cout << environ[pos++] << endl;
  }
  return 0;
}

按照预期替换程序并传入自定义环境变量表后

image.png

可以看到,程序 CPP 中的环境变量表变成了自定义环境变量,即只有一个环境变量 myval=100

改变 execle 最后一个参数,传入默认环境变量表

 extern char** environ;

 execle("./other/CPP", NULL, environ); //继承环境变量表

image.png

结论: 如果主动传入环境变量后,待替换程序中的原环境变量表将被覆盖

现在可以理解为什么在 bash 中创建程序并运行,程序能继承 bash 中的环境变量表了

  • bash 下执行程序,等价于在 bash 下替换子进程为指定程序,并将 bash 中的环境变量表 environ 传递给指定程序使用
  • 其他没有带 e 的替换函数,默认传递当前程序中的环境变量表

image.png

2.6、函数6 execve

execve 是系统真正提供的程序替换函数,其他替换函数都是在调用 execve

比如

  • execl 相当于将链式信息转化为 argv 表,供 execve 参数2使用
  • execlp 相当于在 PATH 中找到目标路径信息后,传给 execve 参数1使用
  • execleenvp 最终也是传给 execve 中的参数3
#include <unistd.h>

int execve(const char* filename, char* const argv[], char* const envp[]);

函数解读

  • 返回值:替换失败返回 -1
  • 参数1:待替换程序的路径
  • 参数2:待替换程序名及其参数组成的 argv
  • 参数3:传递给待替换程序的环境变量表

替换 ls -a -l 程序

extern char** environ;

execve("/usr/bin/ls", argv, environ);

image.png

替换为自定义程序 CPP

extern char** environ;

execve("./other/CPP", argv, environ);

image.png

替换函数除了能替换为 C++ 编写的程序外,还能替换为其他语言编写的程序,如 JavaPythonPHP等等,虽然它们在语法上各不相同,但在 OS 看来都属于 可执行程序,数据位于 代码段数据段,直接替换即可

系统级接口是不分语言的,因为不论什么语言最终都需要调用系统级接口,比如文件流操作中的 openclosewrite 等函数,无论什么语言的文件流操作函数都需要调用它们

2.7、函数7 execvpe

execvp 的再一层封装,使用方法与 execvp 一致,不过最后一个参数可以传递环境变量表

#include <unistd.h>

int execvpe(const char* file, char* const argv[], char* const envp[]);

函数解读

  • 返回值:替换失败返回 -1
  • 参数1:待替换程序名,需要位于 PATH
  • 参数2:待替换程序名及其命名构成的 指针数组
  • 参数3:传递给待替换程序的环境变量表
extern char** environ;

execvpe("ls", argv, environ);

image.png


3、补充

最后再补充一些关于程序替换的知识

3.1、函数名记忆

七大替换函数按 程序名+选项 传递方式可以分为两组

  • 列表:execlexeclpexecle
  • 顺序:execvexecvpexecveexecvpe

可以看出,列表传递中必有 l,顺序传递则必有 v,函数名中字符的含义如下

  • exec 该函数隶属于程序替换家族
  • llist,列表传递
  • vvector,顺序传递
  • p 表示 PATH,根据程序名自动在 PATH 中查找
  • e 则是 environ,是否手动传递环境变量表

3.2、替换现象

子进程程序替换后,并不会创建新进程,而是对原有程序中的 数据代码 进行修改,可以通过替换以下程序观察

#include <iostream>
#include <unistd.h>

using namespace std;

int main()
{
  while(1)
  {
    cout << "程序替换成功";
    cout << " PID:" << getpid() << "   PPID:" << getppid() << endl;
    sleep(1);
  }

  return 0;
}

image.png

可以看到在进行程序替换后,子进程和待替换程序为同一个进程

  • 这就表明程序替换并不是进程替换
  • 因为是同一个进程,所以对父进程没有任何影响,体现了进程间的独立性

在子进程执行程序替换前,子进程和父进程共享一份只读区域的数据,但因为发生了程序替换,触发 写时拷贝 机制,令子进程读取另一块区域的数据

  • 写时拷贝 在只读数据区也能触发,因为不能影响到父进程

image.png


🌆总结

以上就是本篇关于 Linux 进程程序替换的相关内容了,在本文中,我们知道了进行程序替换的目的,学习使用了程序替换相关的七大函数,最后还观察了程序替换后的神奇现象,在学完这些知识后,我们就可以实现一个简单的 bash,体验一下在自己程序中输入指令操控 Linux 的奇妙体验

如果你觉得本文写的还不错的话,期待留下一个小小的赞👍,你的支持是我分享的最大动力!

如果本文有不足或错误的地方,随时欢迎指出,我会在第一时间改正


1658489422102.jpg.jpg

相关文章推荐


Linux进程控制【创建、终止、等待】


===============


Linux进程学习【进程地址】

Linux进程学习【环境变量】

Linux进程学习【进程状态】

Linux进程学习【基本认知】


承蒙厚爱,感谢支持.gif

目录
相关文章
|
3天前
|
安全 小程序 Linux
Linux中信号是什么?Ctrl + c后到底为什么会中断程序?
信号在进程的学习中是一个非常好用的存在,它是软件层次上对中断机制的一种模拟,是异步通信方式,同时也可以用来检测用户空间到底发生了什么情况,然后系统知道后就可以做出相应的对策。
|
3天前
|
小程序 Linux
【编程小实验】利用Linux fork()与文件I/O:父进程与子进程协同实现高效cp命令(前半文件与后半文件并行复制)
这个小程序是在文件IO的基础上去结合父子进程的一个使用,利用父子进程相互独立的特点实现对数据不同的操作
|
3天前
|
SQL 自然语言处理 网络协议
【Linux开发实战指南】基于TCP、进程数据结构与SQL数据库:构建在线云词典系统(含注册、登录、查询、历史记录管理功能及源码分享)
TCP(Transmission Control Protocol)连接是互联网上最常用的一种面向连接、可靠的、基于字节流的传输层通信协议。建立TCP连接需要经过著名的“三次握手”过程: 1. SYN(同步序列编号):客户端发送一个SYN包给服务器,并进入SYN_SEND状态,等待服务器确认。 2. SYN-ACK:服务器收到SYN包后,回应一个SYN-ACK(SYN+ACKnowledgment)包,告诉客户端其接收到了请求,并同意建立连接,此时服务器进入SYN_RECV状态。 3. ACK(确认字符):客户端收到服务器的SYN-ACK包后,发送一个ACK包给服务器,确认收到了服务器的确
|
2天前
|
Java 调度 Windows
Java面试之程序、进程、线程、管程和并发、并行的概念
Java面试之程序、进程、线程、管程和并发、并行的概念
8 0
进程管理,每一个程序运行,都会有一个独有的ID,进程号
进程管理,每一个程序运行,都会有一个独有的ID,进程号
|
3天前
|
运维 监控 大数据
部署-Linux01,后端开发,运维开发,大数据开发,测试开发,后端软件,大数据系统,运维监控,测试程序,网页服务都要在Linux中进行部署
部署-Linux01,后端开发,运维开发,大数据开发,测试开发,后端软件,大数据系统,运维监控,测试程序,网页服务都要在Linux中进行部署
|
7天前
|
缓存 Linux 调度
【linux】进程控制——进程创建,进程退出,进程等待
【linux】进程控制——进程创建,进程退出,进程等待
|
7天前
|
Linux
【Linux】进程地址空间
【Linux】进程地址空间
|
2月前
|
Linux Shell 调度
【Linux】7. 进程概念
【Linux】7. 进程概念
50 3
|
2月前
|
存储 缓存 Linux
【Linux】进程概念(冯诺依曼体系结构、操作系统、进程)-- 详解
【Linux】进程概念(冯诺依曼体系结构、操作系统、进程)-- 详解