【Linux】进程理解与学习-程序替换

简介: 【Linux】进程理解与学习-程序替换

前言



在前文,我们学习了fork函数创建子进程,而创建子进程主要就是为了让它帮我们执行特定的任务。而我们之前所学的都只是为了让子进程帮我们执行父进程的部分代码(通过执行流分流的方式),并没有执行一个全新的程序。但实际上子进程也是可以执行一个新的程序。子进程可以通过程序替换的方式将父进程的代码与数据替换成新的程序对应的代码与数据。本文将对此进行探讨。


程序替换



进程可以通过程序替换的方式来执行一个全新的程序,具体的做法则是通过对应的程序替换的几个系统调用函数来实现,下面先来看一下程序替换的现象,根据这个现象来分析程序替换实现的原理。


程序替换的现象


接下来我们通过该现象对此进行分析,现象如下:


1.png


我们可以看到,我们最终的执行结果并不是像我们想象的那样,而是将本该打印的end给替换成了执行ls这个指令。那么具体的原理是怎样的呢?如下图所示:


程序替换的原理


原理图解


2.png


通过上图,也解释了为什么在执行我们的进程时,execl函数后面的end的打印并没有执行,因为在我们执行完打印begin后,开始调用系统调用函数execl,将新的程序(ls)的代码与数据加载到内存对应的位置,将老进程的代码与数据给替换掉,所以就执行不了后面的打印end指令了。(这里注意的是,程序替换是实现的代码与数据的整体替换)


那么这里不仅有一个问题:在进程替换时,有没有产生新的进程呢?


答案是没有的,因为我们仅仅只是将老进程里面的代码与数据,替换成新程序的代码与数据,实现程序替换。并没有产生新的进程。正如上图所示,原进程对应的pcb并没有发生改变,也没有产生新的pcb。


当然我们也可以通过代码来验证一下:


3.png


多进程对应的程序替换


当然,假如我们使用fork创建子进程,让子进程完成程序替换,子进程的程序替换并不会影响父进程,这是因为父子进程都有各自独立的PCB,并且由于写时拷贝机制的存在,使得父子进程互相独立,互不影响。


4.png


程序替换函数


接下来我们讲一下几个程序替换函数。总体一共有7个,其中这七个里的六个实际上底层都是调用第七个。总体如下:


5.png


exec函数家族关系


对于这些exec函数,它们都只具有失败时候的返回值,当程序替换失败时,会返回-1,同时继续往后执行exec后面的指令,当替换成功时会直接执行替换后的新程序。接下来逐一介绍。


execl函数


首先介绍的是execl函数,我们在上面的演示中用到的就是该函数。


int execl(const char *path, const char *arg, ...);

对于该函数来说:


返回值:失败返回-1,替换成功执行新程序。

path参数:新程序的路径位置(找到它)

arg参数:新程序名称(执行它)

...:可变参数,这里表示命令行参数选项(就比如上文所示-a -l),以NULL结尾。

举例:


6.png


execv

int execv(const char *path, char *const argv[]);


该函数我们发现,之前的l变成了v,实际上其实就是用了一个函数指针数组,将之前的"ls","-a","-l"的地址放进数组里,数组最后一位元素为NULL,然后将该指针数组的起始地址(数组名),当作execv的第二个参数。


对于该函数来说:


返回值:替换失败返回-1

path参数:程序所在路径

argv[]:指针数组的地址(数组名)

举例:


7.png


execlp

int execlp(const char *file, const char *arg, ...);


对于该函数,我们发现之前的path参数更换成了file,然后函数名中加了个p,其实代表的意思就是,会在PATH环境变量中根据file名查找file的路径,后面的参数代表的与execl一样。


对于该函数:


返回值:替换失败返回-1

file传程序名,会根据程序名自动在PATH中搜索该程序对应的路径。(找到它,不需要我们传具体的路径,会自动匹配)

后面的arg表示程序名(执行它)

...:可变参数,表示新程序的命令行参数选项(怎么执行,比如:-a -l),以NULL结尾

举例:


8.png


不过这里需要注意的是,自动搜索匹配路径是指在PATH环境变量中搜寻,假如一个新程

序的路径并不在PATH中,则会匹配不上,就导致替换失败。如下:


9.png


程序替换失败


execvp


我们发现,该函数变成了vp结尾,v表示数组(指针数组)的形式,p表示自动搜索匹配环境变量PATH中的路径。


int execvp(const char *file, char *const argv[]);

对于该函数:


返回值:替换失败返回-1

file:程序名,会根据程序名自动搜索在PATH中对应的路径

argv[]:指针数组,用法同execv

举例:


10.png


同样,这里自动匹配路径指的是在PATH中搜索,假如我们想要执行替换自己写的程序,就要将我们写的程序的路径用export导入环境变量即可。


execle


这里的e,表示environ,即表示环境变量表。也就是说,我们可以将当前程序的替换成新程序,同时将老的环境变量表也传给新程序。


int execle(const char *path, const char *arg,
                  ..., char * const envp[]);

对于该函数:


返回值:替换失败返回-1

用法同execl,只是最后加了一个参数,用来传给新程序环境变量表(这个环境变量表可以是自己定义,也可以是系统的)。

当然如果将自定义的环境变量表传给新程序的话,新程序的原有的系统环境变量表就会被覆盖掉。

举例:


11.png


execvpe


我们发现,这里v(数组)、p(PATH)、e(环境变量表),三者都集齐了。  


int execvpe(const char *file, char *const argv[],
                   char *const envp[]);

对于该函数:


返回值:替换失败返回-1

file:会自动根据file匹配PATH中的路径,不需要我们手动写全

argv[]:指针数组

envp[]:环境变量表(可以是系统的,也可以是自定义的)

举例:


newtest程序:


#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
 int main()
 {
   extern char** environ;
   printf("我是新程序,我的环境变量表中的前三个环境变量是:\n");                                                                               
   for(int i=0;i<3; ++i)
   {
     printf("%d:%s\n",i,environ[i]);
   }
   return 0;
 }

运行newtest:


12.png


mytest程序:实现程序替换(在此之前已经将newtest的路径导入了PATH)


#include<stdio.h>
 #include<unistd.h>
 #include<stdlib.h>
 #include<sys/types.h>
 #include<sys/wait.h>
 #include<fcntl.h>
 int main()
 {
   pid_t id=fork();//创建子进程
   if(id == 0)
   {
     //child
    printf("我是子进程,pid:%d\n",getpid());
    char*const envp[]={"myval=520",NULL};//自定义环境变量表
    const char* argv[]={"newtest",NULL};//指针数组
    execvpe("newtest",argv,envp);//注意:我已经将newtest的路径导进了PATH
    printf("程序替换失败\n");                                                                                                               
    exit(1);
  }
   //father
   int status=0;
   waitpid(id,&status,0);//进程等待
   if(WEXITSTATUS(status)!=1)
   {
     printf("进程替换成功\n");
   }
   return 0;
 }

13.png


已经将新程序路径导入环境变量


14.png


execve

execve为最正宗的系统调用函数,我们这里讲解的其它的系统调用其实底层都是调用了该函数。


int execve(const char *filename, char *const argv[],
                  char *const envp[]);

对于该函数:


替换失败返回-1

参数filename:表示新程序的路径(找到它)

argv[]:指针数组,存放新程序名(执行它),以及程序对应的命令行参数列表(比如ls的-a -l),最后以NULL结束。

envp[]:环境变量表(可自定义),传入环境变量表后,新程序的老的环境变量表就被这里的envp环境变量表给覆盖了。

举例:


15.png


额外补充


对于以上的这么多系统调用函数,可能看了都头大,但是仔细看,其实会有很多共性,可以利用这 个特点来更加巧妙地记住这些函数的用法。


联想记忆exec函数家族:


带有l的:l联想list,所以参数中要带有NULL,就好像一个链表一样。("ls", "-l"," -a"," NULL)

带有v的:v联想vector,说明第二个参数传的是个数组(指针数组)

带有p的:p联想PATH,说明第一个参数不需要我们传具体的路径,只需要传个程序名即可(会自动搜索PATH路径进行匹配)。

带有e的:说明最后一个参数是用来传环境变量表(也可以是自定义的环境变量表)的


相关文章
|
27天前
|
算法 Linux 调度
深入理解Linux操作系统的进程管理
本文旨在探讨Linux操作系统中的进程管理机制,包括进程的创建、执行、调度和终止等环节。通过对Linux内核中相关模块的分析,揭示其高效的进程管理策略,为开发者提供优化程序性能和资源利用率的参考。
62 1
|
2月前
|
Linux 编译器 开发工具
【Linux快速入门(三)】Linux与ROS学习之编译基础(Cmake编译)
【Linux快速入门(三)】Linux与ROS学习之编译基础(Cmake编译)
100 2
|
2月前
|
存储 安全 Linux
|
15天前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
75 13
|
22天前
|
SQL 运维 监控
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
|
30天前
|
运维 监控 Linux
Linux操作系统的守护进程与服务管理深度剖析####
本文作为一篇技术性文章,旨在深入探讨Linux操作系统中守护进程与服务管理的机制、工具及实践策略。不同于传统的摘要概述,本文将以“守护进程的生命周期”为核心线索,串联起Linux服务管理的各个方面,从守护进程的定义与特性出发,逐步深入到Systemd的工作原理、服务单元文件编写、服务状态管理以及故障排查技巧,为读者呈现一幅Linux服务管理的全景图。 ####
|
2月前
|
缓存 算法 Linux
Linux内核的心脏:深入理解进程调度器
本文探讨了Linux操作系统中至关重要的组成部分——进程调度器。通过分析其工作原理、调度算法以及在不同场景下的表现,揭示它是如何高效管理CPU资源,确保系统响应性和公平性的。本文旨在为读者提供一个清晰的视图,了解在多任务环境下,Linux是如何智能地分配处理器时间给各个进程的。
|
2月前
|
存储 运维 监控
深入Linux基础:文件系统与进程管理详解
深入Linux基础:文件系统与进程管理详解
89 8
|
2月前
|
网络协议 Linux 虚拟化
如何在 Linux 系统中查看进程的详细信息?
如何在 Linux 系统中查看进程的详细信息?
141 1
|
2月前
|
Linux
如何在 Linux 系统中查看进程占用的内存?
如何在 Linux 系统中查看进程占用的内存?