Linux之进程(五)(进程控制)

简介: Linux之进程(五)(进程控制)



一、进程创建

在之前的学习中,我们已经简单使用了fork函数创建一个进程。下面我们来具体讲一讲fork创建进程。

1、fork函数创建进程

在linux中fork函数是一个非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。

返回值:子进程中返回0,父进程返回子进程pid,创建进程出错则返回-1。

上面这些我们非常熟悉了。接着我们来看看下面的内容。

进程调用fork,当控制转移到内核中的fork代码后,内核做:

1、分配新的内存块和内核数据结构给子进程

2、将父进程部分数据结构内容拷贝至子进程

3、添加子进程到系统进程列表当中

4、fork返回,开始调度器调度

fork之后,父子进程代码共享(即fork之前的代码由父进程独立执行,而fork之后的代码父子两个执行流分别执行)。并且,fork之后,父进程和子进程谁先执行完全由调度器决定。

因为代码是只读的,所以代码可以完全共享。虽然代码是父子共享的,但是,有的数据必须分离,要各自都有一份。于是我们就要用到写时拷贝的技术,而这我们已经在上一节进程地址空间中讲到了。

那么,为什么我们不在创建进程的时候,就直接拷贝分离呢?下面我们来具体讲一讲。

我们创建子进程的目的是为了让它去帮助我们完成和父进程不一样的任务,而不一样的任务所需要用到的数据可能是不一样的。而操作系统无法提前知道子进程需要什么数据来完成任务。比如:有的数据是只读的,所以父子进程完全可以共享,而有的数据又可写,为了不让父进程数据的修改影响子进程或者子进程数据的修改影响父进程,我们要写时拷贝。

简单来说,如果全部拷贝,那么我们可能会将一些子进程不会用到的数据拷贝一份,这样就浪费空间,而且效率低下。即使要用到,但是只是读取,完全可以父子进程共享数据,避免空间中有两份一模一样的数据。

所以将来会被父或子进程修改的数据值得拷贝。但即使是操作系统也无法预先知道谁会被访问修改,所以要用写时拷贝技术。

2、fork函数的返回值

~  fork函数为什么有两个返回值

fork之后,有两个执行流,父子进程代码是共享的,所以return会被调度两次,被父子进程各自执行return的。

~ 为什么父进程返回子进程pid,给子进程返回0

父亲只有一个,孩子可以有多个,孩子找父亲具有唯一性。所以给父进程返回子进程pid便于标识子进程。

3、fork常规用法

1、一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子进程来处理请求。

2、一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数。

4、fork调用失败的原因

fork有时也会调用失败,原因一般有两个:1、系统中有太多的进程     2、实际用户的进程数超过了限制。

二、进程终止

1、进程终止的方式

1、代码跑完,结果正确

2、代码跑完,结果错误

3、代码没有跑完,程序崩溃

2、进程退出码

首先我们来看一个问题:我们在编写代码时,在main函数的结尾,我们总是 return 0。那么main函数返回值的意义是什么呢?为什么总是返回0呢?返回其他值行不行呢?

实际上main函数只是用户级别代码的入口,main函数也是被其他函数调用的,所以当main函数调用结束后就应该给操作系统返回相应的退出信息,而这个所谓的退出信息就是以退出码的形式作为main函数的返回值返回的。

一般以0表示代码成功执行完,以非0表示代码执行过程中出现了错误。比如下面的代码:

代码运行完后,我们可以使用  echo $?  命令查看最近一个进程的退出码

因为在程序中,运行成功了那就是成功了,而如果失败了,那么失败的原因有很多种。所以用0表示成功,非0的不同值可以表示不同的错误。因此我们可以通过退出码来定位程序的错误原因。

我们使用strerror函数可以通过错误码,获取该错误码在C语言当中对应的错误信息:

注:程序崩溃的时候,退出码没有意义。

3、进程的退出方法

正常终止

~ return 返回:return只有在main函数中表示直接终止进程,并返回退出码,(在其他函数中表示返回值)。

~ exit函数:是一个库函数。在代码的任何地方调用,都表示直接终止进程。并且exit函数在退出进程前会做一系列工作:

1、执行用户通过atexit或on_exit定义的清理函数。

2、关闭所有打开的流,所有的缓存数据均被写入。

3、调用_exit函数终止进程。

如下面的代码:因为exit是库函数,exit终止进程前会将缓冲区当中的数据输出。

~ _exit:是系统调用函数。_exit函数也可以在代码中的任何地方退出进程,但是_exit函数会直接终止进程,并不会在退出进程前会做任何收尾工作。

如下面的代码:缓冲区当中的数据将不会被输出。

~ exit 和 _exit 的区别

从下面的图中,我们可以知道:exit会刷新缓冲区的数据,而_exit不会刷新。

异常终止

1、使用 ctrl+c或者kill -9使进程异常退出。

2、代码错误导致进程运行时异常退出。例如:代码当中存在野指针问题使得进程运行时异常退出,或是出现除0情况使得进程运行时异常退出等。

三、进程等待

1、进程等待的必要性

1、子进程退出,父进程如果不读取子进程的退出信息,子进程就会变成僵尸进程,进而造成内存泄漏。

2、进程一旦变成僵尸状态,那么即使是kill -9 也无能为力,因为谁也没有办法杀死一个已经死去的进程。

3、因为子进程是由父进程创建出来帮助父进程完成任务的,所以进程完成任务后,父进程有必要知道子进程将任务完成得怎么样了。

4、父进程通过进程等待的方式,回收子进程资源,获取子进程退出信息。

2、wait函数

原型:pid_t wait(int* status)      可以等待任意子进程,等待成功返回等待子进程pid,失败返回-1。status:输出型参数,获取子进程退出状态,不关心则可以设置成为NULL。

当子进程退出后,父进程读取了子进程的退出信息,子进程也就不会变成僵尸进程了。

3、waitpid函数

原型:pid_t waitpid(pid_t pid, int* status, int options)     等待指定子进程或任意子进程。

返回值:

1、等待成功返回被等待进程的pid。

2、如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0。

3、如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在。

参数:pid:Pid=-1,等待任一个子进程。与wait等效。Pid>0,等待其进程ID与pid相等的子进程。

status:该参数是一个输出型参数,由操作系统填充 ,如果传递NULL,表示不关心子进程的退出状态信息。否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。

options: 若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的ID。

获取子进程status

status就是将子进程的退出信息传递给父进程的重要参数。但是它不能简单的当作整形来看待。因为它的32个比特位中,只有次低8位表示进程退出码信息。如下图:

因此我们只能通过下面的代码来获取子进程的正确退出码:

获取子进程的终止信号

status参数的低7位,表示子进程的终止信号,我们可以通过下面的代码获得。

status & 0x7f

除了上面的我们可以自己写代码进行退出码的获取,我们还可以使用提供的宏进行退出码的获取:

WIFEXITED(status): 若为正常终止子进程返回的状态,则为真(非0)。(查看进程是否是正常退出)

WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)

父进程拿到子进程的退出码

既然进程之间是相互独立的,而且退出码也还是子进程的数据,那么为什么父进程可以通过wait和waitpid函数,拿到子进程的退出信息,它是怎么拿到的呢?

子进程变成僵尸进程后,虽然子进程已经退出了,但是子进程的PCB任然会保留下来,子进程的task_struct 里面保留了该子进程退出时的退出结果信息。所以父进程可以通过wait和waitpid函数读取子进程task_struct 中的退出结果信息(拿到子进程的退出码和退出信号)。

options

默认为0,代表父进程阻塞等待,WNOHANG代表父进程非阻塞等待。

potions传入WNOHANG,等待的子进程若是没有结束,那么waitpid函数将直接返回0,不予以等待。而等待的子进程若是正常结束,则返回该子进程的pid。

阻塞等待:当子进程未退出时,父进程都在一直等待子进程退出,在等待期间,父进程不能做任何事情,这种等待叫做阻塞等待。

非阻塞等待:父进程没有一直等待子进程退出,而是当子进程未退出时父进程可以做一些自己的事情,当子进程退出时再读取子进程的退出信息,这种等待就叫非阻塞等待。

四、进程程序替换

1、概念

我们知道,在父进程使用fork函数创建了一个子进程后,父子进程共享代码。也就是说子进程使用的是父进程的代码。那么如果子进程要执行和父进程不一样的代码,该怎么办呢?这就需要使用进程的程序替换了。

进程程序替换,顾名思义就是使用一个新的程序替换原有的程序,进程将执行新程序的代码,而不再执行原有程序的代码。(通过特定的接口,加载磁盘上的一个全新的程序,加载到调用进程的地址空间中)

2、原理

如上图所示,将磁盘上的 test2.exe 加载到内存,并和 test1.exe的页表重新建立映射关系,这时进程的代码和数据就变成了 test2.exe的,这就是进程替换。进程替换可以通过系统调用接口实现。

3、进程替换函数

execl 函数

函数原型:int execl(const char *path, const char *arg, ...)。我们知道,运行一个程序的前提是要先找到该程序,所以该函数的第一个参数是程序的路径。第二个参数是可变参数列表,表示你要如何执行这个程序,并以NULL结尾。

execlp函数

函数原型:int execlp(const char *file, const char *arg, ...)  。第一个参数是要执行程序的名字,第二个参数是可变参数列表,表示你要如何执行这个程序,并以NULL结尾。

execle函数

函数原型:int execle(const char *path, const char *arg, ..., char *const envp[])。第一个参数是要执行程序的路径,第二个参数是可变参数列表,表示你要如何执行这个程序,并以NULL结尾,第三个参数是你自己设置的环境变量。

execv函数

函数原型:int execv(const char *path, char *const argv[])。第一个参数是要执行程序的路径,第二个参数是一个指针数组,数组当中的内容表示你要如何执行这个程序,数组以NULL结尾。

execvp函数

函数原型:int execvp(const char *file, char *const argv[])。第一个参数是要执行程序的名字,第二个参数是一个指针数组,数组当中的内容表示你要如何执行这个程序,数组以NULL结尾。

execve函数

int execve(const char *path, char *const argv[], char *const envp[])。第一个参数是要执行程序的路径,第二个参数是一个指针数组,数组当中的内容表示你要如何执行这个程序,数组以NULL结尾,第三个参数是你自己设置的环境变量。

目录
相关文章
|
17天前
|
算法 Linux 调度
深入理解Linux操作系统的进程管理
本文旨在探讨Linux操作系统中的进程管理机制,包括进程的创建、执行、调度和终止等环节。通过对Linux内核中相关模块的分析,揭示其高效的进程管理策略,为开发者提供优化程序性能和资源利用率的参考。
43 1
|
5天前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
49 13
|
12天前
|
SQL 运维 监控
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
|
20天前
|
运维 监控 Linux
Linux操作系统的守护进程与服务管理深度剖析####
本文作为一篇技术性文章,旨在深入探讨Linux操作系统中守护进程与服务管理的机制、工具及实践策略。不同于传统的摘要概述,本文将以“守护进程的生命周期”为核心线索,串联起Linux服务管理的各个方面,从守护进程的定义与特性出发,逐步深入到Systemd的工作原理、服务单元文件编写、服务状态管理以及故障排查技巧,为读者呈现一幅Linux服务管理的全景图。 ####
|
1月前
|
缓存 监控 Linux
linux进程管理万字详解!!!
本文档介绍了Linux系统中进程管理、系统负载监控、内存监控和磁盘监控的基本概念和常用命令。主要内容包括: 1. **进程管理**: - **进程介绍**:程序与进程的关系、进程的生命周期、查看进程号和父进程号的方法。 - **进程监控命令**:`ps`、`pstree`、`pidof`、`top`、`htop`、`lsof`等命令的使用方法和案例。 - **进程管理命令**:控制信号、`kill`、`pkill`、`killall`、前台和后台运行、`screen`、`nohup`等命令的使用方法和案例。
138 4
linux进程管理万字详解!!!
|
25天前
|
缓存 算法 Linux
Linux内核的心脏:深入理解进程调度器
本文探讨了Linux操作系统中至关重要的组成部分——进程调度器。通过分析其工作原理、调度算法以及在不同场景下的表现,揭示它是如何高效管理CPU资源,确保系统响应性和公平性的。本文旨在为读者提供一个清晰的视图,了解在多任务环境下,Linux是如何智能地分配处理器时间给各个进程的。
|
1月前
|
存储 运维 监控
深入Linux基础:文件系统与进程管理详解
深入Linux基础:文件系统与进程管理详解
78 8
|
1月前
|
网络协议 Linux 虚拟化
如何在 Linux 系统中查看进程的详细信息?
如何在 Linux 系统中查看进程的详细信息?
76 1
|
1月前
|
Linux
如何在 Linux 系统中查看进程占用的内存?
如何在 Linux 系统中查看进程占用的内存?
|
1月前
|
算法 Linux 定位技术
Linux内核中的进程调度算法解析####
【10月更文挑战第29天】 本文深入剖析了Linux操作系统的心脏——内核中至关重要的组成部分之一,即进程调度机制。不同于传统的摘要概述,我们将通过一段引人入胜的故事线来揭开进程调度算法的神秘面纱,展现其背后的精妙设计与复杂逻辑,让读者仿佛跟随一位虚拟的“进程侦探”,一步步探索Linux如何高效、公平地管理众多进程,确保系统资源的最优分配与利用。 ####
71 4