Linux之进程(一)

简介: Linux之进程(一)



一、概念

1、基本概念

课本概念:程序的一个执行实例,正在执行的程序等。

内核观点:担当分配系统资源(CPU时间,内存)的实体。

我们知道,代码被编译链接后会形成一个可执行程序。当我们在电脑上双击软件的图标或者在手机上打开App,实际上就是在运行它们的可执行程序。

而这个可执行程序本质上是一个文件,是放在磁盘上的。当我们双击这个可执行程序将其运行起来时,本质上是将这个程序加载到内存当中了,因为只有加载到内存后,CPU才能对其进行内容的读取执行。而一旦将这个程序加载到内存后,我们就不应该将这个程序再叫做程序了,而是应该将其称之为进程

下图就是我电脑上的一些进程:

简单来说:我们自己启动一个软件,本质上就是启动了一个进程。

在Linux下,运行一条命令,./xxx运行可执行程序时,其实就是在系统层面上创建了一个进程。

2、描述进程的PCB

进程信息被放在一个叫做进程控制块的数据结构中,可以理解为进程属性的集合。

PCB(process control block),Linux操作系统下的PCB是: task_struct

系统当中可以同时存在大量进程,而当你开机的时候启动的第一个程序就是我们的操作系统(即操作系统是第一个加载到内存的),我们都知道操作系统是做管理工作的,而其中就包括了进程管理。那么操作系统是怎么对进程进行管理的呢?

其实就是我们在操作系统中所讲到的:先描述,再组织。当一个进程出现时,操作系统就立马通过创建一个 struct/class 来对其进行描述,之后对该进程的管理实际上就是对其描述信息的管理。

操作系统将每一个进程都会对其进行描述,所以会形成多个PCB,并将这些PCB以双向链表的形式组织起来,之后对进程的管理就是对这个双向链表的增删查改。例如:退出一个进程实际上就是先将该进程的PCB从该双链表当中删除,然后操作系统再将内存当中属于该进程的代码和数据进行释放或是置为无效。

所以,严格来说,进程 = 对应的代码和数据 + 进程对应的PCB结构体。

3、task_struct

1、在Linux中描述进程的结构体叫做task_struct。

2、task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含着进程的信息。

注:PCB和task_struct的关系:PCB是task_struct这一类描述进程的结构体的统称。只是在Linux中PCB是task_struct。

task_struct中的内容:

标示符:描述本进程的唯一标示符,用来区别其他进程。

状态:任务状态,退出代码,退出信号等。

优先级:相对于其他进程的优先级。

程序计数器:程序中即将被执行的下一条指令的地址。

内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针。

上下文数据:进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。

I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。

记账信息:可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。

其他信息

二、查看进程

在根目录下有一个名为proc的系统文件夹。文件夹当中包含大量进程信息,这些数字其实是某一进程的PID,对应文件夹当中记录着对应进程的各种信息。我们若想查看PID为1的进程的进程信息,则查看名字为1的文件夹即可。

我们还可以通过ps命令来查看进程:

~ 单独使用ps 会显示所有进程的信息。ps axj

~  ps命令与grep命令搭配使用,即可只显示某一进程的信息。

ps axj | head -1 && ps axj | grep proc

三、获取进程的PID和PPID

通过系统调用获取进程的PID和PPID

通过使用系统调用函数,getpid和getppid(获取当前进程的父进程ID)即可分别获取进程的PID和PPID。如下图:

下面我们通过ps来查看一下进程的id是否与打印得到的id相同。是相同的。

四、通过系统调用创建进程

1、fork函数创建子进程

fork是一个系统调用函数,其功能就是创建一个子进程。返回值:失败时,-1;成功时,a. 给父进程返回子进程的pid,b. 给子进程返回0(fork可以有两个返回值)。

比如我们先编写一个下面的代码:

运行结果:

这个结果就和我们以前所学的知识相冲突了,为什么会有两个ret值呢?一个变量不是应该只有一个值的吗?而出现这种现象就和进程有关系了。

紧接着,我们就来看一看它们的进程:

fork之后,代码是父子共享的,数据各自开辟空间,私有一份。所以子进程和父进程都可以执行printf,进而打印出不同的ret。

但是,我把一个子进程创建出来是为了让它去执行和父进程一样的代码吗?肯定不是的,这样做没有任何意义。我们新创建一个进程肯定是要让它去执行不同的代码,将任务拆解成小任务,让不同的进程去执行不同的任务,这样才能够提高效率。

2、用if进行分流

所以为了让不同的进程去执行不同的任务,在 fork 之后通常要用 if 进行分流。根据父进程和子进程获取到fork函数的返回值不同,我们就可以来让父子进程执行不同的代码,从而做不同的事。如下面的代码:

fork创建出子进程后,子进程会进入到 else if 语句的循环打印当中,而父进程会进入到 else 语句的循环打印当中。 如下图:

五、进程状态

1、操作系统进程状态

1、新建

字面意思,就是新建立的进程。

2、运行

运行队列:CPU在内核上维护了一个运行队列,进行进程的管理。让进程入队列,本质就是将该进程的task_struct 结构体对象放入运行队列之中。

运行状态:进程PCB在运行队列里排队就是运行状态(在等待CPU资源)。注:不是说这个进程正在运行,才是运行状态。即进程可能正在运行,也可能在运行队列中。

3、阻塞

系统中存在各种资源,如磁盘、网卡显卡等,在使用这些资源时,它们也有自己的队列。故系统中不止存在一种队列。CPU的队列就叫运行队列。

等待非CPU资源就绪时,就是阻塞状态。(即不在运行队列中,在其他资源的队列中)。

4、挂起

如果系统中存在许多进程,而有部分进程在短期内不会被调度,代码和数据在短期内不会被执行,此时如果内存空间不足,操作系统就可以把代码和数据暂时保存到磁盘上,节省一部分空间,该进程暂时被挂起了,这就是挂起状态。

2、Linux进程状态

下面是进程状态在Linux内核中的定义:

static const char * const task_state_array[] = 
{
    "R (running)", /* 0 */
    "S (sleeping)", /* 1 */
    "D (disk sleep)", /* 2 */
    "T (stopped)", /* 4 */
    "t (tracing stop)", /* 8 */
    "X (dead)", /* 16 */
    "Z (zombie)", /* 32 */
};

R运行状态(running)

注:状态后面带+,意味着这个任务是前台进程。前台进程:一旦进程运行起来,你的命令行解释器就不能使用,只有通过 CTRL C 使进程停下来才能使用。

后台进程:在运行时,加上&,即让这个进程在后台运行。会返回进程的PID。且 CTRL C也不能使它停下来。

使它停下来的方法:kill -9 PID

S睡眠状态(sleeping)  

意味着进程在等待非CPU资源就绪(这里的睡眠也叫做可中断睡眠(interruptible sleep))。相当于阻塞状态。

S是浅度睡眠,可以被终止。能够被os杀掉。我们也可以使用kill命令将该进程杀掉。

D磁盘休眠状态(Disk sleep)

也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的进程通常会等待IO的结束。D是深度睡眠,无法被OS杀掉,只能通过断电、自动唤醒才可以恢复。

例如,某一进程要求对磁盘进行写入操作,那么在磁盘进行写入期间,该进程就处于深度睡眠状态,是不会被杀掉的,因为该进程需要等待磁盘的回复(是否写入成功)以做出相应的应答。(磁盘休眠状态)。

T停止状态(stopped)

X死亡状态(dead)

死亡状态只是一个返回状态,当一个进程的退出信息被读取后,该进程所申请的资源就会立即被释放,该进程也就不存在了,所以你不会在任务列表当中看到死亡状态(dead)。

六、僵尸进程

1、僵尸状态

是一个比较特殊的状态。当进程退出并且父进程没有读取到子进程退出的返回代码时就会产生僵死(尸)进程。

僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码。所以,只要子进程退出,父进程还在运行,但父进程没有读取子进程状态,子进程进入Z状态。

简单来说,就是:一个进程已经退出,但是还不允许被os释放,处于一个被检测的状态——僵尸状态。

例如,对于以下代码,fork函数创建的子进程在打印7次信息后会退出,而父进程会一直打印信息。也就是说,子进程退出了,父进程还在运行,但父进程没有读取子进程的退出信息,那么此时子进程就进入了僵尸状态。

维持该状态,为了让父进程和操作系统来回收。然后由z状态变为x状态。

2、僵尸进程的危害

1、进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我办的怎么样了。可父进程如果一直不读取,那子进程就一直处于Z状态。

2、维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存task_struct(PCB)中,换句话说,Z状态一直不退出,PCB一直都要维护。

3、那一个父进程创建了很多子进程,就是不回收,就会造成内存资源的浪费。因为数据结构对象本身就要占用内存,一个结构体变量(对象),是要在内存的某个位置进行开辟空间的。

4、僵尸进程会造成内存泄漏。

七、孤儿进程

父进程如果提前退出,子进程后退出,这种情况下子进程就称之为“孤儿进程”。

孤儿进程必须被1号init进程(系统本身)领养。

为什么子进程要被领养呢?因为之后在子进程要退出时,它的父进程已经不在了,需要领养进程来进行回收。

我们以下面的代码为例:

最开始,父进程和子进程都在。

然后,父进程会退出,子进程成为孤儿进程

它的父进程的pid也变成了1,即该孤儿进程被1号进程领养了。

目录
相关文章
|
1月前
|
资源调度 Linux 调度
Linux c/c++之进程基础
这篇文章主要介绍了Linux下C/C++进程的基本概念、组成、模式、运行和状态,以及如何使用系统调用创建和管理进程。
38 0
|
3月前
|
网络协议 Linux
Linux查看端口监听情况,以及Linux查看某个端口对应的进程号和程序
Linux查看端口监听情况,以及Linux查看某个端口对应的进程号和程序
673 2
|
3月前
|
Linux Python
linux上根据运行程序的进程号,查看程序所在的绝对路径。linux查看进程启动的时间
linux上根据运行程序的进程号,查看程序所在的绝对路径。linux查看进程启动的时间
70 2
|
21天前
|
缓存 监控 Linux
linux进程管理万字详解!!!
本文档介绍了Linux系统中进程管理、系统负载监控、内存监控和磁盘监控的基本概念和常用命令。主要内容包括: 1. **进程管理**: - **进程介绍**:程序与进程的关系、进程的生命周期、查看进程号和父进程号的方法。 - **进程监控命令**:`ps`、`pstree`、`pidof`、`top`、`htop`、`lsof`等命令的使用方法和案例。 - **进程管理命令**:控制信号、`kill`、`pkill`、`killall`、前台和后台运行、`screen`、`nohup`等命令的使用方法和案例。
75 4
linux进程管理万字详解!!!
|
11天前
|
存储 运维 监控
深入Linux基础:文件系统与进程管理详解
深入Linux基础:文件系统与进程管理详解
53 8
|
8天前
|
Linux
如何在 Linux 系统中查看进程占用的内存?
如何在 Linux 系统中查看进程占用的内存?
|
20天前
|
算法 Linux 定位技术
Linux内核中的进程调度算法解析####
【10月更文挑战第29天】 本文深入剖析了Linux操作系统的心脏——内核中至关重要的组成部分之一,即进程调度机制。不同于传统的摘要概述,我们将通过一段引人入胜的故事线来揭开进程调度算法的神秘面纱,展现其背后的精妙设计与复杂逻辑,让读者仿佛跟随一位虚拟的“进程侦探”,一步步探索Linux如何高效、公平地管理众多进程,确保系统资源的最优分配与利用。 ####
57 4
|
21天前
|
缓存 负载均衡 算法
Linux内核中的进程调度算法解析####
本文深入探讨了Linux操作系统核心组件之一——进程调度器,着重分析了其采用的CFS(完全公平调度器)算法。不同于传统摘要对研究背景、方法、结果和结论的概述,本文摘要将直接揭示CFS算法的核心优势及其在现代多核处理器环境下如何实现高效、公平的资源分配,同时简要提及该算法如何优化系统响应时间和吞吐量,为读者快速构建对Linux进程调度机制的认知框架。 ####
|
22天前
|
消息中间件 存储 Linux
|
29天前
|
运维 Linux
Linux查找占用的端口,并杀死进程的简单方法
通过上述步骤和命令,您能够迅速识别并根据实际情况管理Linux系统中占用特定端口的进程。为了获得更全面的服务器管理技巧和解决方案,提供了丰富的资源和专业服务,是您提升运维技能的理想选择。
37 1
下一篇
无影云桌面