【Linux】进程的基本属性|父子进程关系

简介: 【Linux】进程的基本属性|父子进程关系

前言

本篇文章继上文的进程概念后,现在对进程概念有了一定的理解。前面说过,操作系统管理进程实际上是管理描述进程的PCB对象,而PCB对象是一堆进程属性的集合,那么进程都有哪些属性?本篇文章会详细写出来。


进程属性

我们知道,进程 = 描述该进程的PCB结构体对象 + 对应的数据和代码,每一个进程都是由操作系统进行管理的,进程的PCB(process ctrl block)对象是该进程的所有属性集合,所以,一个进程的多种属性,一定是放在PCB结构体里面的。

下面介绍进程的基本属性。


1.进程PID和PPID

什么是PID?PID我们可能不知道,但是ID我们应该是知道的,ID就是身份识别码。所以PID就是进程身份识别码(process ID)

在学校里面,每一个学生都有自己的学号,这个学号是独一无二的,进程也是类似,每一个进程的PID是独一无二的。

我们可以通过下面的指令来查看进程的PID。

ps axj | head -1

ps axj 指令可以查看当前用户下的所有进程,通过管道后,head指令提取管道文件的第一行并输出到显示器中。

结果如下:

第二个就是PID。

这里有一个注意的点,既然PID是该进程的唯一身份标识符,则该进程的PID一定是放在task_struct结构体中的,因为PID也是进程的属性之一。PID的本质是一个int类型。


这里有一个问题:我如何获取自己进程的PID?

从上面的描述过程中可以画出该图,ps axj指令能获取用户正在运行的所有进程,这些进程的信息本质上是ps axj这条程序员写的指令去调用操作系统开放的一个接口调用到的。

因为操作系统不相信任何人,它不敢也不给任何人访问我的所有进程的PCB结构体和各种信息。

所以可以想到,要想获取一个进程的PID,要通过一个系统调用接口来获取,这个接口叫做getpid()

下面来通过代码让操作系统给我们分配一个小小的进程:

1 #include <stdio.h>
  2 #include <unistd.h>
  3 
  4 int main()
  5 {
  6     pid_t pid = getpid();
  7    
  8     while(1)
  9     {
 10                                                               
 11         printf("I am a process,my pid is %d\n",pid);
 12         sleep(1);
 13     }
 14 
 15     return 0;
 16 }

运行后,再查询该进程的pid

发现通过系统的接口函数返回的pid和我们运行程序时正在跑的进程的pid是一样的

getpid()这个系统调用接口的工作原理是,我自己的进程调用getpid()函数,获取到我的PID后将结果返回给上层的一个变量。

不过这又有一个小细节,PPID是什么?


PPID,比PID多了一个P,这个P是parent的意思,也就是父进程的PID。

父进程就是该进程的父亲进程,就相当于我这个进程是父进程分配下来的。

我们再重新执行程序会发现,我原来的进程的PID变了。这就像是我们上大学后,发现我这个学校并不如意,我决定回去复读,第二年我比去年多考了几十分,可天意难料,我又被去年的学校录取了。这个过程中,去年我读的这所学校分配给我一个学号,今年再来到这所学校,也有一个学号,这两个学号肯定是不一样的。

那么,我们这样通过写代码的方式创建一个进程,它的父进程到底是谁?

我们查询一下可以发现,每次执行程序,它的PID都不同,但是PPID都是一样的,找到PID2215的那一行可以发现,它的COMMAND就是对应的进程对象。

由此可知,每一个自己创建的进程的父进程都是bash进程!

不过,bash进程的PID也是会变化的,重新启动xhell脚本就得到不一样的PID了。

2.fork函数创建子进程

fork函数的作用是:创建一个子进程。

这里是fork函数的基本说明,然而,重要的是fork函数的返回值:

  • 如果创建成功:返回子进程的pid给父进程,返回0给子进程。
  • 如果创建失败,返回-1给父进程,子进程则什么都不返回。

下面给一段代码演示一下fork函数。

1 #include<stdio.h>                                                                                                                    
  2 #include<unistd.h>
  3 
  4 int main()
  5 {
  6     printf("begin:我是一个进程,我的pid是%d,我的ppid是%d\n",getpid(),getppid());
  7     pid_t id = fork();
  8 
  9     if(id == 0)
 10     {
 11         //子进程
 12          while(1)
 13          {
 14             printf("我是子进程,我的pid是%d,我的ppid是%d\n",getpid(),getppid());
 15             sleep(1);
 16          }
 17     }
 18 
 19     else if(id > 0)
 20     {
 21         //父进程
 22         while(1)
 23         {
 24             printf("我是父进程,我的pid是%d,我的ppid是%d\n",getpid(),getppid());
 25             sleep(1);
 26         }
 27     }
 28 
 29     return 0;
 30 }

运行后你会发现结果如上:

执行第一个printf语句后,打印的pid和ppid就是当前正在运行进程的pid和ppid。

然后你会发现同时执行了if else if 两个语句块!

这到底是什么原因呢?

看运行结果可知,父进程的pid和ppid跟第一个printf打印出来的是一模一样的!说明父进程就是当前这个程序的进程!而子进程是父进程的一个分支

这里还有几个问题需要解决:


1)为什么fork函数要给父进程返回子进程的pid,给子进程返回0?

举个简单的例子,每一个孩子一定只有一个亲生父亲,但是每一个父亲可能会有多个孩子,这是毋庸置疑的。假如一个父亲有5个孩子,父亲说:孩子,你过来。然后5个孩子齐刷刷地跑过来,父亲到底叫的是哪个孩子呢?

所以就必须让父进程知道每一个子进程的标识符!

也就是要知道每一个子进程叫什么名字,返回子进程的pid给父进程是最合理的。

而对于子进程来说,它的父进程只有一个且不花什么代价就能找到父进程pid,所以只需要返回0给子进程作为标识即可。


2)fork函数究竟在干什么?

要知道,fork函数的功能是创建一个子进程,可是到底什么叫做创建一个子进程?

其实,创建子进程,无非就是系统中多了一个进程!

我们知道,进程 = PCB数据结构 + 自己的代码和数据,多一个进程就是在操作系统中多管理一个PCB数据结构和一段代码罢了。

可是,子进程刚创建出来并没有代码和数据,所以子进程只能去找父进程的代码和数据来执行。

这就是为什么,fork函数之后的所有代码是父子进程共享的!

这就解释了从fork函数之后下面的代码,父进程和子进程都能跑的原因。

那为什么要创建子进程?

因为在不同的场景中,我们需要让父子进程执行不同的代码块!

前面我们说过,fork函数之后父子进程共享代码,虽然是共享,实际上就是为了让父子进程执行不同的代码块,完成不同的工作从而协调起来。


3)一个函数是如何做到返回两次的?

前面说过,fork函数之后的代码父子共享。 但是,fork函数,也是一个函数,是在系统内部实现的,调用的时候会在fork函数内部创建进程,大致会做几件事情:

1.创建子进程的PCB对象

2.初始化子进程的PCB

3.让子进程指向父进程的数据和代码

4.让父子进程都能被CPU调度运行

前面说过,父子进程的代码是共享的,所以在return id这条代码,一定是父子共享的! 因为在return id语句执行之前,已经做好了创建子进程的工作。CPU可以单独调用父子进程执行不同的工作。

所以return id这条语句被执行了两次!

可是前面说过,子进程是没有任何数据和代码的,子进程的代码也是人家父进程的,何况只有一个pid变量,该怎么接收两个返回值呢?

这里引出一个进程的性质:

任何平台下,任何一个进程在运行时,都具有独立性!

如何理解独立性?

我们在windows系统下面,我现在打开网页版csdn和xhell还有qq,突然我的qq崩溃了,但这并不影响我的网页运行,也不影响我在听音乐,这就是独立性,各个进程运行互不干扰

既然进程有独立性,这就保证了每个进程之间不能有任何瓜葛,必须让它们割裂!

所以,父子进程一定不能访问同一份数据!

在这个前提下,子进程要想运行起来,必须要有自己的一份数据,所以,子进程只能想办法把父进程的数据拷贝下来

这样就能够保证父子进程既能够保持父子进程的代码共享,又能保证父进程的数据不能被修改。保证父子共享代码的同时,又保证了进程的独立性。

可是,如果我的父进程有很多很多个变量,而子进程拷贝了父进程的数据,又不会去改这些变量,甚至不访问这些变量,就会造成在内存中有两份冗余的数据!为了解决这个问题,程序员想出一个好办法:写时拷贝

写时拷贝

写时拷贝是指:子进程在执行了return id这一条语句后,不会立刻去拷贝父进程的所有数据,而是先看子进程需要什么数据,再根据这些数据开辟需要的空间,这样就能避免数据冗余的情况。

后续如果子进程还需要数据,操作系统再给子进程空间并拷贝过去即可。

通过写时拷贝,实现父子进程的独立性,保证父进程的数据不会被修改,又能保证父子进程的代码共享!

总结

1.本篇文章讲述了进程的最基本的属性:进程的PID和PPID,PID是每个进程独有的标识序号,PPID是该进程的父进程的标识序号。

2.通过fork函数创建出来子进程。什么是创建子进程,以及给了一个案例,运行后发现了令人震惊的结果,提出了fork函数之后父子进程的代码是共享的,但是每个进程都具有独立性,父进程的数据绝对不能让子进程修改,从而产生写时拷贝的做法,来保证父子进程既能够具有独立性,也能让父子进程代码共享。

相关文章
|
存储 Linux API
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
在计算机系统的底层架构中,操作系统肩负着资源管理与任务调度的重任。当我们启动各类应用程序时,其背后复杂的运作机制便悄然展开。程序,作为静态的指令集合,如何在系统中实现动态执行?本文带你一探究竟!
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
|
算法 Linux 调度
深入理解Linux操作系统的进程管理
本文旨在探讨Linux操作系统中的进程管理机制,包括进程的创建、执行、调度和终止等环节。通过对Linux内核中相关模块的分析,揭示其高效的进程管理策略,为开发者提供优化程序性能和资源利用率的参考。
443 32
|
11月前
|
并行计算 Linux
Linux内核中的线程和进程实现详解
了解进程和线程如何工作,可以帮助我们更好地编写程序,充分利用多核CPU,实现并行计算,提高系统的响应速度和计算效能。记住,适当平衡进程和线程的使用,既要拥有独立空间的'兄弟',也需要在'家庭'中分享和并行的成员。对于这个世界,现在,你应该有一个全新的认识。
373 67
|
10月前
|
Web App开发 Linux 程序员
获取和理解Linux进程以及其PID的基础知识。
总的来说,理解Linux进程及其PID需要我们明白,进程就如同汽车,负责执行任务,而PID则是独特的车牌号,为我们提供了管理的便利。知道这个,我们就可以更好地理解和操作Linux系统,甚至通过对进程的有效管理,让系统运行得更加顺畅。
284 16
|
10月前
|
Unix Linux
对于Linux的进程概念以及进程状态的理解和解析
现在,我们已经了解了Linux进程的基础知识和进程状态的理解了。这就像我们理解了城市中行人的行走和行为模式!希望这个形象的例子能帮助我们更好地理解这个重要的概念,并在实际应用中发挥作用。
201 20
|
9月前
|
监控 Shell Linux
Linux进程控制(详细讲解)
进程等待是系统通过调用特定的接口(如waitwaitpid)来实现的。来进行对子进程状态检测与回收的功能。
214 0
|
9月前
|
存储 负载均衡 算法
Linux2.6内核进程调度队列
本篇文章是Linux进程系列中的最后一篇文章,本来是想放在上一篇文章的结尾的,但是想了想还是单独写一篇文章吧,虽然说这部分内容是比较难的,所有一般来说是简单的提及带过的,但是为了让大家对进程有更深的理解与认识,还是看了一些别人的文章,然后学习了学习,然后对此做了总结,尽可能详细的介绍明白。最后推荐一篇文章Linux的进程优先级 NI 和 PR - 简书。
285 0
|
9月前
|
存储 Linux Shell
Linux进程概念-详细版(二)
在Linux进程概念-详细版(一)中我们解释了什么是进程,以及进程的各种状态,已经对进程有了一定的认识,那么这篇文章将会继续补全上篇文章剩余没有说到的,进程优先级,环境变量,程序地址空间,进程地址空间,以及调度队列。
168 0
|
9月前
|
Linux 调度 C语言
Linux进程概念-详细版(一)
子进程与父进程代码共享,其子进程直接用父进程的代码,其自己本身无代码,所以子进程无法改动代码,平时所说的修改是修改的数据。为什么要创建子进程:为了让其父子进程执行不同的代码块。子进程的数据相对于父进程是会进行写时拷贝(COW)。
230 0
|
存储 网络协议 Linux
【Linux】进程IO|系统调用|open|write|文件描述符fd|封装|理解一切皆文件
本文详细介绍了Linux中的进程IO与系统调用,包括 `open`、`write`、`read`和 `close`函数及其用法,解释了文件描述符(fd)的概念,并深入探讨了Linux中的“一切皆文件”思想。这种设计极大地简化了系统编程,使得处理不同类型的IO设备变得更加一致和简单。通过本文的学习,您应该能够更好地理解和应用Linux中的进程IO操作,提高系统编程的效率和能力。
577 34