【Linux】进程的基本属性|父子进程关系-阿里云开发者社区

【Linux】进程的基本属性|父子进程关系

2023-10-31 1000

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【Linux】进程的基本属性|父子进程关系

前言

本篇文章继上文的进程概念后，现在对进程概念有了一定的理解。前面说过，操作系统管理进程实际上是管理描述进程的PCB对象，而PCB对象是一堆进程属性的集合，那么进程都有哪些属性？本篇文章会详细写出来。

进程属性

我们知道，进程 = 描述该进程的PCB结构体对象 + 对应的数据和代码，每一个进程都是由操作系统进行管理的，进程的PCB（process ctrl block）对象是该进程的所有属性的集合，所以，一个进程的多种属性，一定是放在PCB结构体里面的。

下面介绍进程的基本属性。

1.进程PID和PPID

什么是PID？PID我们可能不知道，但是ID我们应该是知道的，ID就是身份识别码。所以PID就是进程的身份识别码（process ID）

在学校里面，每一个学生都有自己的学号，这个学号是独一无二的，进程也是类似，每一个进程的PID是独一无二的。

我们可以通过下面的指令来查看进程的PID。

ps axj | head -1

ps axj 指令可以查看当前用户下的所有进程，通过管道后，head指令提取管道文件的第一行并输出到显示器中。

结果如下:

第二个就是PID。

这里有一个注意的点，既然PID是该进程的唯一身份标识符，则该进程的PID一定是放在task_struct结构体中的，因为PID也是进程的属性之一。PID的本质是一个int类型。

这里有一个问题：我如何获取自己进程的PID？

从上面的描述过程中可以画出该图，ps axj指令能获取用户正在运行的所有进程，这些进程的信息本质上是ps axj这条程序员写的指令去调用操作系统开放的一个接口调用到的。

因为操作系统不相信任何人，它不敢也不给任何人访问我的所有进程的PCB结构体和各种信息。

所以可以想到，要想获取一个进程的PID，要通过一个系统调用接口来获取，这个接口叫做getpid()

下面来通过代码让操作系统给我们分配一个小小的进程：

1 #include <stdio.h>
  2 #include <unistd.h>
  3 
  4 int main()
  5 {
  6     pid_t pid = getpid();
  7    
  8     while(1)
  9     {
 10                                                               
 11         printf("I am a process,my pid is %d\n",pid);
 12         sleep(1);
 13     }
 14 
 15     return 0;
 16 }

运行后，再查询该进程的pid

发现通过系统的接口函数返回的pid和我们运行程序时正在跑的进程的pid是一样的。

getpid()这个系统调用接口的工作原理是，我自己的进程调用getpid()函数，获取到我的PID后将结果返回给上层的一个变量。

不过这又有一个小细节，PPID是什么？

PPID，比PID多了一个P，这个P是parent的意思，也就是父进程的PID。

父进程就是该进程的父亲进程，就相当于我这个进程是父进程分配下来的。

我们再重新执行程序会发现，我原来的进程的PID变了。这就像是我们上大学后，发现我这个学校并不如意，我决定回去复读，第二年我比去年多考了几十分，可天意难料，我又被去年的学校录取了。这个过程中，去年我读的这所学校分配给我一个学号，今年再来到这所学校，也有一个学号，这两个学号肯定是不一样的。

那么，我们这样通过写代码的方式创建一个进程，它的父进程到底是谁？

我们查询一下可以发现，每次执行程序，它的PID都不同，但是PPID都是一样的，找到PID为2215的那一行可以发现，它的COMMAND就是对应的进程对象。

由此可知，每一个自己创建的进程的父进程都是bash进程！

不过，bash进程的PID也是会变化的，重新启动xhell脚本就得到不一样的PID了。

2.fork函数创建子进程

fork函数的作用是：创建一个子进程。

这里是fork函数的基本说明，然而，重要的是fork函数的返回值：

如果创建成功：返回子进程的pid给父进程，返回0给子进程。
如果创建失败，返回-1给父进程，子进程则什么都不返回。

下面给一段代码演示一下fork函数。

1 #include<stdio.h>                                                                                                                    
  2 #include<unistd.h>
  3 
  4 int main()
  5 {
  6     printf("begin:我是一个进程,我的pid是%d,我的ppid是%d\n",getpid(),getppid());
  7     pid_t id = fork();
  8 
  9     if(id == 0)
 10     {
 11         //子进程
 12          while(1)
 13          {
 14             printf("我是子进程,我的pid是%d,我的ppid是%d\n",getpid(),getppid());
 15             sleep(1);
 16          }
 17     }
 18 
 19     else if(id > 0)
 20     {
 21         //父进程
 22         while(1)
 23         {
 24             printf("我是父进程,我的pid是%d,我的ppid是%d\n",getpid(),getppid());
 25             sleep(1);
 26         }
 27     }
 28 
 29     return 0;
 30 }

运行后你会发现结果如上：

执行第一个printf语句后，打印的pid和ppid就是当前正在运行进程的pid和ppid。

然后你会发现同时执行了if 和else if 两个语句块！

这到底是什么原因呢？

看运行结果可知，父进程的pid和ppid跟第一个printf打印出来的是一模一样的！说明父进程就是当前这个程序的进程！而子进程是父进程的一个分支！

这里还有几个问题需要解决：

1）为什么fork函数要给父进程返回子进程的pid，给子进程返回0？

举个简单的例子，每一个孩子一定只有一个亲生父亲，但是每一个父亲可能会有多个孩子，这是毋庸置疑的。假如一个父亲有5个孩子，父亲说：孩子，你过来。然后5个孩子齐刷刷地跑过来，父亲到底叫的是哪个孩子呢？

所以就必须让父进程知道每一个子进程的标识符！

也就是要知道每一个子进程叫什么名字，返回子进程的pid给父进程是最合理的。

而对于子进程来说，它的父进程只有一个且不花什么代价就能找到父进程pid，所以只需要返回0给子进程作为标识即可。

2）fork函数究竟在干什么？

要知道，fork函数的功能是创建一个子进程，可是到底什么叫做创建一个子进程？

其实，创建子进程，无非就是系统中多了一个进程！

我们知道，进程 = PCB数据结构 + 自己的代码和数据，多一个进程就是在操作系统中多管理一个PCB数据结构和一段代码罢了。

可是，子进程刚创建出来并没有代码和数据，所以子进程只能去找父进程的代码和数据来执行。

这就是为什么，fork函数之后的所有代码是父子进程共享的！

这就解释了从fork函数之后下面的代码，父进程和子进程都能跑的原因。

那为什么要创建子进程？

因为在不同的场景中，我们需要让父子进程执行不同的代码块！

前面我们说过，fork函数之后父子进程共享代码，虽然是共享，实际上就是为了让父子进程执行不同的代码块，完成不同的工作从而协调起来。

3）一个函数是如何做到返回两次的？

前面说过，fork函数之后的代码父子共享。 但是，fork函数，也是一个函数，是在系统内部实现的，调用的时候会在fork函数内部创建进程，大致会做几件事情：

1.创建子进程的PCB对象

2.初始化子进程的PCB

3.让子进程指向父进程的数据和代码

4.让父子进程都能被CPU调度运行

前面说过，父子进程的代码是共享的，所以在return id这条代码，一定是父子共享的！ 因为在return id语句执行之前，已经做好了创建子进程的工作。CPU可以单独调用父子进程执行不同的工作。

所以return id这条语句被执行了两次！

可是前面说过，子进程是没有任何数据和代码的，子进程的代码也是人家父进程的，何况只有一个pid变量，该怎么接收两个返回值呢？

这里引出一个进程的性质：

任何平台下，任何一个进程在运行时，都具有独立性！

如何理解独立性？

我们在windows系统下面，我现在打开网页版csdn和xhell还有qq，突然我的qq崩溃了，但这并不影响我的网页运行，也不影响我在听音乐，这就是独立性，各个进程运行互不干扰。

既然进程有独立性，这就保证了每个进程之间不能有任何瓜葛，必须让它们割裂！

所以，父子进程一定不能访问同一份数据！

在这个前提下，子进程要想运行起来，必须要有自己的一份数据，所以，子进程只能想办法把父进程的数据拷贝下来！

这样就能够保证父子进程既能够保持父子进程的代码共享，又能保证父进程的数据不能被修改。保证父子共享代码的同时，又保证了进程的独立性。

可是，如果我的父进程有很多很多个变量，而子进程拷贝了父进程的数据，又不会去改这些变量，甚至不访问这些变量，就会造成在内存中有两份冗余的数据！为了解决这个问题，程序员想出一个好办法：写时拷贝

写时拷贝

写时拷贝是指：子进程在执行了return id这一条语句后，不会立刻去拷贝父进程的所有数据，而是先看子进程需要什么数据，再根据这些数据开辟需要的空间，这样就能避免数据冗余的情况。

后续如果子进程还需要数据，操作系统再给子进程空间并拷贝过去即可。

通过写时拷贝，实现父子进程的独立性，保证父进程的数据不会被修改，又能保证父子进程的代码共享！

总结

1.本篇文章讲述了进程的最基本的属性：进程的PID和PPID，PID是每个进程独有的标识序号，PPID是该进程的父进程的标识序号。

2.通过fork函数创建出来子进程。什么是创建子进程，以及给了一个案例，运行后发现了令人震惊的结果，提出了fork函数之后父子进程的代码是共享的，但是每个进程都具有独立性，父进程的数据绝对不能让子进程修改，从而产生写时拷贝的做法，来保证父子进程既能够具有独立性，也能让父子进程代码共享。

【Linux】进程的基本属性|父子进程关系

前言

进程属性

1.进程PID和PPID

2.fork函数创建子进程

1）为什么fork函数要给父进程返回子进程的pid，给子进程返回0？

2）fork函数究竟在干什么？

3）一个函数是如何做到返回两次的？

写时拷贝

总结

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【Linux】进程的基本属性|父子进程关系

前言

进程属性

1.进程PID和PPID

2.fork函数创建子进程

1）为什么fork函数要给父进程返回子进程的pid，给子进程返回0？

2）fork函数究竟在干什么？

3）一个函数是如何做到返回两次的？

写时拷贝

总结

热门文章

最新文章

相关课程

相关电子书

推荐镜像