Linux:创建进程 -- fork,到底是什么?

简介: Linux:创建进程 -- fork,到底是什么?

相信大家在初学进程时,对fork函数创建进程一定会有很多的困惑,比如:

  • 1.fork做了什么事情??
  • 2.为什么fork函数会有两个返回值?
  • 3.为什么fork的两个返回值,会给父进程谅回子进程pid,给子进程返回0?
  • 4.fork之后:父子进程谁先运行??
  • 5.如何理解同一个变量,会有不同的值??

本篇文章将来仔细回答一下这些问题。


1.如何查看进程

1.1 进程的信息可以通过 /proc 系统文件夹查看

通过ls指令来查看所有的进程,proc是动态目录结构,用来存放所有的进程,目录的名称就是用进程的id命名的。

1.2 进程信息同样可以使用ps(process status)工具来获取

  • 进程id(PID)通过getpid 系统调用获得
  • 父进程id(PPID)通过getppid 系统调用获得
   #include<stdio.h>
   #include<sys/types.h>
   #include<unistd.h>
   int main()
   {
      while(1)
      {
          printf("I am a process! myid:%d parentid:%d\n",getpid(),getppid())    ;
          sleep(1);
      }
      return 0;
  }

我们可以使用shell再开一个窗口登录一次进行查看。

"aux" 是 "ps" 命令的选项之一,表示显示所有用户的所有进程,通过查询,可以看到你自己 ./ 启动的进程,最后一个进程是当前的grep的查找进程。

关于当前工作目录

我们在C语言学习文件操作是会提到当前目录,我们以 "w" 方式读取文件时,如果文件不存在,那么文件会在当前工作目录cwd下创建。那么一个进程是如何找到当前目录的呢?

我们让下面代码运行起来

  1 #include<stdio.h>
  2 #include<sys/types.h>
  3 #include<unistd.h>
  4 int main()
  5 {
  6     //更改当前工作目录
  7     chdir("./wdz");//没有这个目录不会更改,我这里是创建好了这个目录                                                       
  8 
  9     // cwd/hello.txt  
 10     FILE* file = fopen("hello.txt","w");//文件不存在会在当前工作目录下创建
 11     if(file==NULL)
 12     {
 13         return 1;
 14     }
 15     fclose(file);
 16 
 17 
 18     while(1)
 19     {
 20         printf("I am a process! myid:%d parentid:%d\n",getpid(),getppid());
 21         sleep(1);
 22     }
 23     return 0;
 24 }

这里通过修改当前目录已经对将文件创建在更改的目录下:

可以发现:

  • 默认情况下,进程所处的目录就是当前工作目录
  • 一个进程可以找到自己的可执行程序
  • 每一个进程都有自己的工作目录

2. 通过系统调用创建进程-fork

2.1 初识fork

首先使用fork创建一个进程

    #include<stdio.h>
    #include<unistd.h>
    #include<sys/types.h>
   int main()
   {
       printf("我是一个父进程我的pid:%d\n",getpid());
      //创建一个子进程! 
      pid_t id = fork();
    //fork之前只有父进程会执行fork之前的代码,fork之后父子进程都要执行后面的代码
      while(1)
      {
          printf("我是一个进程,pid:%d,ppid%d,fork return:%d\n",getpid(),getppid(),id);
            //这个printf函数在代码这里只调用一次,但在运行时调用了两次
          sleep(1);//for test
      }
      return 0;
  }

运行结果:

看到这里大家的疑惑就出来了

目前可以发现:只有父进程执行fork之前的代码,fork之后,父子进程都要执行后续的代码!

一个函数竟然会有两个返回值???fork成功的时候,会有两个不同的返回值,给子进程返回0;
给父进程返回子进程的pid

fork代码的一般写法:

1.我们为什么要创建子进程?

       我们想让子进程协作父进程完成一些工作,这些工作是单进程解决不了的

2.我们创建子进程是为了让子进程和父进程做一样的事情吗??

       我们创建子进程,就是为了让子进程和父进程做不一样的事情,执行不一样的代码

3. 应该如何保证父子进程做不一样的事情呢?

       可以通过判断fork的返回值,判断谁是父,谁是子,然后让他们执行不同的代码片段!!

使用 if 对父子进程分流:

#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>
int main()
{
    printf("我是一个父进程我的pid:%d\n",getpid());
    //创建一个子进程! 
    //bash也是用C语言写的,命令行启动的进程,都是bash的子进程,所以bash源代码中创建子进程也是用的fork
    pid_t id = fork();  
    //fork()之后,用if进行分流    
    if(id<0) return 1; //进程创建失败                                                                                                          
    else if(id == 0)      
    {                  
        //子进程       
        while(1)       
        {              
            printf("我是子进程,pid:%d,ppid%d,ret:%d,正在执行下载\n",getpid(),getppid(),id); 
            sleep(1);//for test      
        }              
    }                  
    else               
    {                  
        //父进程       
        while(1)       
        {              
            printf("我是父进程,pid:%d,ppid%d,ret:%d,正在执行播放任务\n",getpid(),getppid(),id);   
            sleep(1);//for test    
        }
    }
    return 0;
}

执行结果

可以发现通过 if 对fork函数返回值进行判断,实现了父子进程可以执行不同的任务。

2.2 fork原理

对于上面的现象,我们来解答一下疑惑

  • 1.fork做了什么事情??
  • 2.为什么fork函数会有两个返回值?
  • 3.为什么fork的两个返回值,会给父进程谅回子进程pid,给子进程返回0?
  • 4.fork之后:父子进程谁先运行??
  • 5.如何理解同一个变量,会有不同的值??

1. fork做了什么事情??

      用于创建一个进程,在内核中操作系统重新为其申请了一个PCB,并使用父进程的PCB进行初始化,且子进程与父进程同时指向相同的代码。所以fork之前的代码子进程也是可以看到的。

那为什么子进程不从头开始执行呢?

       因为有程序计数器pc,会使代码一句一句执行,子进程在创建时和继承父进程的pc。所以说也会继续向下执行。


2.为什么fork函数会有两个返回值?

       首先fork是一个函数,如果一个函数return时,说明一个函数的核心工作已经做完。我们知道fork之后代码会共享,所以是fork函数做完核心工作后就会共享,return也会父子进程共享,所以会有两个返回值。


3.为什么fork的两个返回值,会给父进程谅回子进程pid,给子进程返回0?

       因为一个父进程可以有多个子进程,父进程信息中只有pid 和 ppid,为了唯一确定子进程,以后管理和控制子进程,所以返回子进程的pid,而子进程中由于有父进程ppid,所以返回0用来判断进程创建成功没有即可。


4.fork之后:父子进程谁先运行??

       不确定。创建完成子进程,只是一个开始。创建完成子进程之后,系统的其他进程,父进程,和子进程,接下来要被调度执行的,当父子进程的PCB都被创建并在运行队列中排队的时候,哪一个进程的PCB先被选择调度,那个进程就先运行,由操作系统自主决定!!由各自PCB中的调度信息(时间片,优先级等)+调度器算法共同决定。


5.如何理解同一个变量,会有不同的值??

      进程的独立性,首先是表现在有各自的PCB,进行之间不会互相影响!代码本身是只读的,不会影响!但是数据父子是会修改的,所以代码共享,但是数据各个进程必须想办法各自私有一份!!

这个怎么做到的?通过写时拷贝。这样做的好处就是不用将所有的数据都进行拷贝,当数据需要修改时才做拷贝,可以提高效率。

本篇结束!

相关文章
|
17天前
|
算法 Linux 调度
深入理解Linux操作系统的进程管理
本文旨在探讨Linux操作系统中的进程管理机制,包括进程的创建、执行、调度和终止等环节。通过对Linux内核中相关模块的分析,揭示其高效的进程管理策略,为开发者提供优化程序性能和资源利用率的参考。
43 1
|
5天前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
49 13
|
12天前
|
SQL 运维 监控
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
|
20天前
|
运维 监控 Linux
Linux操作系统的守护进程与服务管理深度剖析####
本文作为一篇技术性文章,旨在深入探讨Linux操作系统中守护进程与服务管理的机制、工具及实践策略。不同于传统的摘要概述,本文将以“守护进程的生命周期”为核心线索,串联起Linux服务管理的各个方面,从守护进程的定义与特性出发,逐步深入到Systemd的工作原理、服务单元文件编写、服务状态管理以及故障排查技巧,为读者呈现一幅Linux服务管理的全景图。 ####
|
1月前
|
缓存 监控 Linux
linux进程管理万字详解!!!
本文档介绍了Linux系统中进程管理、系统负载监控、内存监控和磁盘监控的基本概念和常用命令。主要内容包括: 1. **进程管理**: - **进程介绍**:程序与进程的关系、进程的生命周期、查看进程号和父进程号的方法。 - **进程监控命令**:`ps`、`pstree`、`pidof`、`top`、`htop`、`lsof`等命令的使用方法和案例。 - **进程管理命令**:控制信号、`kill`、`pkill`、`killall`、前台和后台运行、`screen`、`nohup`等命令的使用方法和案例。
138 4
linux进程管理万字详解!!!
|
25天前
|
缓存 算法 Linux
Linux内核的心脏:深入理解进程调度器
本文探讨了Linux操作系统中至关重要的组成部分——进程调度器。通过分析其工作原理、调度算法以及在不同场景下的表现,揭示它是如何高效管理CPU资源,确保系统响应性和公平性的。本文旨在为读者提供一个清晰的视图,了解在多任务环境下,Linux是如何智能地分配处理器时间给各个进程的。
|
1月前
|
存储 运维 监控
深入Linux基础:文件系统与进程管理详解
深入Linux基础:文件系统与进程管理详解
78 8
|
1月前
|
网络协议 Linux 虚拟化
如何在 Linux 系统中查看进程的详细信息?
如何在 Linux 系统中查看进程的详细信息?
78 1
|
1月前
|
Linux
如何在 Linux 系统中查看进程占用的内存?
如何在 Linux 系统中查看进程占用的内存?
|
1月前
|
算法 Linux 定位技术
Linux内核中的进程调度算法解析####
【10月更文挑战第29天】 本文深入剖析了Linux操作系统的心脏——内核中至关重要的组成部分之一,即进程调度机制。不同于传统的摘要概述,我们将通过一段引人入胜的故事线来揭开进程调度算法的神秘面纱,展现其背后的精妙设计与复杂逻辑,让读者仿佛跟随一位虚拟的“进程侦探”,一步步探索Linux如何高效、公平地管理众多进程,确保系统资源的最优分配与利用。 ####
71 4