『 Linux 』使用fork函数创建进程与进程状态的查看(下)

简介: 『 Linux 』使用fork函数创建进程与进程状态的查看(下)

『 Linux 』使用fork函数创建进程与进程状态的查看(上)https://developer.aliyun.com/article/1424455


🖥️ 通过系统调用创建子进程 fork() 🖥️

unistd.h头文件中,还包含了一个函数pid_t fork();

该函数可以在当前进程中创建子进程;

而该函数的返回值分为三种:

  • 当该函数创建子进程失败则返回-1;
  • 当该进程为父进程时,该函数的返回值为子进程的PID;
  • 当该进程为子进程时,该函数的返回值为0;

示例:

#include<iostream>
#include<unistd.h>
using namespace std;
void test2(){
  cout<<"it'a test"<<endl;
  fork();
  cout<<"hello world"<<endl;
}
int main()
{
  test2();
  return 0;
}

当运行这段程序后所得的结果为:

$ ./myproc 
it'a test
hello world
hello world

本质上的原因是因为这个函数创建了子进程,而父子进程中代码是共享的,所以第一句代码只执行了一次,而fork()之后创建了子进程,第二句代码执行了两次的原因;


💻 那么为什么在fork()函数当中有两个返回值;

这里可以将fork()函数的内部看成两种代码,分别是最后的返回以及其他代码;

pid_t fork(){
    pid_t ret;
    //其他代码,主要用于创建子进程
    return ret;
}

从这里可以推断出,当该函数即将结束时,也就是在函数返回之前,其核心操作(创建子进程)已经结束;

当子进程被创建后代表将会多一个执行流用于最后一步的return;

实际上在操作系统当中,会为每个CPU准备一个对应的运行队列,其中这个运行队列当中的各个节点就相当于一个pcb结构体,同时这个节点中还存储着其对应的代码及数据;

当一个进程被运行时将会被操作系统加载到该CPU的运行队列中,而CPU采用分时多任务的方式对这些进程进行操作;

进程结束时这个进程将会被操作系统从运行队列中移出;

同时当子进程被创建之后将多一条执行流,而在接下来的代码当中是父进程先执行还是子进程先执行这是由操作系统的调度器来决定的;

在操作系统中不单单只有运行队列,在整体中CPU能算是一种资源,但是这个资源并不属于单单的一个进程,而是多个进程共用的;

对于其他的资源来说不同的资源都有着对应的队列(就绪队列,阻塞队列等),各个进程通过加载进对应的队列来实现对计算机当中各个资源的使用;


🔋 创建子进程后分区工作 🔋

在使用fork()创建子进程后子进程与父进程都将共享代码,那么在共享代码的前提下如何使得创建子进程后提高整体效率?

从上文可知,该函数在创建子进程时将有三种返回值,即>0父进程,==0子进程,<0创建进程失败;

可以在程序中使用分支语句根据不同的条件使得不同的进程来完成不同的工作;

示例:

#include<iostream>
#include<unistd.h>
using namespace std;
void test3(){
  pid_t ret = fork();
  if(ret<0) cerr<<"fork fail"<<endl;
  if(ret==0) while(1){
    cout<<"子进程 ret:"<<ret<<"  PID: "<<getpid()<<"  PPID: "<<getppid()<<endl;
  sleep(1);
  }
  if(ret>0)while(1){
    cout<<"父进程 ret:"<<ret<<"  PID: "<<getpid()<<"  PPID: "<<getppid()<<endl;
  sleep(1);
  }
}
int main()
{
  test3();
  return 0;
}

在该段代码中,使用了if分支语句将子进程与父进程进行分流工作从而达到子进程与父进程不无意义的重复同一项工作;

##结果
子进程 ret:0  PID: 13412  PPID: 13411
父进程 ret:13412  PID: 13411  PPID: 13265
子进程 ret:0  PID: 13412  PPID: 13411
父进程 ret:13412  PID: 13411  PPID: 13265

🖥️ 进程状态 🖥️

在操作系统中,进程也被称作为任务,而一个任务他的状态不一定是持续的;同时在操作系统中进程拥有多种状态,称之为进程状态;


💻 操作系统的进程状态

在操作系统中常见的进程状态有几种:

  • 新建状态
    当一个进程正在被创建时,操作系统将会为其分配系统资源,并初始化该进程对应的PCB结构体;

  • 运行状态
    当一个进程已经被加载至运行队列当中,这个进程即为运行态,进程的运行态并不代表这个进程将一直占用这个CPU,会以一种分时多任务的方式将CPU逐个分配运行队列中的各个进程,同时在这个时候,进程拥有了CPU资源和其他的所需资源;


  • 就绪状态
    当一个进程已经被创建,且已经分配好了其他资源,但操作系统还并未给该进程分配CPU资源,即该进程并未被加载至运行队列当中称之为就绪状态;

  • 阻塞状态
    当一个进程既没有CPU资源也没有其他所需资源时称之为阻塞状态;举一个例子:当一个进程原本在运行队列当中,但是这个进程中的某段代码需要去访问除了CPU外的其他资源(例如输入输出设备或者是其他设备时),这个进程将会从原本的运行队列加载至其他队列,这个队列就称之为阻塞队列,此时这个进程的状态就称之为阻塞状态;

即等待非CPU资源就绪称之为阻塞状态(调用cin但不输入数据);


  • 挂起状态
    相比于其他状态来说,挂起状态与CPU并没有太直接的关系;在计算机的磁盘当中,存在着一个swap分区,这个分区就是为了当内存不足时使进程状态转化为挂起状态而准备的;
    从上面可以知道,在队列当中的进程不仅仅是PCB结构体,由于各个进程要通过使用资源来操作自身的代码及数据可以得知一个进程中除了PCB结构体以外还包含着对应的代码以及数据;而挂起状态即为:
    当内存严重吃紧时,操作系统会将这个进程所对应的代码及数据交换至磁盘中的swap分区从而到达减轻内存的负担,当这个进程对应的代码及数据被交换至swap分区时这个进程即为挂起状态;


  • 阻塞挂起状态
    阻塞挂起状态,顾名思义,就是既是阻塞状态也是挂起状态;
    当一个进程在等待某种资源就绪时称这个进程的状态为阻塞状态,而当这个进程在等待某种资源时内存吃紧,导致该进程的代码与数据被操作系统移至磁盘的swap分区时,称之为阻塞挂起状态;

💻 Linux操作系统下的进程状态

在该处为了查看进程状态我们可以使用shell脚本语言来循环ps axj;

while : ; do ps axj | head -1 && ps axj | grep myproc | grep -v grep; sleep 1; done #其中grep myproc 中的myproc为该进程的关键字
$ while : ; do ps axj | head -1 && ps ajx | grep myproc | grep -v grep ; sleep 2;  done
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND

//状态在kernel源码中的定义
/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)",    /* 0 */
"S (sleeping)",   /* 1 */
"D (disk sleep)",   /* 2 */
"T (stopped)",    /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)",     /* 16 */
"Z (zombie)",     /* 32 */
};

实际上在Linux中的进程状态在内核中是一个指针数组static const char * const task_state_array[];


🔋 R 运行状态(running) 🔋

运行状态并不意味着该进程一直正在运行当中,当多个进程需要共享即同时使用同一个CPU时将会以分时多任务的方式将该资源分配给多个进程;

就像是打篮球时每个球员对于球的控制都有一定的时间,该在控球时间限制内将球传给另一个球员或者是其他操作;

存在一个程序,其代码为:

void test4(){
  while(1){
    cout<<"hello world"<<endl;
  }
}
int main()
{
  test4();
  return 0;
}

以前面的知识点可以知道当该程序运行时该进程应该为R状态,也就是running运行状态,而当运行这个程序后可以发现;

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383 16857 16857 13383 pts/2    16857 S+    1002   0:00 ./myproc
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND

当程序运行后发现该状态为S+状态,这是因为该程序当中该处调用了std::cout,意思是在该进程当中将会去调用显示器,而在冯诺依曼体系中显示器属于外设,所以当该进程需要去调用外设时这个进程将从调度队列转移到阻塞队列,所以显示出的状态为S+而不是R;

当代码中的cout<<"hello world"<被注释后代表这个程序不需要调用CPU以外的资源,此时这个程序再次被运行时进程状态将会变成R+;

void test4(){
  while(1){
    //cout<<"hello world"<<endl; //将该行注释
  }
}

进程状态如下:

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383 31313 31313 13383 pts/2    31313 R+    1002   0:00 ./myproc

此时的进程状态为R+;

同时该处的R状态对应着操作系统进程概念中的运行状态;


🔋 S 睡眠状态 (sleeping) 🔋

睡眠状态对应的是操作系统进程概念的阻塞状态,当一个进程在等待某种非CPU资源就绪时,称之为睡眠状态;

在测试运行状态的代码中也曾因为调用了外设出现了短暂的sleeping状态;

void test5(){
  int a = 0;
  cin>>a;//调用流提取,表示在运行这个程序时需要等待输入设备输入数据
}
int main()
{
  test5();
  return 0;
}

这段代码使用了流提取,所以需要等待输入设备(键盘)进行输入;

当该程序运行后发现这个进程的状态为S+:

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383  2620  2620 13383 pts/2     2620 S+    1002   0:00 ./myproc

但是该进程状态也被称作可中断睡眠(Interruptible sleep);

这里的可中断睡眠的意思即为可以被被动唤醒;

void test6(){
  sleep(1000);//使用sleep使该进程主动睡眠
}
int main()
{
  test6();
  return 0;
}

当运行该程序时其进程的状态为S+ 的状态;

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383  4437  4437 13383 pts/2     4437 S+    1002   0:00 ./myproc

从这里可以看出该进程的PID为4437;

而在这里若是使用-19信号使该进程被动唤醒;

kill -19 4439
PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383  4437  4437 13383 pts/2     4437 S+    1002   0:00 ./myproc
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383  4437  4437 13383 pts/2    13383 T     1002   0:00 ./myproc

该进程的状态由S+转换为T状态,此时该进程的睡眠状态也已被唤醒;


🔋 D 磁盘休眠状态(Disk sleep) 🔋

磁盘睡眠也称作不可中断睡眠状态(uninterruptible sleep),也被称作深度睡眠,顾名思义即不可被被动唤醒;

在绝大多数情况下,磁盘的睡眠状态是可以被唤醒的,那么对于这个所谓的磁盘休眠状态到底是一种什么样的状态?

当一个进程向磁盘读写数据时,若是这个数据量足够大,则这个进程需要在这个资源继续等待;在等待过程中若是该进程被打断,则容易出现磁盘数据与内存数据不一致的问题;

当内存严重吃紧时,操作系统将会选择性的杀死一些等待过长的没有进行有效操作的进程,若是在进程对磁盘进行读写时将该进程杀死则会出现上述问题;

所以当一个进程向磁盘进行读写时,为了保证数据的一致性,在读写结束之前,即该进程得到磁盘的回复之前,该进程都是一种不可被打断的D 磁盘休眠状态;

在这个情况下,即使使用-9号信号也不能将该进程杀死;

本质上来说,这个不可中断睡眠是操作系统对进程和硬件的一种保护机制;

这个状态下的进程通常会等待IO的结束,这里的IO可能是磁盘IO,网络IO,其他外设的IO;


🔋 T(t) 停止、暂停状态(tracing stopped) 🔋

该状态也被称为暂停状态和调试状态,将一个程序以-g的形式编译并使用GDB进行调试,在打断点之后运行该程序,该程序停止时其进程的状态即为t状态;

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
 7455  7542  7542 13383 pts/2     7455 t     1002   0:00 /home/root/Begin/my_-linux/Pr o23/Process1107/Test1121/myproc

🔋 T 停止、暂停状态(stopped) 🔋

可以通过发送SIGSTOP信号,即-19号信号停止该进程;

当该进程处于停止状态时,可以通过发送SIGCONT状态使其继续运行;

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383 11260 11260 13383 pts/2    11260 S+    1002   0:00 ./myproc
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383 11260 11260 13383 pts/2    13383 T     1002   0:00 ./myproc
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383 11260 11260 13383 pts/2    13383 S     1002   0:00 ./myproc

在调试过程中可以理解为当遇到断点时GDB向进程发送SIGSTOP信号从而达到实现暂停进程;


🔋 X 死亡状态(dead) 🔋

当一个进程已经结束(死亡),但操作系统未及时回收该进程的资源时,这个进程称为死亡状态;

在任务列表当中一般看不到这个状态,是因为这个状态的瞬时性太强,同时该状态只是一个返回状态;


🔋 前台进程 🔋

在上述的进程状态描述当中,实际上出现的进程状态中带了一个符号+;

譬如S+,R+等等;

在操作系统当中,一般进程状态中带+的进程也被称作为前台进程;

前台进程占用的是命令行解释器,即当这个进程在运行时对应的终端不能对命令行进行解释;

同时前台进程可以直接使用Ctrl+C来结束;

$ ./myproc 
test
test
test
^C

若是想将该进程变为后台进程,可以在运行该程序时在最后带上一个&符号;

当使用这种方法将进程以后台进程的形式运行时将会为使用者回显一次该进程的PID,方便使用者对该进程进行对应的操作;

同时,使用这种方式之后,进程将不再占用命令行解释器也不能使用Ctrl+C结束,即命令行解释器可以正常使用;



相关文章
|
21天前
|
缓存 监控 Linux
linux进程管理万字详解!!!
本文档介绍了Linux系统中进程管理、系统负载监控、内存监控和磁盘监控的基本概念和常用命令。主要内容包括: 1. **进程管理**: - **进程介绍**:程序与进程的关系、进程的生命周期、查看进程号和父进程号的方法。 - **进程监控命令**:`ps`、`pstree`、`pidof`、`top`、`htop`、`lsof`等命令的使用方法和案例。 - **进程管理命令**:控制信号、`kill`、`pkill`、`killall`、前台和后台运行、`screen`、`nohup`等命令的使用方法和案例。
87 4
linux进程管理万字详解!!!
|
12天前
|
存储 运维 监控
深入Linux基础:文件系统与进程管理详解
深入Linux基础:文件系统与进程管理详解
53 8
|
9天前
|
Linux
如何在 Linux 系统中查看进程占用的内存?
如何在 Linux 系统中查看进程占用的内存?
|
21天前
|
算法 Linux 定位技术
Linux内核中的进程调度算法解析####
【10月更文挑战第29天】 本文深入剖析了Linux操作系统的心脏——内核中至关重要的组成部分之一,即进程调度机制。不同于传统的摘要概述,我们将通过一段引人入胜的故事线来揭开进程调度算法的神秘面纱,展现其背后的精妙设计与复杂逻辑,让读者仿佛跟随一位虚拟的“进程侦探”,一步步探索Linux如何高效、公平地管理众多进程,确保系统资源的最优分配与利用。 ####
59 4
|
22天前
|
缓存 负载均衡 算法
Linux内核中的进程调度算法解析####
本文深入探讨了Linux操作系统核心组件之一——进程调度器,着重分析了其采用的CFS(完全公平调度器)算法。不同于传统摘要对研究背景、方法、结果和结论的概述,本文摘要将直接揭示CFS算法的核心优势及其在现代多核处理器环境下如何实现高效、公平的资源分配,同时简要提及该算法如何优化系统响应时间和吞吐量,为读者快速构建对Linux进程调度机制的认知框架。 ####
|
Linux C++
Linux进程状态——top,ps中看到进程状态D,S的含义
在top和ps命令中有一列显示进程状态,分别有如下值 值 含义 备注 S 进程处于interruptable sleep状态 na D 进程处于Uninterruptable sleep状态 na R 进程处于运行状态 na Z 进程处于僵尸状态 na T Stop模式,进程要么处于被调试状态 na interruptable sleep vs uninterruptable sleep interruptable sleep 进程等待某个资源处于sleep状态,此时可以通过发送信号将这个进程唤醒。
3740 0
|
11天前
|
监控 Linux
如何检查 Linux 内存使用量是否耗尽?这 5 个命令堪称绝了!
本文介绍了在Linux系统中检查内存使用情况的5个常用命令:`free`、`top`、`vmstat`、`pidstat` 和 `/proc/meminfo` 文件,帮助用户准确监控内存状态,确保系统稳定运行。
93 6
|
12天前
|
Linux
在 Linux 系统中,“cd”命令用于切换当前工作目录
在 Linux 系统中,“cd”命令用于切换当前工作目录。本文详细介绍了“cd”命令的基本用法和常见技巧,包括使用“.”、“..”、“~”、绝对路径和相对路径,以及快速切换到上一次工作目录等。此外,还探讨了高级技巧,如使用通配符、结合其他命令、在脚本中使用,以及实际应用案例,帮助读者提高工作效率。
47 3
|
12天前
|
监控 安全 Linux
在 Linux 系统中,网络管理是重要任务。本文介绍了常用的网络命令及其适用场景
在 Linux 系统中,网络管理是重要任务。本文介绍了常用的网络命令及其适用场景,包括 ping(测试连通性)、traceroute(跟踪路由路径)、netstat(显示网络连接信息)、nmap(网络扫描)、ifconfig 和 ip(网络接口配置)。掌握这些命令有助于高效诊断和解决网络问题,保障网络稳定运行。
37 2
|
19天前
|
缓存 监控 Linux
下一篇
无影云桌面