【linux进程(一)】深入理解进程概念--什么是进程?PCB的底层是什么?

简介: 【linux进程(一)】深入理解进程概念--什么是进程?PCB的底层是什么?

1. 前言

相信大家多多少少听说过进程这个词

先带大家做一个进程的简单的介绍:

  • 课本概念: 程序的一个执行实例
    或正在执行的程序
  • 内核观点: 担当分配系统资源(CPU,内存)的实体

本章重点:

本章会重点讲解操作系统是如何
管理进程的,PCB的概念以及Linux
下的PCB实体,到底什么是进程?
最后讲解进程对应的标识符:pid
和ppid的概念以及查看方式

注:建议先阅读这篇文章:Linux进程学习基础

理解"先描述再再组织"的概念!


2. PCB初认识(os是怎样管理进程的?)

在冯诺依曼系统中讲到,管理的本质不是

真正的管理实体本身,而是管理它的数据

虽然现在我们不知道什么是进程,但是

我们可以通过先描述,再组织这一结论

得出,操作系统管理进程肯定也是管理

进程对应的数据,请看下图:

操作系统将可执行程序的各种数据提取
出来,再创建一个结构体把数据存进去
由于同时会存在多个进程,所以操作系统
使用链表或其他数据结构将它们链接在一起
虽然我们并不知道进程中都有什么数据
但是可以假设或者猜想一下:

struct data
{
  //id
  //代码/函数地址
  //状态(是否被CPU处理)
  //优先级
  struct data* next
}

新概念来了:
这个进程属性的结构体被称为PCB
也叫进程控制块

当然,PCB是这个结构体的总称,在Linux
系统下,PCB具体叫做:struct task_struct'

所以操作系统(os)是怎样管理进程的呢?

os对进程的管理被建模成为了

对链表中结构体的增删查改!


3. CPU对于进程列表的处理

进程被链接在链表中会等待CPU去PCB找

数据做处理,那么CPU怎么知道要处理哪些

数据呢?这不得不提到进程排队的概念:

把对应的PCB从链表中提取到

队列中排队,PCB中的数据不会

一次性被CPU处理完,它有时被处理

有时在等待被处理,这是一种动态

运行的特征,请看下图:

讲这些概念是想让大家了解,操作系统内

对于进程的控制十分复杂,一个PCB可能

链接到多个数据结构上,比如这里的PCB

既链接在管理PCB的链表上,又链接在

排队队列的队列中!

结论: 进程=可执行程序 + 内核数据结构(PCB)


4. 进程标识符:pid

每一个进程都有自己对应的pid

查看当前进程的信息:

使用指令: ps ajx

这样查看的是所有的进程,很难帮助

我们学习,现在写一个死循环程序并运行

让它一直处于进程运行的状态:

#include<stdio.h>  
 #include<unistd.h>  
 int main()  
 {
     while(1)//死循环
     {
         printf("我现在是一个进程了\n");
         sleep(1);//休眠一秒                                                                                                                                         
     }                                       
     return 0;                           
 }

现在让程序运行起来,再去查看进程:

在所有进程中搜索我刚刚写的可执行程序:

使用指令: ps ajx | grep mybin

将进程信息的第一行打印出来:

使用指令: ps ajx | head -1

请看下面视频:

查看进程

可以看见当前mybin程序的进程pid是

8336,这里有两个mybin的原因是,grep

指令本身也要形成mybin文件,所以其实

第二个红字mybin是grep的!


5. 在Linux下使用指令终止进程

在我们的程序运行时,可以在运行的

地方按CTRL+c来结束进程,但是

还有一种方法可以结束进程:

使用指令: kill -9 要杀掉的进程id

(注:这里的-9是信号参数,直接使用即可)

请看下面的视频演示:

使用指令结束进程


6. 系统调用函数:getpid

每次查看进程使用都要使用ps指令

我感觉非常的麻烦,于是这里有一个

系统调用的节后函数可以直接返回

当前进程的pid,由于操作系统是由C

语言编写的,所以可以直接在程序中调用此函数:

使用函数:getpid

使用man手册查看getpid相关信息:

#include<stdio.h>                                                         
#include<unistd.h>  
#include<sys/types.h>  
int main()  
{  
   pid_t id = getpid();  
    while(1)//死循环  
    {  
        printf("我现在是一个进程了,我的pid是: %d\n",id);                      
        sleep(1);//休眠一秒                          
    }                                                
    return 0;                                        
}

请看以下视频观察情况:

用系统调用函数查看pid


7. 父进程和子进程的概念

在使用ps指令查看进程详情时,除了

pid我们可以看见左边还有一个ppid

这是parent pid的意思,也就是父进程

的pid,请看下图:

再来学习一个可以查看父进程id的函数:

使用函数: getppid()

现在我们将此函数进入C语言代码中来观察现象:

#include<stdio.h>    
#include<unistd.h>    
#include<sys/types.h>    
int main()    
{    
    pid_t parid = getppid();    
    pid_t id = getpid();    
    while(1)//死循环    
    {    
        printf("我现在是一个进程了,我的pid是: %d 我的ppid是: %d\n",id,parid);    
        sleep(1);//休眠一秒    
    }                                                                                                                                                                   
    return 0;                                                                                                                                                        
}

请看以下视频观察情况:

父进程与子进程查看

可以发现,每次运行时,子进程的id都在变化
然而父进程的id一直没变!这是因为在命令行
中,父进程一般是命令行解释器: bash

现在可以去查看一下父进程的详情:

bash的pid查看

可以看见,bash的pid和打印出来的ppid一样

那么本篇文章先给出一个父子进程的结论

更多关于父子进程和创建子进程的内容我将

在下一篇文章讲解,这里只是先做了解

结论:

Linux中创建进程的方式有两种
1是命令行中直接启动可执行程序
2是通过代码创建进程(下篇文章的重点)
启动进程的本质就是创建进程,一般是
通过父进程创建子进程,构成一种父子关系
而命令行中启动的进程都是由bash为
父进程模拟创建子进程的!


8. 总结以及拓展

Linux进程的学习是Linux学习中

三座大山之一,它的抽象程度不亚于学习

大物时的薛定谔方程,所以看完本篇文章

你如果是一头雾水的话也不要怕,后期还会

有更多对于进程的理解和完善!

对于系统调用的拓展

我们使用的getpid和getppid是系统调用函数

而在冯诺依曼体系中讲到,如何用户想要访问

底层的数据必须经过系统调用这一门槛!

然而系统调用是怎样将pid或ppid
返回给用户的呢?其实很好理解

pid和ppid的值是数据,那么数据是被存储
在进程控制块PCB中的,而PCB的本质
是一个结构体,所以操作系统只需要写一个
函数,将结构体中的pid或ppid作为返回值
返回给用户即可,请看下图加深理解:


🔎 下期预告:Linux进程之代码创建进程 🔍


相关文章
|
3天前
|
Unix Linux
linux进程状态基本语法
linux进程状态基本语法
|
3天前
|
缓存 Linux 编译器
【Linux】多线程——线程概念|进程VS线程|线程控制(下)
【Linux】多线程——线程概念|进程VS线程|线程控制(下)
11 0
|
3天前
|
存储 Linux 调度
【Linux】多线程——线程概念|进程VS线程|线程控制(上)
【Linux】多线程——线程概念|进程VS线程|线程控制(上)
13 0
|
3天前
|
存储 NoSQL Unix
【Linux】进程信号(下)
【Linux】进程信号(下)
16 0
|
3天前
|
安全 Linux Shell
【Linux】进程信号(上)
【Linux】进程信号(上)
13 0
|
2月前
|
Linux Shell 调度
【Linux】7. 进程概念
【Linux】7. 进程概念
51 3
|
2月前
|
存储 缓存 Linux
【Linux】进程概念(冯诺依曼体系结构、操作系统、进程)-- 详解
【Linux】进程概念(冯诺依曼体系结构、操作系统、进程)-- 详解
|
22天前
|
存储 Linux Shell
Linux进程概念(上)
冯·诺依曼体系结构概述,包括存储程序概念,程序控制及五大组件(运算器、控制器、存储器、输入设备、输出设备)。程序和数据混合存储,通过内存执行指令。现代计算机以此为基础,但面临速度瓶颈问题,如缓存层次结构解决内存访问速度问题。操作系统作为核心管理软件,负责资源分配,包括进程、内存、文件和驱动管理。进程是程序执行实例,拥有进程控制块(PCB),如Linux中的task_struct。创建和管理进程涉及系统调用,如fork()用于创建新进程。
37 3
Linux进程概念(上)
|
18天前
|
存储 Shell Linux
Linux进程概念(下)
本文详细的介绍了环境变量和进程空间的概念及其相关的知识。
22 0
Linux进程概念(下)
|
19天前
|
Linux Shell 调度
Linux进程概念(中)
本文详细解析了Linux进程的不同状态,包括运行、阻塞、挂起,以及僵尸和孤儿进程的概念。讨论了进程优先级的重要性,以及操作系统如何通过活动队列、过期队列和优先级管理进程调度。
28 0