『 Linux 』进程概念

简介: 『 Linux 』进程概念


🗞️ 冯诺依曼体系结构 🗞️

数学家冯·诺依曼提出了计算机制造的三个基本原则,即采用二进制逻辑、程序存储执行以及计算机由五个部分组成运算器、控制器、存储器、输入设备、输出设备),这套理论被称为冯·诺依曼体系结构。

存储器:

在当前的计算机组成当中,存储方式分为内存存储与硬盘存储等;

与之不同的是硬盘为非易失性存储器(断电不易失),内存为易失性存储器(断电易失);

输入设备:

在生活当中, 键盘,摄像头,话筒,磁盘(读取文件),网卡等都为输入设备;

输出设备:

显示器,音响,磁盘(写入文件)网卡等都为输出设备;

CPU(中央处理器):

  • 运算器
    算逻运算 - 算术运算(±运算等)与逻辑运算(if,else)
  • 控制器
    CUP是可以相应外部事件的(协调外部就绪事件,例如将数据拷贝至内存当中)

📃 为什么在计算机当中需要使用内存充当中间介质而不使CUP与外设直接进行交互?

在各个存储介质当中,不同类型的存储介质的读取速度也不同

响应速度分别为:

CPU&&寄存器 > 内存 > 磁盘/SSD > 光盘 > 磁带

在最早的计算机当中是不存在内存的;

也就是外设与CUP之间直接进行交互;

但是实际上在计算机当中,最影响计算机整体速度的并不是计算机中最快的,而是最慢的;

若是使外设直接与CPU直接进行交互将会导致外设的速度大大拖慢CPU的速度导致计算机整体效率变慢;

而若是在计算机当中添加存储器后,可以使得外设中的数据通过操作系统率先load(加载)至存储器中,而又由于存储器与CPU的读写速度相差跨度并不是特别大,所以当数据加载至存储器当中CPU可以直接访问存储器从而加快计算机整体的速度;


📃 CPU如何读取数据

以当前大环境而言,CPU一般读取数据(数据,代码)都是从内存之中进行读取;所以若是以数据的角度进行观察:CPU不和外设直接进行交互;

当CPU需要处理数据时会首先将外设中的数据加载到内存当中(外设只与内存进行交互);

以这种方式可以进行一种分类

  • input
    将数据从外设(输入设备)加载至内存中;
  • output
    将数据从内存加载至外设(输出设备)当中;

当数据需要处理时数据首先会加载至内存,通过CPU读取内存数据并作出相应处理;

当数据处理完毕之后并不会直接从CPU转至外设(输出设备),会先将处理后的数据存放回内存并让外设(输出设备)进行显示;


🗞️ 操作系统(Operating system) 🗞️

操作系统可以看作一个用来对软硬件资源进行管理的软件;

硬件

硬件是整个计算机之中最基本的,任何操作系统都是基于硬件之上;

而在一个机器当中的所有硬件都是按照冯诺依曼体系结构进行存放,不存在杂乱无章;

驱动程序

而紧接着在硬件之上就是驱动程序,驱动程序也是系统软件部分的一部分,它的主要功能就是对硬件进行操作;

主要提供软件级别的对硬件操作的接口;

操作系统的主要工作分为两个方面:

  • 对上提供良好的使用环境;
  • 对下通过管理软硬件资源使计算机保持更高的稳定性;

📃 操作系统如何对资源进行管理

操作系统对资源进行管理时主要按先描述后组织的概念进行管理;

操作系统在整体中处于一个管理者的位置,而这里的先描述后组织的意思即为:

管理者将所有的被管理者以特定的结构进行描述,由于被管理者类型的不同,所以整体的结构也跟着不同;

由于大部分常见的操作系统都是由C/C++开发,所以可以将这个所谓的结构看成是一个结构体(被管理者可以看成类似实例化);

struct A{
    /*属性*/
};

而管理者正式通过这些对象的属性,根据需要的条件对资源进行操作和管理;


🗞️ 进程 🗞️

由于操作系统需要对软硬件资源都进行管理,当然这里的资源也包括进程;

从之前的知识点中可以总结出一条结论:当一个程序被运行时,必须将该程序先加载到内存当中,这是因为由于冯诺依曼体系结构规定CPU访问数据时或者要对数据进行对应操作时首先必需从内存中访问;

当然这句话说的并不全面,对于"当一个程序被运行时,必须将改程序先加载到内存当中",事实是如此,但这仅仅只是以硬件的角度进行观察,真正意义上来说,当一个程序被运行之后,将不能叫做程序,应该叫做"进程的一部分";

以Windows11为例,当我Ctrl+Alt+del并选择任务管理器时可以观察到许多进程;

根据用户的需要,用户可以通过这个任务管理器去结束相应的进程;

本质上操作系统并不具备直接管理程序的能力,但是操作系统中存在着一个进程管理;

当一个程序被运行起来之后,它将被加载进内存成为进程的一部分,而操作系统通过进程管理可以完成对这个进程的资源管理;

在Linux中也是如此,每当运行一个程序或者执行一条命令时都是将程序/命令加载进内存使其成为进程从而对该资源进行对应的管理;


📃 进程是如何被管理的?

在Linux中,可以同时运行多个程序或者同时执行多条命令的,当然这也意味着在Linux是可能同时存在大量的进程;

那么当Linux同时存在大量的进程时,操作系统该如何对进程这个资源进行管理;

其实很简单,在上文中我们提到的一个概念为 “先描述,后组织”;

操作系统对进程的管理也是如此;

在进程种有一种数据结构叫做PCB(Process Control Block),也可以称之为进程控制块,可以理解为进程属性的集合;

而在Linux下描述进程信息的PCB为task_struct,是以结构体的形式进行实现的;

当一个程序加载进内存成为进程时,操作系统将自动为这个进程创建一个PCB结构体对象,实现对这些进程的描述;相应的这个结构体内存着对应进程的所有属性,而操作系统将用某种数据结构将这些结构体对象链接在一起,从而使得能够通过不同的属性对进程进行对应的资源管理;

这就可以理解了为什么说"当程序被加载进内存的时候就成为了进程的一部分",因为只有加载进内存的程序(代码与数据) + 该进程所对应的PCB结构体这个整体才能称为是一个进程;

在PCB种包含的结构体化的数据属性中包含了:

  • 标识符
    描述本进程的标识符;
  • 状态
    任务状态,退出代码等;
  • 优先级
    程序相对于其他进程的优先级;
  • 程序计数器
    程序中即将被执行的下一条指令的地址;
  • 内存指针
    程序对应的代码以及数据的位置信息;
  • 上下文数据
    进程执行时处理器的寄存器中的数据;
  • I/O状态
  • 记账信息
    可能包括处理器时间总和等各种信息;
  • 其他

📃 如何观察进程?

在上文中我们提到了进程有关的概念,那么在Linux中该如何观察进程?

  • 在Linux一般可以使用ps来观察进程;

但是ps只能观察当前窗口(终端)的进程;

若是想要观察所有的进程的话需要使用指令ps axj,当然也可以配合管道|grep来查到对应所需要的进程;

那么该如何更直观的观察到进程?

假设有一个.cpp文件,代码为:

#include<iostream>
using namespace std;
int main()
{
    while(1) cout<<"进程1"<<endl;
}

并执行这段程序;

此时就已经是执行了一个进程,当然可以使用ps命令的方式观察这个进程;

使用ps axj | head -1 && ps axj | grep myproc查询该进程:

该进程就已经跑了起来;

此时在终端使用ctrl+C结束该进程并再次查询该进程时发现该进程不存在;


  • 在Linux中除了用ps命令以外还可以使用top命令;

top命令在Linux中可以看作是Windows下的任务管理器;


📃 以文件目录的形式观察进程

  • 除了可以以上面的方式观察进程以外还可以以目录文件的形式观察进程;

以上面的方式我们再次运行那个程序,将进程跑起来;

  1. 先使用ps的方式查看进程的对应信息;

    将会看到PID与PPID;
    我们首先观察23460的这个进程(下面的进程为使用grep时的进程,在本次中可以不进行观察);
  2. 再使用ls查看目录/proc;

    可以发现/proc目录下的文件就是一些进程;
  3. 再使用ll并使用grep来找当前目录下的PID23460的这个进程(此时进程还在运行当中);

    当我们手动使用Ctrl+C将程序结束时再使用该指令查找该进程时将发现该进程已经不存在;

但这并不说明进程在Linux中是以目录的形式存在,实际上/proc是Linux中的一个文件系统,而这个文件系统是一个伪文件系统,通过该文件系统可以访问进程的属性信息而已;

使用ll观察23460这个目录下的文件可以发现,在该目录下存在着两个文件;

这两个文件分别以cwdexe开头;

  • exe 后所跟的路径为,当前进程所对应程序所在的路径;
  • cwd 后所跟的路径为,当前进程的工作目录;
    当一个程序运行时,每个进程都将会有一个属性来保存当前自身所在的工作路径;

📃 进程标识符

在上面提到了关键字PID,而实际上PID即为进程的标识符;

每个进程所对应的PCB都将会存储这个进程标识符;

进程标识符是每个进程中独有的属性;

当然每个进程在每次运行时其PID都将不同;

在程序中也可以使用getpid()函数来进行对当前进程PID的获取;

其中pid_t为操作系统中的一个数据类型,是一个无符号整型;

#include<iostream>
#include<sys/types.h>
using namespace std;
int main()
{
    while(1) cout<<"进程1 "<<"PID : "<<getpid()<<endl;
}

从这里可以看到这里所获取的PID与之前观察到的PID都不同,可以验证在上面所说的"每个进程在每次运行时其PID都将不同";

  • 除了以Ctrl+C的形式结束进程以外也可以使用kill -9 'PID'的形式结束进程;



📃 父进程

除了进程以外还有父进程,也可以在程序中使用getppid()函数来获取该进程的父进程的PID;

而实际上PPID即为bash(Bash 是一种命令行解释器和 shell 程序);

Shell通过创建子进程的方式来完成对应的任务;

相关文章
|
11月前
|
并行计算 Linux
Linux内核中的线程和进程实现详解
了解进程和线程如何工作,可以帮助我们更好地编写程序,充分利用多核CPU,实现并行计算,提高系统的响应速度和计算效能。记住,适当平衡进程和线程的使用,既要拥有独立空间的'兄弟',也需要在'家庭'中分享和并行的成员。对于这个世界,现在,你应该有一个全新的认识。
372 67
|
10月前
|
NoSQL Linux 编译器
GDB符号表概念和在Linux下获取符号表的方法
通过掌握这些关于GDB符号表的知识,你可以更好地管理和理解你的程序,希望这些知识可以帮助你更有效地进行调试工作。
422 16
|
10月前
|
Web App开发 Linux 程序员
获取和理解Linux进程以及其PID的基础知识。
总的来说,理解Linux进程及其PID需要我们明白,进程就如同汽车,负责执行任务,而PID则是独特的车牌号,为我们提供了管理的便利。知道这个,我们就可以更好地理解和操作Linux系统,甚至通过对进程的有效管理,让系统运行得更加顺畅。
280 16
|
10月前
|
Unix Linux
对于Linux的进程概念以及进程状态的理解和解析
现在,我们已经了解了Linux进程的基础知识和进程状态的理解了。这就像我们理解了城市中行人的行走和行为模式!希望这个形象的例子能帮助我们更好地理解这个重要的概念,并在实际应用中发挥作用。
201 20
|
9月前
|
监控 Shell Linux
Linux进程控制(详细讲解)
进程等待是系统通过调用特定的接口(如waitwaitpid)来实现的。来进行对子进程状态检测与回收的功能。
210 0
|
9月前
|
存储 负载均衡 算法
Linux2.6内核进程调度队列
本篇文章是Linux进程系列中的最后一篇文章,本来是想放在上一篇文章的结尾的,但是想了想还是单独写一篇文章吧,虽然说这部分内容是比较难的,所有一般来说是简单的提及带过的,但是为了让大家对进程有更深的理解与认识,还是看了一些别人的文章,然后学习了学习,然后对此做了总结,尽可能详细的介绍明白。最后推荐一篇文章Linux的进程优先级 NI 和 PR - 简书。
285 0
|
9月前
|
存储 Linux Shell
Linux进程概念-详细版(二)
在Linux进程概念-详细版(一)中我们解释了什么是进程,以及进程的各种状态,已经对进程有了一定的认识,那么这篇文章将会继续补全上篇文章剩余没有说到的,进程优先级,环境变量,程序地址空间,进程地址空间,以及调度队列。
167 0
|
9月前
|
Linux 调度 C语言
Linux进程概念-详细版(一)
子进程与父进程代码共享,其子进程直接用父进程的代码,其自己本身无代码,所以子进程无法改动代码,平时所说的修改是修改的数据。为什么要创建子进程:为了让其父子进程执行不同的代码块。子进程的数据相对于父进程是会进行写时拷贝(COW)。
228 0
|
12月前
|
存储 Linux 调度
【Linux】进程概念和进程状态
本文详细介绍了Linux系统中进程的核心概念与管理机制。从进程的定义出发,阐述了其作为操作系统资源管理的基本单位的重要性,并深入解析了task_struct结构体的内容及其在进程管理中的作用。同时,文章讲解了进程的基本操作(如获取PID、查看进程信息等)、父进程与子进程的关系(重点分析fork函数)、以及进程的三种主要状态(运行、阻塞、挂起)。此外,还探讨了Linux特有的进程状态表示和孤儿进程的处理方式。通过学习这些内容,读者可以更好地理解Linux进程的运行原理并优化系统性能。
445 4
|
12月前
|
Linux 数据库 Perl
【YashanDB 知识库】如何避免 yasdb 进程被 Linux OOM Killer 杀掉
本文来自YashanDB官网,探讨Linux系统中OOM Killer对数据库服务器的影响及解决方法。当内存接近耗尽时,OOM Killer会杀死占用最多内存的进程,这可能导致数据库主进程被误杀。为避免此问题,可采取两种方法:一是在OS层面关闭OOM Killer,通过修改`/etc/sysctl.conf`文件并重启生效;二是豁免数据库进程,由数据库实例用户借助`sudo`权限调整`oom_score_adj`值。这些措施有助于保护数据库进程免受系统内存管理机制的影响。