【Linux】进程优先级|进程并发概念|在vim中批量化注释

简介: 【Linux】进程优先级|进程并发概念|在vim中批量化注释

前言

这篇文章继续上篇内容讲解进程的优先级。

tips——如何在vim中批量化注释

首先进入命令行模式

  • 1.输入ctrl + v
  • 2.然后选择H,J,K,L键进行左下上右移动(注意不能按上下左右的箭头)
  • 3.选中注释区域后,按shift + I键进入插入模式
  • 4.再输入两个反斜杠即可。

进程更深度理解

前面说过,进程 = 描述该进程的PCB结构体对象 + 数据和代码。

而一个PCB结构体对象(task_struct)其实就是进程所有属性的集合。

那么在进程的调度队列数据结构中,如何获取到进程的所有属性呢?

一般一个进程的task_struct结构体对象的大致结构如下:

如何获取到_start的起始地址呢? 如何获取到其他的所有属性呢?

我们应该这样:

(task_struct * )(node_start  -  ( & ( (task_struct *)0->link ) ) )->other

应该这样解释:将0强转成task_struct*指针,即默认0地址处有一个task_struct结构体对象,通过该对象访问到link属性成员,然后再取它的地址,即link成员相对于该结构体起始位置的偏移量。

node_start是link这个位置的起始地址,相减后获得该结构体最起始地址处的地址,将该地址强转成结构体对象,即可访问所有其他属性成员。

所以,通过上面的方法能访问到进程调度队列中的每个数据结构的task_struct的其他所有属性后,在队列排队的每一个task_struct结构体对象就可以是不同类型的对象。

比如下图:

从此以后在调度队列中排队的PCB结构体就能做到不同类型的对象,因为只要知道该对象的类型就能访问所有其他属性,由此更加灵活实现,就允许更多进程可以被同一个调度队列调度!

由此还能引出另一个重大意义:

一个task_struct结构体对象不仅仅可以属于双向链表这个数据结构,还能属于其他数据结构比如二叉树,红黑树等等。

因为通过上面的方法可以访问任意属性成员,就能存储其他数据结构的地址,就能访问到其他数据结构了!

总结:一个task_struct 结构体对象既可以属于双向链表,也可以属于其他数据结构。

一、什么是进程优先级

优先级就是对于资源的访问,谁先谁后的问题!

二、 为什么要有优先级

我们知道,一台电脑的CPU一般只有一个,两个或以上是造价是非常昂贵的。

可是电脑上的进程却有很多个, 只有一个CPU,但是有多个进程,这就意味着进程之间

必然存在竞争CPU资源的关系!

也必然存在进程之间谁先执行,谁后执行的问题!

既然有了竞争关系,就必然要保证良性竞争。

此时就有了优先级的概念,其实就是确定一种谁先谁后访问CPU资源的关系。

所以进程之间就必须排队,排队就必须保证进程优先级。

最典型的例子就是学校的食堂排队打饭。

学校饭堂窗口就那么多个,但是学生有那么多,学生之间有男生有女生,有大个的有小个的,假如大家不按要求排队打饭,可能就是大个的男生能先挤上去,小个子的女生会打不到饭,或者如果存在不合理的排队问题时,导致大个子能吃到饭,小个子吃不到饭,那就会导致大个子的越吃越多,小个子的越吃越少,小个子就会越来越小,就会导致进程过长时间得不到CPU资源,就会引发进程的饥饿问题

综上,必须存在进程优先级的概念,并且要保证良性的优先级!

三、Linux怎么设置优先级

查看进程优先级的命令

使用

ps -l

命令可以查看进程的优先级:

其中,PRI就是优先级(priority)

NI是nice值。

还有其他的进程信息如下:

UID : 代表执行者的身份
PID : 代表这个进程的代号
PPID :代表这个进程是由哪个进程发展衍生而来的,亦即父进程的代号
PRI :代表这个进程可被执行的优先级,其值越小越早被执行
NI :代表这个进程的nice值

实际在OS识别进程时,并不是按照进程的名字进行识别,而是按照进程的PID编号进行识别的。

PRI and NI

进程确认优先级规则如下:

PRI的值越小,该进程越早被执行。

PRI和NI的关系如下:

PRI(new) = PRI(old) + NI

所以NI可以取负数,NI越小,PRI就越小,该进程就越早被执行。

一般情况下,NI的取值范围是:-20~19,共四十个级别

按照这样的情况,我们可以更改进程优先级的!

但是,对操作系统来说,调度器才是最公平的优先级队列调度者,它才能保证最公平的进程调度。

所以,操作系统不希望我们过多地参与进程优先级的修改。

所以这就是为什么NI值有一个范围是[-20,19]的原因!

由于进程的初始PRI是80,Ni值取值范围是-20~19,所以PRI的取值范围就是[60,99]!

用top命令更改已存在进程的nice:

当运行起来一个进程的时候,可以看到myproc这个进程的默认PRI是80。

输入top,进入监控进程。

然后输入r,就会弹出一个PID to renice的提醒。

里面显示默认的pid是1,这里我们要修改的进程的pid是16439,输入16439后进行回车。

上面就提示我们需要将nice值改成多少。

当我输入-30后,就弹出一个:

Permission deny,就是权限不允许的意思。

这意味着普通用户是无法更改nice值的。

下面切换到root用户,

当我再次输入15时,它成功了,我们验证一下:

此时我再将nice值设置成-20试试。

这里有一个问题,NI值是没错,可是上一次的PRI值不是95吗,设置更改了NI值为-20后应该是75,为什么这里变成60了呢?

原因很简单,

PRI(new) = PRI(old) + NI

这条公式中PRI(old)每次更改nice值的时候都是默认从80开始的。

如何根据优先级开展调度呢?

我们知道一个CPU维护一个运行队列(runqueue)

该运行队列的结构体大致如下:

struct runqueue
{
   task struct* running[140];
   task struct* waiting[140];
};

在运行队列中有两个哈希表指针,来映射进程的位置。

一般来说,0~99号位置我们是不能用的,这些位置都是给操作系统的其他进程进行调度的。

从100~139号位置开始,一共40个位置,对应这进程的PRI有40个优先级,是我们可以使用的。

调度原理:

当有一个进程进来时,根据进程的PRI来对哈希表中不同节点的位置进行映射,再讲该进程链接到该位置之后即可。

如果有新的进程进来,且该进程的优先级与上一个进程的优先级相同的话,就会链接到上一个进程之后。

如果新的进程的优先级与其他进进程的优先级不同,最终也会映射到相应位置,然后链接起来。

当进程数量达到一定值时,操作系统就会对该调度该哈希表,进行遍历,从上往下,从左到右一个个运行上面的进程。

这样就实现了进程优先级调度队列!

假如在操作系统调度上面的running的进程时,又有一些新的进程进来,怎么让这些进程能够进去排队呢?

Linux是这样处理的:

给running哈希表再设置一个镜像表(waiting)!

在操作系统调度running内的进程时,当有其他进程过来,这些进程就会被连接到waiting哈希表中,然后再设置两个哈希表指针,当上一个running哈希表内的进程完成调度时,只需要交换这两个指针,就可以继续调度其他的进程了。

但是这里仍然存在一个可以改进效率的问题。

操作系统在调度running哈希表中的进程时,需要从上往下一个个地判断每一个桶是否为空,才能找到第一个调度的进程。

这是一个近似O(n)的搜索算法。

为了提高效率,引入了位图的操作:

位图是能快速判断某一个值在不在位图里面,如果在设置为1,如果不在设置为0。因为一个比特位只能是0或1。

此时我们让位图的对应比特位映射哈希表的对应下标,当查找哈希表某一个下标x中有没有进程在排队时,可以这样检测:

char bitmap[5];
int i = x % sizeof(char);
int j = x / sizeof(char);
return bitmap[i] & (1<<j);

上面方法是检测某一个下标是否为1,如果为1,代表该位置有进程在排队,如果为0,代表没有进程在排队。

由此还能引出另一个检测方法:

一次检测8个比特位。

只需要让char类型的元素按位与8个比特位均为1的十进制数,如果结果为0,则说明8个比特位全为0。

综上,使用位图检测哈希表中是否有进程在排队时,能将O(n)的算法直接提高到接近O(1)的算法。

我们把这种算法称为O(1)的调度算法。

所以操作系统中进程的调度队列框架大致如下:

这样就能完整搭建一个进程调度的框架出来了!

五、其他概念

并发(重点)

并发是多个进程在一个CPU下采用进程切换的方式,在一段时间内,让多个进程都得以推进,称之为并发。

前面已经了解到,CPU在调度运行队列时,会去哈希表中查找进程进行调度,因为这些进程是链接在哈希表中的。

CPU在对进程调度时,有两个概念:

进程切换

时间片

以这两个概念为核心的调度算法叫做:基于进程切换和时间片轮转的调度算法。

时间片指的是,任何进程,即使该进程是一个死循环,一旦将它放在CPU上运行,它只能运行指定的时间,一旦时间到了,就会立刻被操作系统扒下来,如果该进程还想运行,那就让该进程的PCB去waiting哈希表中链接起来再次排队。

一旦一个进程运行完,或者时间片到了,操作系统就会立刻将其他进程放上CPU上运行。

这个过程是非常非常快的,快到可以以光速来形容。

这就是为什么我们肉眼看到的是多个进程同时进行的原因。

这里有一个问题:为什么一个函数的返回值能正确地返回到一个变量中或者返回到上层栈桢中?

因为在CPU中存在这大量的寄存器,这些寄存器也有不同的类型。

比如:

通用寄存器:eax,ebx,ecx,edx

栈桢:ebp,esp,eip

状态寄存器:status

函数的返回值会转化成汇编指令

return a -->> mov eax a

意味着会把a这个变量的值临时保存在寄存器中,然后再给上级栈桢中的其他变量。

正因如此,寄存器中还能保存与进程相关的上下文数据!

如果一个进程的时间片到了可该进程的代码还未被执行完,CPU的寄存器就会保存该进程的下一条指令的地址,每次执行完代码都会将该寄存器的值更新,永远保持着该寄存器(eip)存储的都是下一条指令的地址。

所以寄存器在CPU中扮演着能够帮助进程执行,提高调度效率的角色。

进程的高频数据都会被放入到CPU寄存器中,并且大量的寄存器在物理上都安装得离CPU很近,离CPU越近,访问和读取效率越高。

那么,进程切换具体是如何执行的呢?

一个进程在被切换的时候,要将自己的上下文数据保存好并带走,未来该进程再次被CPU调度运行时,CPU才能根据上下文数据从上次调度的地方再次进行调度。

所以,进程被切换时要做两件事:

  • 1.保存上下文
  • 2.恢复上下文

在被切换走时,可以设置一个结构体,结构体中保存寄存器的数据,这些数据都是进程相关的信息,在进程被切换时将该结构体交给进程的PCB保存即可。


总结

本文章的整条关系链就出来了,先是引入了进程优先级的概念,根据优先级可以知道进程之间存在竞争关系,为了合理地竞争以及合理地分配CPU资源,必须有一个调度队列,该调度队列由调度器控制,能最大程度上尽可能公平地保证每一个进程都能获取到CPU资源,由此引出我们还可以手动修改进程的优先级,PRI,NI值等。

知道了整个进程队列的调度原理后,又继续深入剖析进程的调度队列是如何实现的,由此引入各种数据结构,哈希表,位图,等等。

介绍完进程优先级以及调度队列后,引入了并发的概念,简单说就是一个CPU通过进程切换和时间片的操作,能将大量进程放到CPU上来回切换地运行,从而达到将整个的进程推进的效果。

后面又继续深剖进程的并发,进程切换是如何实现的。

相关文章
|
存储 Linux API
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
在计算机系统的底层架构中,操作系统肩负着资源管理与任务调度的重任。当我们启动各类应用程序时,其背后复杂的运作机制便悄然展开。程序,作为静态的指令集合,如何在系统中实现动态执行?本文带你一探究竟!
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
|
10月前
|
Unix Linux
对于Linux的进程概念以及进程状态的理解和解析
现在,我们已经了解了Linux进程的基础知识和进程状态的理解了。这就像我们理解了城市中行人的行走和行为模式!希望这个形象的例子能帮助我们更好地理解这个重要的概念,并在实际应用中发挥作用。
188 20
|
9月前
|
存储 Linux Shell
Linux进程概念-详细版(二)
在Linux进程概念-详细版(一)中我们解释了什么是进程,以及进程的各种状态,已经对进程有了一定的认识,那么这篇文章将会继续补全上篇文章剩余没有说到的,进程优先级,环境变量,程序地址空间,进程地址空间,以及调度队列。
163 0
|
9月前
|
Linux 调度 C语言
Linux进程概念-详细版(一)
子进程与父进程代码共享,其子进程直接用父进程的代码,其自己本身无代码,所以子进程无法改动代码,平时所说的修改是修改的数据。为什么要创建子进程:为了让其父子进程执行不同的代码块。子进程的数据相对于父进程是会进行写时拷贝(COW)。
222 0
|
12月前
|
存储 Linux 调度
【Linux】进程概念和进程状态
本文详细介绍了Linux系统中进程的核心概念与管理机制。从进程的定义出发,阐述了其作为操作系统资源管理的基本单位的重要性,并深入解析了task_struct结构体的内容及其在进程管理中的作用。同时,文章讲解了进程的基本操作(如获取PID、查看进程信息等)、父进程与子进程的关系(重点分析fork函数)、以及进程的三种主要状态(运行、阻塞、挂起)。此外,还探讨了Linux特有的进程状态表示和孤儿进程的处理方式。通过学习这些内容,读者可以更好地理解Linux进程的运行原理并优化系统性能。
433 4
|
12月前
|
Linux 数据库 Perl
【YashanDB 知识库】如何避免 yasdb 进程被 Linux OOM Killer 杀掉
本文来自YashanDB官网,探讨Linux系统中OOM Killer对数据库服务器的影响及解决方法。当内存接近耗尽时,OOM Killer会杀死占用最多内存的进程,这可能导致数据库主进程被误杀。为避免此问题,可采取两种方法:一是在OS层面关闭OOM Killer,通过修改`/etc/sysctl.conf`文件并重启生效;二是豁免数据库进程,由数据库实例用户借助`sudo`权限调整`oom_score_adj`值。这些措施有助于保护数据库进程免受系统内存管理机制的影响。
|
12月前
|
Linux Shell
Linux 进程前台后台切换与作业控制
进程前台/后台切换及作业控制简介: 在 Shell 中,启动的程序默认为前台进程,会占用终端直到执行完毕。例如,执行 `./shella.sh` 时,终端会被占用。为避免不便,可将命令放到后台运行,如 `./shella.sh &`,此时终端命令行立即返回,可继续输入其他命令。 常用作业控制命令: - `fg %1`:将后台作业切换到前台。 - `Ctrl + Z`:暂停前台作业并放到后台。 - `bg %1`:让暂停的后台作业继续执行。 - `kill %1`:终止后台作业。 优先级调整:
1083 5
|
12月前
|
存储 算法 数据处理
进程基础:概念、状态与生命周期
进程是操作系统进行资源分配和调度的基本单位,由程序段、数据段和进程控制块(PCB)组成。线程是进程中更小的执行单元,能独立运行且共享进程资源,具有轻量级和并发性特点。进程状态包括就绪、运行和阻塞,其生命周期分为创建、就绪、运行、阻塞和终止阶段。
741 2
|
调度 开发者
核心概念解析:进程与线程的对比分析
在操作系统和计算机编程领域,进程和线程是两个基本而核心的概念。它们是程序执行和资源管理的基础,但它们之间存在显著的差异。本文将深入探讨进程与线程的区别,并分析它们在现代软件开发中的应用和重要性。
527 4
|
存储 Linux Shell
常用vim命令和vim基本使用及Linux用户的管理,用户和组相关文件
这篇文章介绍了Vim编辑器的基本使用、常用命令和模式,以及Linux系统中用户和组的管理方法,包括用户和组相关文件如/etc/passwd、/etc/shadow和/etc/group的说明。
常用vim命令和vim基本使用及Linux用户的管理,用户和组相关文件

热门文章

最新文章