【linux进程(一)】深入理解进程概念--什么是进程?PCB的底层是什么?

简介: 【linux进程(一)】深入理解进程概念--什么是进程?PCB的底层是什么?

1. 前言

相信大家多多少少听说过进程这个词

先带大家做一个进程的简单的介绍:

  • 课本概念: 程序的一个执行实例
    或正在执行的程序
  • 内核观点: 担当分配系统资源(CPU,内存)的实体

本章重点:

本章会重点讲解操作系统是如何
管理进程的,PCB的概念以及Linux
下的PCB实体,到底什么是进程?
最后讲解进程对应的标识符:pid
和ppid的概念以及查看方式

注:建议先阅读这篇文章:Linux进程学习基础

理解"先描述再再组织"的概念!


2. PCB初认识(os是怎样管理进程的?)

在冯诺依曼系统中讲到,管理的本质不是

真正的管理实体本身,而是管理它的数据

虽然现在我们不知道什么是进程,但是

我们可以通过先描述,再组织这一结论

得出,操作系统管理进程肯定也是管理

进程对应的数据,请看下图:

操作系统将可执行程序的各种数据提取
出来,再创建一个结构体把数据存进去
由于同时会存在多个进程,所以操作系统
使用链表或其他数据结构将它们链接在一起
虽然我们并不知道进程中都有什么数据
但是可以假设或者猜想一下:

struct data
{
  //id
  //代码/函数地址
  //状态(是否被CPU处理)
  //优先级
  struct data* next
}

新概念来了:
这个进程属性的结构体被称为PCB
也叫进程控制块

当然,PCB是这个结构体的总称,在Linux
系统下,PCB具体叫做:struct task_struct'

所以操作系统(os)是怎样管理进程的呢?

os对进程的管理被建模成为了

对链表中结构体的增删查改!


3. CPU对于进程列表的处理

进程被链接在链表中会等待CPU去PCB找

数据做处理,那么CPU怎么知道要处理哪些

数据呢?这不得不提到进程排队的概念:

把对应的PCB从链表中提取到

队列中排队,PCB中的数据不会

一次性被CPU处理完,它有时被处理

有时在等待被处理,这是一种动态

运行的特征,请看下图:

讲这些概念是想让大家了解,操作系统内

对于进程的控制十分复杂,一个PCB可能

链接到多个数据结构上,比如这里的PCB

既链接在管理PCB的链表上,又链接在

排队队列的队列中!

结论: 进程=可执行程序 + 内核数据结构(PCB)


4. 进程标识符:pid

每一个进程都有自己对应的pid

查看当前进程的信息:

使用指令: ps ajx

这样查看的是所有的进程,很难帮助

我们学习,现在写一个死循环程序并运行

让它一直处于进程运行的状态:

#include<stdio.h>  
 #include<unistd.h>  
 int main()  
 {
     while(1)//死循环
     {
         printf("我现在是一个进程了\n");
         sleep(1);//休眠一秒                                                                                                                                         
     }                                       
     return 0;                           
 }

现在让程序运行起来,再去查看进程:

在所有进程中搜索我刚刚写的可执行程序:

使用指令: ps ajx | grep mybin

将进程信息的第一行打印出来:

使用指令: ps ajx | head -1

请看下面视频:

查看进程

可以看见当前mybin程序的进程pid是

8336,这里有两个mybin的原因是,grep

指令本身也要形成mybin文件,所以其实

第二个红字mybin是grep的!


5. 在Linux下使用指令终止进程

在我们的程序运行时,可以在运行的

地方按CTRL+c来结束进程,但是

还有一种方法可以结束进程:

使用指令: kill -9 要杀掉的进程id

(注:这里的-9是信号参数,直接使用即可)

请看下面的视频演示:

使用指令结束进程


6. 系统调用函数:getpid

每次查看进程使用都要使用ps指令

我感觉非常的麻烦,于是这里有一个

系统调用的节后函数可以直接返回

当前进程的pid,由于操作系统是由C

语言编写的,所以可以直接在程序中调用此函数:

使用函数:getpid

使用man手册查看getpid相关信息:

#include<stdio.h>                                                         
#include<unistd.h>  
#include<sys/types.h>  
int main()  
{  
   pid_t id = getpid();  
    while(1)//死循环  
    {  
        printf("我现在是一个进程了,我的pid是: %d\n",id);                      
        sleep(1);//休眠一秒                          
    }                                                
    return 0;                                        
}

请看以下视频观察情况:

用系统调用函数查看pid


7. 父进程和子进程的概念

在使用ps指令查看进程详情时,除了

pid我们可以看见左边还有一个ppid

这是parent pid的意思,也就是父进程

的pid,请看下图:

再来学习一个可以查看父进程id的函数:

使用函数: getppid()

现在我们将此函数进入C语言代码中来观察现象:

#include<stdio.h>    
#include<unistd.h>    
#include<sys/types.h>    
int main()    
{    
    pid_t parid = getppid();    
    pid_t id = getpid();    
    while(1)//死循环    
    {    
        printf("我现在是一个进程了,我的pid是: %d 我的ppid是: %d\n",id,parid);    
        sleep(1);//休眠一秒    
    }                                                                                                                                                                   
    return 0;                                                                                                                                                        
}

请看以下视频观察情况:

父进程与子进程查看

可以发现,每次运行时,子进程的id都在变化
然而父进程的id一直没变!这是因为在命令行
中,父进程一般是命令行解释器: bash

现在可以去查看一下父进程的详情:

bash的pid查看

可以看见,bash的pid和打印出来的ppid一样

那么本篇文章先给出一个父子进程的结论

更多关于父子进程和创建子进程的内容我将

在下一篇文章讲解,这里只是先做了解

结论:

Linux中创建进程的方式有两种
1是命令行中直接启动可执行程序
2是通过代码创建进程(下篇文章的重点)
启动进程的本质就是创建进程,一般是
通过父进程创建子进程,构成一种父子关系
而命令行中启动的进程都是由bash为
父进程模拟创建子进程的!


8. 总结以及拓展

Linux进程的学习是Linux学习中

三座大山之一,它的抽象程度不亚于学习

大物时的薛定谔方程,所以看完本篇文章

你如果是一头雾水的话也不要怕,后期还会

有更多对于进程的理解和完善!

对于系统调用的拓展

我们使用的getpid和getppid是系统调用函数

而在冯诺依曼体系中讲到,如何用户想要访问

底层的数据必须经过系统调用这一门槛!

然而系统调用是怎样将pid或ppid
返回给用户的呢?其实很好理解

pid和ppid的值是数据,那么数据是被存储
在进程控制块PCB中的,而PCB的本质
是一个结构体,所以操作系统只需要写一个
函数,将结构体中的pid或ppid作为返回值
返回给用户即可,请看下图加深理解:


🔎 下期预告:Linux进程之代码创建进程 🔍


相关文章
|
5月前
|
NoSQL Linux 编译器
GDB符号表概念和在Linux下获取符号表的方法
通过掌握这些关于GDB符号表的知识,你可以更好地管理和理解你的程序,希望这些知识可以帮助你更有效地进行调试工作。
215 16
|
5月前
|
Web App开发 Linux 程序员
获取和理解Linux进程以及其PID的基础知识。
总的来说,理解Linux进程及其PID需要我们明白,进程就如同汽车,负责执行任务,而PID则是独特的车牌号,为我们提供了管理的便利。知道这个,我们就可以更好地理解和操作Linux系统,甚至通过对进程的有效管理,让系统运行得更加顺畅。
138 16
|
5月前
|
Unix Linux
对于Linux的进程概念以及进程状态的理解和解析
现在,我们已经了解了Linux进程的基础知识和进程状态的理解了。这就像我们理解了城市中行人的行走和行为模式!希望这个形象的例子能帮助我们更好地理解这个重要的概念,并在实际应用中发挥作用。
108 20
|
4月前
|
监控 Shell Linux
Linux进程控制(详细讲解)
进程等待是系统通过调用特定的接口(如waitwaitpid)来实现的。来进行对子进程状态检测与回收的功能。
86 0
|
4月前
|
存储 负载均衡 算法
Linux2.6内核进程调度队列
本篇文章是Linux进程系列中的最后一篇文章,本来是想放在上一篇文章的结尾的,但是想了想还是单独写一篇文章吧,虽然说这部分内容是比较难的,所有一般来说是简单的提及带过的,但是为了让大家对进程有更深的理解与认识,还是看了一些别人的文章,然后学习了学习,然后对此做了总结,尽可能详细的介绍明白。最后推荐一篇文章Linux的进程优先级 NI 和 PR - 简书。
118 0
|
4月前
|
存储 Linux Shell
Linux进程概念-详细版(二)
在Linux进程概念-详细版(一)中我们解释了什么是进程,以及进程的各种状态,已经对进程有了一定的认识,那么这篇文章将会继续补全上篇文章剩余没有说到的,进程优先级,环境变量,程序地址空间,进程地址空间,以及调度队列。
84 0
|
4月前
|
Linux 调度 C语言
Linux进程概念-详细版(一)
子进程与父进程代码共享,其子进程直接用父进程的代码,其自己本身无代码,所以子进程无法改动代码,平时所说的修改是修改的数据。为什么要创建子进程:为了让其父子进程执行不同的代码块。子进程的数据相对于父进程是会进行写时拷贝(COW)。
82 0
|
7月前
|
Linux 数据库 Perl
【YashanDB 知识库】如何避免 yasdb 进程被 Linux OOM Killer 杀掉
本文来自YashanDB官网,探讨Linux系统中OOM Killer对数据库服务器的影响及解决方法。当内存接近耗尽时,OOM Killer会杀死占用最多内存的进程,这可能导致数据库主进程被误杀。为避免此问题,可采取两种方法:一是在OS层面关闭OOM Killer,通过修改`/etc/sysctl.conf`文件并重启生效;二是豁免数据库进程,由数据库实例用户借助`sudo`权限调整`oom_score_adj`值。这些措施有助于保护数据库进程免受系统内存管理机制的影响。
|
7月前
|
Linux Shell
Linux 进程前台后台切换与作业控制
进程前台/后台切换及作业控制简介: 在 Shell 中,启动的程序默认为前台进程,会占用终端直到执行完毕。例如,执行 `./shella.sh` 时,终端会被占用。为避免不便,可将命令放到后台运行,如 `./shella.sh &`,此时终端命令行立即返回,可继续输入其他命令。 常用作业控制命令: - `fg %1`:将后台作业切换到前台。 - `Ctrl + Z`:暂停前台作业并放到后台。 - `bg %1`:让暂停的后台作业继续执行。 - `kill %1`:终止后台作业。 优先级调整:
352 5
|
运维 关系型数据库 MySQL
掌握taskset:优化你的Linux进程,提升系统性能
在多核处理器成为现代计算标准的今天,运维人员和性能调优人员面临着如何有效利用这些处理能力的挑战。优化进程运行的位置不仅可以提高性能,还能更好地管理和分配系统资源。 其中,taskset命令是一个强大的工具,它允许管理员将进程绑定到特定的CPU核心,减少上下文切换的开销,从而提升整体效率。
掌握taskset:优化你的Linux进程,提升系统性能