【Linux取经路】进程的奥秘

简介: 【Linux取经路】进程的奥秘

7f4a726100da4baea3950c8c982beee6.gif

1、什么是进程?

在上一篇文章【Linux取经路】冯诺依曼结构体系与操作系统的碰撞中提到过,任何一个程序想要运行,必须先加载到内存中。一个已经加载到内存中的程序(正在运行的程序),就叫进程。在很多教材里进程一杯叫做任务。

在W i n d o w s WindowsWindows操作系统下,我们可以通过任务管理器来查看计算机当前正在运行的进程。

a599567cb7bd4484840f75e4d9a15db1.png

在L i n u x LinuxLinux操作系统下,可以通过下面的指令来查看当前正在运行的进程信息

ps axj
top
//这两条指令都可以查看进程

281c81189b2f47bfb72387707aaadb2a.png

1.1 自己写一个进程

进程就是加载到内存中的可执行程序,因此我们自己写一个.c源代码,通过编译就可以得到一个可执行程序。

//mycode.c
#include <stdio.h>  
#include <unistd.h>  
int main()                              
{                                       
    while(1)                            
    {                                    
        printf("我是一个进程!!!\n");  
        sleep(1);                       
    }                                   
    return 0;                           
}  

我们写的这个源代码是存储在磁盘上的,编译得到的可执行程序也是存储在磁盘上的,只有通过./mycode去执行 mycode 这个可执行文件,才能把它加载到内存中。加载到内存之后,此时就会得到一个名为 mycode 的进程,可以通过下面这条指令来查看该进程

ps axj | grep mycode
//ps axj 是查看当前的所有进程
//通过管道和grep将mycode进程的信息过滤出来

ea9402bb55d5473d9f85d602ff7f47e7.png

小Tips:我们写的源代码,最终一定是由CPU来运行,而CPU只能从内存中拿数据,这就决定了我们的可执行程序和代码一定要先加载到内存当中。此外,CPU在不运行我们代码的时候,他可能在检查计算机的各种状态,释放计算机的各种资源,将操作系统中的数据刷新到磁盘等日常管理工作,这说明操作系统本身也一定要在内存当中,我们平时开机本质上其实就是把操作系统从外设搬到内存当中。

8dc4923792134ba1bdbcd8a9c43c982f.png

小Tips:一个可执行程序本质上就是一个二进制文件,我们将一个可执行程序加载到内存,本质上就是将一个二进制文件加载到内存,这个二进制文件是由代码和数据两部分组成,无论是数据还是代码归根结底都可以被叫做数据,代码最终交给控制器去执行,数据最终交给运算器去运行。

根据上面的截图可以看出,一个计算机可以同时存在多个进程,给用户的主观感受就是,可以同时使用多个软件,即在我们的计算机上,聊天、听歌、打游戏可以同时进行。现在我们把这种可以同时运行多个进程的操作系统叫做多道操作系统。

2、操作系统如何管理进程?

操作系统中可以有多个进程就类似于学校中有不同年级的学生,学校会将不同年级的学生统统管理起来,操作系统也一样,它需要把多个进程管理起来。

操作系统如何对进程做管理呢?还记得上一篇文章中介绍的操作系统对软硬件资源的是如何管理的嘛👀?忘了的小伙伴可以走传送门回去看看。操作系统对进程的管理也一定是先描述、在组织。即先定义一个结构体,里面有进程的各种属性,用一个结构体对象来表示一个进程,再将这些结构体对象用一种数据结构组织起来,组织的目的是为了更好的管理。此后,操作系统对进程的管理就变成了对某种数据结构的增删查改。

2.1 描述进程-PCB

任何可执行程序,在加载到内存,形成真正的进程时,操作系统要先创建描述进程的结构体对象。这个对象中存储了进程的各类信息,这个对象也被叫做进程控制块,本质上就是进程属性的集合。在课本上称之为 PCB (process control block),因为操作系统是由C语言写的,所以 PCB 本质上一定是一个 struct 结构体,Linux操作系统下的PCB是:task_struct。

小Tips:所有操作系统中的进程控制块都被叫做PCB。在不同的平台下,PCB的具体实现是有差异的。

2.2 组织进程

上面介绍了操作系统是如何描述进程的,接下来操作系统需要把多个进程给组织起来。所有运行在系统里的进程都以 PCB 对象链表的形式存在内核里。所以最终操作系统对进程的管理就变成了对链表的增删查改。

2.3 深入理解进程

此时再来看一个进程需要具备的东西。首先可执行程序必须先加载到内存,本质是将代码和数据加载内存,这说明一个进程一定有它所对应的代码和数据。其次,操作系统为了管理好进程,需要为该进程创建一个 PCB 对象用来描述该进程。总结:PCB + 代码和数据就是一个进程必须具备的两个东西。

64ca6a323b574686982d9da942533c5f.png

小Tips:虽然进程由两部分组成,但是操作系统管理进程只关心进程的 PCB 对象,它根本不关心该进程的代码和数据。

举个例子帮助大家理解:春人今年参加高考,成功的考上了 A 大学。在假期的时候,A 大学来到春人的高中,将春人的的档案从高中拿到大学,再将春人的信息录入学校的教务系统,到了九月份,春人带着录取通知书去大学报道,春人进入校门后,开心的说“我终于是 A 大学的一名学生啦”,旁边的保安大叔也跟着笑,请问旁边的保安大叔是该学校的学生嘛?答案是否定的。虽然保安大叔可能在学校工作了很多年,但是他的信息并没有被录入教务系统,所以保安大叔不是该学校的学生。因此我们可以得出结论:只有人在学校是不足以说明这个人是该校的学生,只有将这个人的信息录入教务系统后,才能说这个人是学校的学生。进程也一样,只把代码和数据加载到内存,是不足以说明它是一个进程,还需要创建描述给进程的 PCB 对象,这二者共同得到了一个进程。

3、Linux环境下的进程

第二小节介绍的是任何一款操作对进程做管理的要求,这一小节我们主要来看看 Linux 环境下的进程管理。

3.1 task_struct

task_struct 是 Linux 操作系统下的 PCB 结构,它是 Linux 内核的一种类型,会被装载到 RAM(内存)里,并且包含着进程的信息。

3.2 task_struct内容分类

标识符:描述一个进程的唯一标识符,用来区分不同进程。

状态:任务状态,退出码,退出信号等。

优先级:相对于其他程序进程的优先级。

程序计数器:程序中即将被执行的下一条指令的地址。

内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针。

上下文数据:进程执行时处理器的寄存器中的数据。

I / O状态信息:包括显示的 I/O 请求,分配给进程的 I/O 设备和被进程使用的文件列表。

记账信息:可能包括处理时间总和,使用的时钟数总和,时间限制,记账号等。

3.3 组织进程

Linux 内核中,最基本的组织进程 task_struct 的方式是采用双向链表组织。但是一个 task_struct 对象不仅仅属于一个双链表,它可能存在多个数据结构中。对进程的管理,本质上就是将 task_struct 对象放到某个数据结构中。

3.4 查看进程属性

ps axj | head -1 && ps axj | grep mycode
//&&用来连接两个指令操作
//左边是只打印“表头”信息
//右边是将mycode进程的相关信息过滤出来

27302a3a3e414756bc15999d9ecdd9bd.png

小Tips:最后一行显示的其实是 grep 命令的进程。因为 grep 命令的关键字里也有 mycode ,当我们用 grep 命令来过滤操作系统中的进程时,grep 自己首先需要先变成一个进程,然后它才能被 CPU 调度执行,因此最终过滤时会把 grep 自己也带上。

ls /proc

0f66c9569ad6475abaa18274bb9a0cd4.png

proc 是 Linux 系统下的一个目录,关机后,目录里面的信息全都没了,开机的时候操作系统会帮我们创建对应的目录和文件。proc 目录下的所有信息都是 Linux 操作系统用文件系统的方式把内存中的文件包括进程信息给我们可视化出来了,它上面的数据都是内存级的。如上图所示,其中蓝色的数字表示一个目录,该数字就是进程的唯一标识 PID。该目录里面保存了进程的所有属性。


b4f15e74cdca48c081af650271bdeb29.png

小Tips:当我们终止掉 mycode 进程 proc 目录下的1624目录也会跟着被清理。其次,一个进程终止后再启动,它的 PID 大概率是会变化的。

66fa7ae453f54fdabd85f8aac0581fb9.png

mycode 进程目录下的 exe 是一个链接文件,它就指向当前进程所对应的可执行程序的路径,它就是将 task_struct 对象中的内存指针给可视化了出来。cwd 表示该进程的工作目录,即进程所对应可执行程序所在的目录。我们的程序中一般打开一个文件或者创建一个文件,在只写文件名的情况下,程序就会默认在当前目录下查找文件或者将创建的文件放在当前目录下,本质上就是因为进程 PCB 中存的有当前目录的路径信息。

4、结语

今天的分享到这里就结束啦!如果觉得文章还不错的话,可以三连支持一下,春人的主页还有很多有趣的文章,欢迎小伙伴们前去点评,您的支持就是春人前进的动力!

相关实践学习
CentOS 8迁移Anolis OS 8
Anolis OS 8在做出差异性开发同时,在生态上和依赖管理上保持跟CentOS 8.x兼容,本文为您介绍如何通过AOMS迁移工具实现CentOS 8.x到Anolis OS 8的迁移。
目录
打赏
0
0
0
0
5
分享
相关文章
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
在计算机系统的底层架构中,操作系统肩负着资源管理与任务调度的重任。当我们启动各类应用程序时,其背后复杂的运作机制便悄然展开。程序,作为静态的指令集合,如何在系统中实现动态执行?本文带你一探究竟!
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
深入理解Linux操作系统的进程管理
本文旨在探讨Linux操作系统中的进程管理机制,包括进程的创建、执行、调度和终止等环节。通过对Linux内核中相关模块的分析,揭示其高效的进程管理策略,为开发者提供优化程序性能和资源利用率的参考。
132 1
【Linux】进程IO|系统调用|open|write|文件描述符fd|封装|理解一切皆文件
本文详细介绍了Linux中的进程IO与系统调用,包括 `open`、`write`、`read`和 `close`函数及其用法,解释了文件描述符(fd)的概念,并深入探讨了Linux中的“一切皆文件”思想。这种设计极大地简化了系统编程,使得处理不同类型的IO设备变得更加一致和简单。通过本文的学习,您应该能够更好地理解和应用Linux中的进程IO操作,提高系统编程的效率和能力。
75 34
|
9天前
|
Linux:守护进程(进程组、会话和守护进程)
守护进程在 Linux 系统中扮演着重要角色,通过后台执行关键任务和服务,确保系统的稳定运行。理解进程组和会话的概念,是正确创建和管理守护进程的基础。使用现代的 `systemd` 或传统的 `init.d` 方法,可以有效地管理守护进程,提升系统的可靠性和可维护性。希望本文能帮助读者深入理解并掌握 Linux 守护进程的相关知识。
27 7
|
8天前
|
Linux 进程前台后台切换与作业控制
进程前台/后台切换及作业控制简介: 在 Shell 中,启动的程序默认为前台进程,会占用终端直到执行完毕。例如,执行 `./shella.sh` 时,终端会被占用。为避免不便,可将命令放到后台运行,如 `./shella.sh &`,此时终端命令行立即返回,可继续输入其他命令。 常用作业控制命令: - `fg %1`:将后台作业切换到前台。 - `Ctrl + Z`:暂停前台作业并放到后台。 - `bg %1`:让暂停的后台作业继续执行。 - `kill %1`:终止后台作业。 优先级调整:
30 5
Linux 进程管理基础
Linux 进程是操作系统中运行程序的实例,彼此隔离以确保安全性和稳定性。常用命令查看和管理进程:`ps` 显示当前终端会话相关进程;`ps aux` 和 `ps -ef` 显示所有进程信息;`ps -u username` 查看特定用户进程;`ps -e | grep &lt;进程名&gt;` 查找特定进程;`ps -p &lt;PID&gt;` 查看指定 PID 的进程详情。终止进程可用 `kill &lt;PID&gt;` 或 `pkill &lt;进程名&gt;`,强制终止加 `-9` 选项。
19 3
c++ linux通过实现独立进程之间的通信和传递字符串 demo
的进程间通信机制,适用于父子进程之间的数据传输。希望本文能帮助您更好地理解和应用Linux管道,提升开发效率。 在实际开发中,除了管道,还可以根据具体需求选择消息队列、共享内存、套接字等其他进程间通信方
65 16
Linux:进程间通信(共享内存详细讲解以及小项目使用和相关指令、消息队列、信号量)
通过上述讲解和代码示例,您可以理解和实现Linux系统中的进程间通信机制,包括共享内存、消息队列和信号量。这些机制在实际开发中非常重要,能够提高系统的并发处理能力和数据通信效率。希望本文能为您的学习和开发提供实用的指导和帮助。
177 20
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
135 13
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等