linux 进程

简介: linux 进程

进程是可执行程序的实例,是资源分配和调度的基本单位。

进程:动态执行的程序 + 虚拟内存 + 虚拟 CPU

1、进程的状态

进程的基本状态

  • 运行态Running:进程正在占用 CPU。
  • 就绪态Ready:进程具备执行条件,等待获取 CPU。
  • 阻塞态Blocked:进程等待某一事件而暂停运行。

一个进程从运行态到阻塞态是主动行为,而从阻塞态到就绪态是被动行为,需要其他进程的协助

此外,进程的状态还包括

  • 创建态 New:进程正在被创建
  • 结束态 Exit:进程正在从系统中消失

为减少阻塞态的进程占用物理内存,在虚拟内存管理的操作系统中,通常会把阻塞态的进程换出到硬盘,等待再次运行时,再从硬盘换入到物理内存。这种进程没有占用物理内存的情况称为挂起态。ctrl + z

挂起态分为

  • 阻塞挂起态:进程在外存并等待某个事件的出现
  • 就绪挂起态:进程在外存,但只要进入内存,就能立刻执行

image.png

查看进程的状态

# 查看进程状态
 ps -elf 'UNIX风格
 ps aux  'BSD风格
 # 查看系统的内存占用
 free
 # 动态显示系统当中的进程
 top

2、进程的组织

进程映像(进程实体):PCB + 程序段 + 数据段

  • 进程控制块 PCB:描述进程的基本情况和运行状态,进而控制和管理进程。
  • 程序段:进程调度到 CPU 执行的代码段,可被多进程共享。
  • 数据段。

PCB 是进程存在的唯一标识。创建进程就是创建进程映像中的 PCB,撤销进程就是撤销进程的 PCB。其中存储了各种静态信息,包括进程描述信息、进程控制和管理信息、资源分配清单、CPU 相关信息等。

例如:进程描述信息

  • 进程标识符 PID:唯一标识进程。
  • 用户标识符 UID:进程归属的用户,用于共享和保护。
// 返回调用进程的 PID
 pid_t getpid(void);
 // 返回父进程的 PID(创建调用进程的进程)
 pid_t getppid(void);
 // 获取用户ID
 uid_t getuid(void);
 // 获取有效用户ID 
 uid_t geteuid(void);
 // 获取组ID
 gid_t getgid(void);
 // 获取有效组ID
 gid_t getegid(void);

为了方便进程的调度和管理,内核将各进程的 PCB 组织起来,常用的方法有链接方式和索引方式。

链接方式:内核把相同状态的 PCB 链接到一个双向循环链表,组成任务队列。链表的节点类型为 task_struct ,也就是进程控制块 PCB。不同状态对应不同的任务队列,例如:就绪队列和阻塞队列

索引方式:将相同状态的进程组织在一个索引表中,索引表的表项指向相应的 PCB,不同状态对应不同的索引表等。

3、进程的控制

3.1、进程的创建

创建进程的过程(创建原语)

  • 为新进程分配 PID,并申请一个空白的 PCB
  • 为进程分配资源
  • 初始化 PCB
  • 将 PCB 插入到就绪队列,等待被调度运行;

fork 函数

父进程通过调用 fork 函数创建一个子进程。子进程是父进程的拷贝,子进程继承了父进程的地址空间(地址空间相同但是独立),共享文件。最大区别在于二者拥有不同的 PID。

fork 函数只被调用一次,却会返回两次:在父进程中,fork 返回子进程的 PID。在子进程中,fork 返回 0 。

// 返回值:子进程返回值为 0,父进程返回子进程的 PID。
 pid_t fork(void);

fork 拷贝和共享

  • 用户态拷贝:堆、栈、数据段、代码段,进程上下文,文件流,文件缓冲区
  • 内核态:部分拷贝(文件描述符数组),部分共享(文件描述符指向的文件对象)

fork 原理

  • 上半部:拷贝地址空间,修改子进程 task_struct,调整 PID 和 PPID 。随后,将子进程放入就绪队列等待调度,并将子进程的 fork 的返回值修改为 0,父进程的返回值设置为子进程的 PID。该过程不可抢占。
  • 下半部:将返回值返回给两个进程,随后修改 PC 指针,让各进程继续执行后续的命令

fork 的写时复制

写时复制(Copy on Write, COW):fork 调用时页表复制,并且将两个进程的每个页面标记为只读,父子进程共用一块物理内存。当有进程试图写操作时,触发缺页中断,从而进行物理内存的复制,并更新其页表项指向这个新的物理内存,然后恢复这个页面的可写权限。总之,谁修改,谁拷贝内存,子进程指向这块新内存。


写时复制的最充分地使用了稀有的物理内存,只有在发生写操作的时候,系统才会去复制物理内存,从而避免物理内存的复制过程导致进程长时间阻塞。

exec 函数族

在当前进程的上下文加载并执行一个程序

fork 函数在子进程中运行相同的程序,新的子进程是父进程的一个副本;exec 函数在当前进程的上下文加载并运行一个新的程序,会覆盖当前进程的地址空间。

exec 原理

  • 代码段,数据段被替换
  • 堆栈清空
  • PC指针重新返回代码段的开始

例:实现 system 函数功能

#include <sys/types.h>
 #include <sys/wait.h>
 #include <unistd.h>
 extern char **environ;
 int Mysystem(const char* CMD) {
     if (CMD == NULL) {
         return 1;
     }
     if(fork() == 0) {
         execl("/bin/sh", "sh", "-c", CMD, NULL);
         _exit(127);
     }
     wait(NULL);
 }
 // 测试样例:./mysystem date 实现 sysytem("date")
 int main(int argc,char*argv[]) {
     Mysystem(argv[1]);
     return 0;
 }

3.2、进程的终止

终止进程的过程(撤销原语)

  • 根据被终止进程的 PID,检索 PCB,读取该进程的状态
  • 若进程处于运行态,立即终止该进程的执行,然后将 CPU 资源分配给其他进程;
  • 如果进程还有子进程,则将该进程的子进程交给 init 进程(pid = 1)回收
  • 将该进程所拥有的全部资源,或归还给其父进程,或归还给操作系统;
  • 将该 PCB 从所在队列中删除

exit 函数

以 status 退出状态来终止进程。

#include <unistd.h>
 void _exit(int status);

当一个进程由于某种原因终止时,内核并不是立即把它从系统中删除。相反,进程被保持在一种已终止的状态,直到被它的父进程回收。当父进程回收已终止的子进程时,内核将子进程的退出状态传递给父进程,然后抛弃已终止的进程,至此该进程被终止。

* 僵死进程

僵死进程:一个终止但并未被回收的进程。

父进程需要及时回收已终止的子进程。因为僵死进程即使没有运行,仍然消耗系统的内存资源。

父进程调用 wait 或 waitpid 函数来等待它的子进程终止或停止。

#include <sys/types.h>
 #include <sys/wait.h>
 // 随机等待一个子进程
 pid_t wait(int *status);
 // 等待指定 pid 的子进程
 pid_t waitpid(pid_t pid, int *status, int options);

* 孤儿进程

孤儿进程:父进程先于子进程退出。自动被养父 init 进程(pid = 1)收养。当一个孤儿进程退出后,它的资源清理会交给它的父进程(init 进程)来处理。但在此之前,它一直消耗系统的资源,要尽量避免。

3.3、进程的阻塞和唤醒

阻塞进程的过程:进程等待事件,主动调用 Block 原语

  • 找到将要被阻塞进程 PID 对应的 PCB
  • 如果该进程为运行状态,则保护其现场,将其状态转为阻塞态,停止运行
  • 将该 PCB 插入到相应事件的等待队列,将 CPU 调度给其他就绪进程

唤醒进程:其他相关进程调用,Wakeup 原语

唤醒进程的过程如下:

  • 在该事件的等待队列中找到相应进程的 PCB
  • 将其从队列中移出,并置其状态为就绪态
  • 把该 PCB 插入就绪队列中,等待调度

Block 原语和 Wakeup 是一对作用相反的原语,必须成对使用。

3.4、进程的切换

进程切换:处理机从一个进程的运行转到另一个进程上运行,这个过程中,进程运行环境产生了实质性变化。

调度是指资源分配给哪一进程的行为,是一种决策;切换是指实际分配的行为,是执行行为。一般来说,先有资源的调度,然后才有进程的切换。

进程切换的过程

  • 保存 CPU 上下文,包括程序计数器和其他寄存器
  • 更新 PCB信息
  • 把进程的 PCB 移入相应的队列
  • 选择另一个进程执行,更新 PCB
  • 更新内存管理的数据结构
  • 恢复 CPU 上下文

4、进程间通信

进程间主要通信方式有:管道、共享内存、信号、信号量、消息队列、套接字

参考我的博客:linux 进程间通信

5、进程调度算法

进程调度算法

  • 先来先服务:选择最先进入队列的
  • 短作业优先:选择完成时间最短的
  • 优先级调度:选择优先级别最高的
  • 高响应比优先:选择响应比最高的
  • 时间片轮转:总是选择就绪队列中第一个进程,但仅能运行一个时间片
  • 多级反馈队列:时间片轮转 + 优先级调度

参考

相关文章
|
1月前
|
算法 Linux 调度
深入理解Linux操作系统的进程管理
本文旨在探讨Linux操作系统中的进程管理机制,包括进程的创建、执行、调度和终止等环节。通过对Linux内核中相关模块的分析,揭示其高效的进程管理策略,为开发者提供优化程序性能和资源利用率的参考。
87 1
|
17天前
|
消息中间件 Linux
Linux:进程间通信(共享内存详细讲解以及小项目使用和相关指令、消息队列、信号量)
通过上述讲解和代码示例,您可以理解和实现Linux系统中的进程间通信机制,包括共享内存、消息队列和信号量。这些机制在实际开发中非常重要,能够提高系统的并发处理能力和数据通信效率。希望本文能为您的学习和开发提供实用的指导和帮助。
80 20
|
3月前
|
资源调度 Linux 调度
Linux c/c++之进程基础
这篇文章主要介绍了Linux下C/C++进程的基本概念、组成、模式、运行和状态,以及如何使用系统调用创建和管理进程。
61 0
|
1月前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
109 13
|
1月前
|
SQL 运维 监控
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
|
2月前
|
缓存 监控 Linux
linux进程管理万字详解!!!
本文档介绍了Linux系统中进程管理、系统负载监控、内存监控和磁盘监控的基本概念和常用命令。主要内容包括: 1. **进程管理**: - **进程介绍**:程序与进程的关系、进程的生命周期、查看进程号和父进程号的方法。 - **进程监控命令**:`ps`、`pstree`、`pidof`、`top`、`htop`、`lsof`等命令的使用方法和案例。 - **进程管理命令**:控制信号、`kill`、`pkill`、`killall`、前台和后台运行、`screen`、`nohup`等命令的使用方法和案例。
190 4
linux进程管理万字详解!!!
|
1月前
|
运维 监控 Linux
Linux操作系统的守护进程与服务管理深度剖析####
本文作为一篇技术性文章,旨在深入探讨Linux操作系统中守护进程与服务管理的机制、工具及实践策略。不同于传统的摘要概述,本文将以“守护进程的生命周期”为核心线索,串联起Linux服务管理的各个方面,从守护进程的定义与特性出发,逐步深入到Systemd的工作原理、服务单元文件编写、服务状态管理以及故障排查技巧,为读者呈现一幅Linux服务管理的全景图。 ####
|
2月前
|
缓存 算法 Linux
Linux内核的心脏:深入理解进程调度器
本文探讨了Linux操作系统中至关重要的组成部分——进程调度器。通过分析其工作原理、调度算法以及在不同场景下的表现,揭示它是如何高效管理CPU资源,确保系统响应性和公平性的。本文旨在为读者提供一个清晰的视图,了解在多任务环境下,Linux是如何智能地分配处理器时间给各个进程的。
|
2月前
|
存储 运维 监控
深入Linux基础:文件系统与进程管理详解
深入Linux基础:文件系统与进程管理详解
98 8
|
2月前
|
网络协议 Linux 虚拟化
如何在 Linux 系统中查看进程的详细信息?
如何在 Linux 系统中查看进程的详细信息?
297 1