linux 进程

简介: linux 进程

进程是可执行程序的实例,是资源分配和调度的基本单位。

进程:动态执行的程序 + 虚拟内存 + 虚拟 CPU

1、进程的状态

进程的基本状态

  • 运行态Running:进程正在占用 CPU。
  • 就绪态Ready:进程具备执行条件,等待获取 CPU。
  • 阻塞态Blocked:进程等待某一事件而暂停运行。

一个进程从运行态到阻塞态是主动行为,而从阻塞态到就绪态是被动行为,需要其他进程的协助

此外,进程的状态还包括

  • 创建态 New:进程正在被创建
  • 结束态 Exit:进程正在从系统中消失

为减少阻塞态的进程占用物理内存,在虚拟内存管理的操作系统中,通常会把阻塞态的进程换出到硬盘,等待再次运行时,再从硬盘换入到物理内存。这种进程没有占用物理内存的情况称为挂起态。ctrl + z

挂起态分为

  • 阻塞挂起态:进程在外存并等待某个事件的出现
  • 就绪挂起态:进程在外存,但只要进入内存,就能立刻执行

image.png

查看进程的状态

# 查看进程状态
 ps -elf 'UNIX风格
 ps aux  'BSD风格
 # 查看系统的内存占用
 free
 # 动态显示系统当中的进程
 top

2、进程的组织

进程映像(进程实体):PCB + 程序段 + 数据段

  • 进程控制块 PCB:描述进程的基本情况和运行状态,进而控制和管理进程。
  • 程序段:进程调度到 CPU 执行的代码段,可被多进程共享。
  • 数据段。

PCB 是进程存在的唯一标识。创建进程就是创建进程映像中的 PCB,撤销进程就是撤销进程的 PCB。其中存储了各种静态信息,包括进程描述信息、进程控制和管理信息、资源分配清单、CPU 相关信息等。

例如:进程描述信息

  • 进程标识符 PID:唯一标识进程。
  • 用户标识符 UID:进程归属的用户,用于共享和保护。
// 返回调用进程的 PID
 pid_t getpid(void);
 // 返回父进程的 PID(创建调用进程的进程)
 pid_t getppid(void);
 // 获取用户ID
 uid_t getuid(void);
 // 获取有效用户ID 
 uid_t geteuid(void);
 // 获取组ID
 gid_t getgid(void);
 // 获取有效组ID
 gid_t getegid(void);

为了方便进程的调度和管理,内核将各进程的 PCB 组织起来,常用的方法有链接方式和索引方式。

链接方式:内核把相同状态的 PCB 链接到一个双向循环链表,组成任务队列。链表的节点类型为 task_struct ,也就是进程控制块 PCB。不同状态对应不同的任务队列,例如:就绪队列和阻塞队列

索引方式:将相同状态的进程组织在一个索引表中,索引表的表项指向相应的 PCB,不同状态对应不同的索引表等。

3、进程的控制

3.1、进程的创建

创建进程的过程(创建原语)

  • 为新进程分配 PID,并申请一个空白的 PCB
  • 为进程分配资源
  • 初始化 PCB
  • 将 PCB 插入到就绪队列,等待被调度运行;

fork 函数

父进程通过调用 fork 函数创建一个子进程。子进程是父进程的拷贝,子进程继承了父进程的地址空间(地址空间相同但是独立),共享文件。最大区别在于二者拥有不同的 PID。

fork 函数只被调用一次,却会返回两次:在父进程中,fork 返回子进程的 PID。在子进程中,fork 返回 0 。

// 返回值:子进程返回值为 0,父进程返回子进程的 PID。
 pid_t fork(void);

fork 拷贝和共享

  • 用户态拷贝:堆、栈、数据段、代码段,进程上下文,文件流,文件缓冲区
  • 内核态:部分拷贝(文件描述符数组),部分共享(文件描述符指向的文件对象)

fork 原理

  • 上半部:拷贝地址空间,修改子进程 task_struct,调整 PID 和 PPID 。随后,将子进程放入就绪队列等待调度,并将子进程的 fork 的返回值修改为 0,父进程的返回值设置为子进程的 PID。该过程不可抢占。
  • 下半部:将返回值返回给两个进程,随后修改 PC 指针,让各进程继续执行后续的命令

fork 的写时复制

写时复制(Copy on Write, COW):fork 调用时页表复制,并且将两个进程的每个页面标记为只读,父子进程共用一块物理内存。当有进程试图写操作时,触发缺页中断,从而进行物理内存的复制,并更新其页表项指向这个新的物理内存,然后恢复这个页面的可写权限。总之,谁修改,谁拷贝内存,子进程指向这块新内存。


写时复制的最充分地使用了稀有的物理内存,只有在发生写操作的时候,系统才会去复制物理内存,从而避免物理内存的复制过程导致进程长时间阻塞。

exec 函数族

在当前进程的上下文加载并执行一个程序

fork 函数在子进程中运行相同的程序,新的子进程是父进程的一个副本;exec 函数在当前进程的上下文加载并运行一个新的程序,会覆盖当前进程的地址空间。

exec 原理

  • 代码段,数据段被替换
  • 堆栈清空
  • PC指针重新返回代码段的开始

例:实现 system 函数功能

#include <sys/types.h>
 #include <sys/wait.h>
 #include <unistd.h>
 extern char **environ;
 int Mysystem(const char* CMD) {
     if (CMD == NULL) {
         return 1;
     }
     if(fork() == 0) {
         execl("/bin/sh", "sh", "-c", CMD, NULL);
         _exit(127);
     }
     wait(NULL);
 }
 // 测试样例:./mysystem date 实现 sysytem("date")
 int main(int argc,char*argv[]) {
     Mysystem(argv[1]);
     return 0;
 }

3.2、进程的终止

终止进程的过程(撤销原语)

  • 根据被终止进程的 PID,检索 PCB,读取该进程的状态
  • 若进程处于运行态,立即终止该进程的执行,然后将 CPU 资源分配给其他进程;
  • 如果进程还有子进程,则将该进程的子进程交给 init 进程(pid = 1)回收
  • 将该进程所拥有的全部资源,或归还给其父进程,或归还给操作系统;
  • 将该 PCB 从所在队列中删除

exit 函数

以 status 退出状态来终止进程。

#include <unistd.h>
 void _exit(int status);

当一个进程由于某种原因终止时,内核并不是立即把它从系统中删除。相反,进程被保持在一种已终止的状态,直到被它的父进程回收。当父进程回收已终止的子进程时,内核将子进程的退出状态传递给父进程,然后抛弃已终止的进程,至此该进程被终止。

* 僵死进程

僵死进程:一个终止但并未被回收的进程。

父进程需要及时回收已终止的子进程。因为僵死进程即使没有运行,仍然消耗系统的内存资源。

父进程调用 wait 或 waitpid 函数来等待它的子进程终止或停止。

#include <sys/types.h>
 #include <sys/wait.h>
 // 随机等待一个子进程
 pid_t wait(int *status);
 // 等待指定 pid 的子进程
 pid_t waitpid(pid_t pid, int *status, int options);

* 孤儿进程

孤儿进程:父进程先于子进程退出。自动被养父 init 进程(pid = 1)收养。当一个孤儿进程退出后,它的资源清理会交给它的父进程(init 进程)来处理。但在此之前,它一直消耗系统的资源,要尽量避免。

3.3、进程的阻塞和唤醒

阻塞进程的过程:进程等待事件,主动调用 Block 原语

  • 找到将要被阻塞进程 PID 对应的 PCB
  • 如果该进程为运行状态,则保护其现场,将其状态转为阻塞态,停止运行
  • 将该 PCB 插入到相应事件的等待队列,将 CPU 调度给其他就绪进程

唤醒进程:其他相关进程调用,Wakeup 原语

唤醒进程的过程如下:

  • 在该事件的等待队列中找到相应进程的 PCB
  • 将其从队列中移出,并置其状态为就绪态
  • 把该 PCB 插入就绪队列中,等待调度

Block 原语和 Wakeup 是一对作用相反的原语,必须成对使用。

3.4、进程的切换

进程切换:处理机从一个进程的运行转到另一个进程上运行,这个过程中,进程运行环境产生了实质性变化。

调度是指资源分配给哪一进程的行为,是一种决策;切换是指实际分配的行为,是执行行为。一般来说,先有资源的调度,然后才有进程的切换。

进程切换的过程

  • 保存 CPU 上下文,包括程序计数器和其他寄存器
  • 更新 PCB信息
  • 把进程的 PCB 移入相应的队列
  • 选择另一个进程执行,更新 PCB
  • 更新内存管理的数据结构
  • 恢复 CPU 上下文

4、进程间通信

进程间主要通信方式有:管道、共享内存、信号、信号量、消息队列、套接字

参考我的博客:linux 进程间通信

5、进程调度算法

进程调度算法

  • 先来先服务:选择最先进入队列的
  • 短作业优先:选择完成时间最短的
  • 优先级调度:选择优先级别最高的
  • 高响应比优先:选择响应比最高的
  • 时间片轮转:总是选择就绪队列中第一个进程,但仅能运行一个时间片
  • 多级反馈队列:时间片轮转 + 优先级调度

参考

相关文章
|
2月前
|
网络协议 Linux
Linux查看端口监听情况,以及Linux查看某个端口对应的进程号和程序
Linux查看端口监听情况,以及Linux查看某个端口对应的进程号和程序
208 2
|
2月前
|
Linux Python
linux上根据运行程序的进程号,查看程序所在的绝对路径。linux查看进程启动的时间
linux上根据运行程序的进程号,查看程序所在的绝对路径。linux查看进程启动的时间
51 2
|
13天前
|
Linux Shell
6-9|linux查询现在运行的进程
6-9|linux查询现在运行的进程
|
2月前
|
消息中间件 Linux 开发者
Linux进程间通信秘籍:管道、消息队列、信号量,一文让你彻底解锁!
【8月更文挑战第25天】本文概述了Linux系统中常用的五种进程间通信(IPC)模式:管道、消息队列、信号量、共享内存与套接字。通过示例代码展示了每种模式的应用场景。了解这些IPC机制及其特点有助于开发者根据具体需求选择合适的通信方式,促进多进程间的高效协作。
90 3
|
2月前
|
消息中间件 Linux
Linux进程间通信
Linux进程间通信
37 1
|
2月前
|
C语言
Linux0.11 系统调用进程创建与执行(九)(下)
Linux0.11 系统调用进程创建与执行(九)
26 1
|
2月前
|
存储 Linux 索引
Linux0.11 系统调用进程创建与执行(九)(上)
Linux0.11 系统调用进程创建与执行(九)
54 1
|
2月前
|
Web App开发 Linux
在Linux中,如何杀死一个进程?
在Linux中,如何杀死一个进程?
|
2月前
|
域名解析 监控 安全
在Linux中,什么是守护进程,它们是如何工作的?
在Linux中,什么是守护进程,它们是如何工作的?
|
2月前
|
消息中间件 Linux
在Linux中,进程间通信方式有哪些?
在Linux中,进程间通信方式有哪些?