Linux进程理解【进程认识】
进程(Process)
是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配的基本单位,是操作系统结构的基础。在早期面向进程设计的计算机结构中,进程是程序的基本执行实体;在当代面向线程设计的计算机结构中,进程是线程的容器。程序是指令、数据及其组织形式的描述,进程是程序的实体
概念生涩难懂,稍作了解即可,下面正文开始,我将带领大家一步步搞懂进程的相关知识
1. 冯诺依曼体系结构
我们常见的计算机,如笔记本。我们不常见的计算机,如服务器,大部分都遵守冯诺依曼体系,他提出计算机由五部分组成,即输入设备
、存储器
、运算器
、控制器
、输出设备
来解释一个问题,为什么要有存储器(内存)?
这里的
存储器
指的就是内存
,输入、输出设备都是外设
,而外设
的数据传输速度都很慢,但是内存
的数据传输速度很快,CPU
的速度是最快的,内存
的存在可以将输入、输出设备的数据预加载到内存
中,CPU
在进行计算时,直接从内存
中加载数据即可,这样就避免了大量数据被阻塞,如果没有内存
,那么计算机的速度就要取决于速度最慢的外设
了总结:
不考虑缓存情况,这里的
CPU
能且只能对内存进行读写,不能访问外设
,外设
要输入或者输出数据,也只能写入内存或者从内存中读取- 简单来说就是,所有设备(外设)都只能直接和
内存
打交道
2. 操作系统(Operator System)
有了计算机体系,在我们执行程序时往往是面临多层任务,这就需要操作系统(OS)
来进行管理了,操作系统(OS
)是一款软硬件资源管理的软件,所有的软件要运行数据都是加载到内存中
举个大学中的例子,这里校长就是管理者,他的工作就是决策,辅导员来执行决策,而学生则是来参与决策,类比到计算机中这里的学生就相当于是硬件或者软件,这里的辅导员扮演的角色是硬件驱动,校长就相当于操作系统,形成操作系统 -> 硬件驱动 -> 软硬件的管理方式
==计算机管理的本质:先描述,再组织==
接着上面的例子来解释一下,这里校长使用struct
结构体对学生的姓名、学号等进行描述
,使用链表
结构来组织
管理这些学生的信息
计算机管理硬件
- 描述起来,用
struct
结构体 - 组织起来,用链表或其他高效的数据结构
操作系统为什么要对软硬件资源进行管理呢?
- 操作系统通过对下管理好软硬件资源(手段),对上给用户提供良好(安全,稳定,高效等)的执行环境(目的)
系统调用和库函数概念
- 操作系统给我们提供非常良好的服务,并不代表操作系统相信我们,操作系统不相信任何用户,操作系统为了保证服务和自身安全,是以接口的形式来提供服务的,在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口,叫做
系统调用
,库函数和系统调用的关系就是,库函数可能调用系统调用,但不是所有库函数
- 举个例子,就像是银行为我们提供良好的服务,但是银行并不会信任我们,其为我们提供服务都是基于在每个柜台窗口办理的,这样既能保证优质服务,又能保证其内部自身的安全
计算机体系结构图
3. 进程理解
3.1 进程概念
先来看看Windows下的进程,我们会发现多个进程在同时进行,结束其中一个进程并不会影响其他进程的运行,这就说明进程是具有独立性的
提供结论:任何启动或运行程序的行为最终都由操作系统帮助我们来将程序转换称为进程完成特定的任务
操作系统对于加载到内存中的程序如何管理呢?
- 在
Linux
下我们的可执行程序就是一个文件,程序运行时它就会从磁盘中加载到内存中,加载的内容是程序的代码和数据
,只是这样并不能被称为进程,这只是完成了加载数据和代码,并没有说明操作系统对其进行管理。当磁盘中加载到内存的程序有很多个时,为了避免阻塞混乱,操作系统就必须对其做管理了,所以操作系统必须管理进程
操作系统如何管理进程呢?
- 当然是:先描述,再组织,先描述就是对其每个进程创建一个数据结构对象,这个数据结构课本上称为
PCB(process control block)
,Linux
操作系统下的PCB
是task_struct
,这个结构中包含进程的所有相关属性
有上面的铺垫我们就能顺理成章的引入进程的概念了
==进程概念:==
进程由内核关于进程的相关数据结构
和进程相关的代码和数据
组成
3.2 代码和数据
每个进程都有自己的代码和数据,包括修改时间、所处位置等
3.3 进程控制块
上面已经提到了进程控制块PCB
,Linux
下的PCB
就是task_struct
,下面我们来看看其中的相关内容
使用ps
指令来查看正在运行的进程信息
ps ajx //查看进程块信息
ps ajx | head -1 && ps ajx | grep 进程名 | grep -v grep //查看指定进程信息
task_struct
进程控制块内容:
- 标示符: 描述本进程的唯一标示符,用来区别其他进程
- 状态: 任务状态,退出代码,退出信号等
- 优先级: 相对于其他进程的优先级
- 程序计数器: 程序中即将被执行的下一条指令的地址
- 内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
- 上下文数据: 进程执行时处理器的寄存器中的数据
- I/O状态信息: 包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表
- 记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等
- 其他信息
3.4 进程见面
下面我们来编写一个简单的代码通过上面的ps
指令来查看进程信息
可以查看到进程的相关信息,这里的PID
就是进程标识符,PPID
就是父进程标识符
通过系统调用函数获取进程标识符
getpid() //获取进程id(PID)
pid_t = getpid(void);
getppid() //获取父进程id(PPID)
pid_t = getppid(void);
两个函数的使用方法是一样的,我们稍微改造代码来看看
#include <stdio.h>
#include <unistd.h>
int main()
{
int ret = 0;
while(1)
{
printf("我是一个进程,我已经运行了%d秒, 我的PID是:%d\n", ret, getpid());
sleep(1);
ret++;
}
return 0;
}
这里我们可以观察到查看到的PID
与进程PID
是一致的,但是当程序重新运行后,会重新生成PID
所有的进程信息都存储在/porc
目录中,我们也可以进入此目录下查看进程信息
3.5 父子进程
同样可以稍微改写代码,使用getppid()
函数来查看父进程id(PPID)
上面我们说过,当程序重新运行后,会重新生成PID
,但是父进程的PPID
是不会变化的,这是因为程序的父进程就是bash
,bash
命令行解析器本质上也是一个进程,命令行启动的所有程序最终都会变成进程,该进程对应的父进程就是是bash
终止进程:
- 通过
kill -9 PID
,来终止进程,当然也可以加PPID
来终止父进程 - 通过
ctrl + c
,来终止进程,它的本质也是kill -9 PID
来终止
3.6 创建子进程
使用系统调用接口fork,创建子进程
//创建成功,给父进程返回子进程的PID,给子进程返回0;创建失败返回-1给父进程
pid_t fork(void); //创建子进程
使用样例
#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <assert.h>
int main()
{
pid_t ret = fork();
assert(ret != -1); //创建失败
if(ret == 0) //子进程
{
while(1)
{
printf("我是子进程, 我的PID:%d 我的父进程PPID:%d\n", getpid(), getppid());
sleep(1);
}
}
else if(ret > 0) //父进程
{
while(1)
{
printf("我是父进程, 我的PID:%d 我的父进程PPID:%d\n", getpid(), getppid());
sleep(1);
}
}
else
{
printf("进程创建失败!");
}
return 0;
}
fork函数原理:
fork
之后,执行流会变成2个执行流,父进程和子进程谁先运行是不确定的,谁先运行是由调度器决定,通常我们通过if
和else if
来进行执行流分流创建子进程并不是又多了一份代码和数据,而是新建了一个子进程的
PCB
,将父进程PCB中的大部分数据拷贝过来,两者共享一份代码和数据。这里的父子进程是具有独立性的,一个关闭,另外一个不受影响
下面我们修改代码来查看一个现象:
现象:
这里我们会发现,父子进程对全局变量的值进行修改后,都不会影响对方,这是因为fork
在创建对象时存在写时拷贝
,当进程对数据进行修改时,OS会自动给当前进程就会触发写时拷贝
机制,重新创建一份空间来复制原空间的值进行修改
父子进程相互独立的原因
- 代码只有一份,代码是只读的,两者互不影响
- 当其中一个执行流修改数据时,OS会自动给当前进程触发
写时拷贝
机制
Linux进程理解—进程认识,到这里就介绍结束了,本篇文章对你由帮助的话,期待大佬们的三连,你们的支持是我最大的动力!
文章有写的不足或是错误的地方,欢迎评论或私信指出,我会在第一时间改正