1.进程
进程也叫做“任务”,一个可以跑起来的程序就称为进程。
我们在电脑中所看到的.exe文件就叫做“可执行文件”,双击这个exe文件,操作系统就会把这个文件中的核心数据加载到内存里,同时在系统中,生成一个“进程”,我们可以在任务管理器中看到进程。
2.线程
线程是进程的一部分,如果说进程是工厂,那么线程就是生产线,所以一个进程可以包含多个线程,但一个进程至少包含一个线程。
3.进程管理
进程的管理分为描述和组织两部分。
在进程管理中,往往通过结构体来表示进程中有哪些属性、信息,这个结构体就叫做PCB
(更准确的来说,是一组PCB描述一个进程,每个PCB对应一个线程)
组织便是系统通过双向链表这样的数据结构,来把这些PCB给组织在一起,来进行增删改查操作。
创建一个进程,本质上就是创建PCB并且加入到链表上;销毁一个进程,本质上就是从链表上删除对应的PCB节点;
查看任务管理器的进程列表,本质上就是在遍历这个链表。
3.1 PCB进程控制块
在PCB中,有以下一些信息:
1.PID 进程的身份标识
在同一个主机的同一个时刻,进程的PID是唯一的,通过这些PID来区分一个进程。
内存指针
描述进程持有的内存资源
3.文件描述符表
描述进程持有的文件资源
通过2、3可以说明,进程是操作系统分配资源的基本单位
在PID中还有以下信息,与进程的调度有关,这些信息的具体介绍,见3.3
4.进程状态
5.进程优先级
6.进程上下文
7.进程记账信息
3.2 并行与并发
在我们的实际开发中,比如说我们的电脑,CPU核数有限,但是我们在使用时进程很多,这时我们就需要将资源进行合理的安排,也就是进程调度。在了解进程的调度之前,我们需要先来了解并行与并发的概念。
并行执行:每个CPU核心上都可以独立的运行一个进程,多个CPU核心就可以同时独立的运行多个进程
并发执行:一个CPU核心,先运行进程1,再运行进程2,再运行进程3,只要在微观上切换的足够快,在宏观上看来就好像是3个进程在同时运行一样。
3.3 进程的调度
与进程的调度有关的就是进程状态、进程优先级、进程上下文、进程记账信息等信息,为了更好的了解这些信息,我们来引入一个例子:
假如有一位既长得好看,又有才华的小姐姐,现在有3个追求者,A有钱,B有颜,C会舔;在这些追求者中并没有同时符合三个条件的,所以小姐姐开始养起了鱼塘,并给三个追求者安排了一周满满的约会时间表。
按照这个时间表来要求自己的时间,就可以让自己很好的游走于三个人之间,在不同的时间与不同的追求者完成不同的事。
上边的这个例子,小姐姐就是操作系统,三位追求者便是三个进程,通过这样的例子来解释下边的信息:
进程状态:
虽然安排了时间表,但不一定不会有情况发生,有的时候某个追求者也会有特殊情况,不能随叫随到。此时随叫随到便是进程的就绪状态,不能随叫随到便是阻塞状态。
如果进程处于随时都能被调度的状态,就称这个状态为就绪,如果进程由于一系列因素无法及时响应调度,则称这个状态为阻塞或睡眠,线程正在CPU上执行的状态称为执行状态。
进程优先级:
在这三个追求者中,小姐姐也对某个追求者有所偏爱,喜欢多一点的就会多排一点时间,喜欢少一点的就会少排一点时间
系统调度的时候,会根据优先级来给进程安排时间
进程上下文:
小姐姐在和A在一起的时候和A商议好,两周以后一块去三亚旅游;小姐姐和B在一起的时候,B请小姐姐帮忙挑选一个生日礼物给B的妈妈。
这时候小姐姐必须做好记录,这样才能防止在下次约会的时候搞岔劈。
进程在CPU上执行了一会以后,要切换给别的进程,就需要保存当前运行的中间结果(存档),下次再轮到它的时候,就恢复之前的中间结果(读档),继续往下执行。
进程记账信息:
因为C只会舔,所以小姐姐给他安排的时间很少,虽然小姐姐不是很喜欢C,但是也不能完全不给C排时间,如果不排时间,过了一段时间以后,C可能就心灰意冷不乐意了。
记录每个进程在CPU上执行了多久,使得资源分配更加均衡,避免有进程完全轮不到CPU执行
3.4 进程间通信
在操作系统上同时运行着多个进程,如果当一个进程出现bug导致进程崩溃,其他的进程并不会因此而受到干扰,这是因为进程之间使用虚拟地址空间,使得进程间产生了“隔离性”,来保证进程各自的独立性。
但是在实际开发中,进程之间常常需要进行交互,为了实现进程间的通信,操作系统会找一个多个进程都可以访问到的公共资源,然后基于公共资源来交换数据。
最常见的进程间通信机制有:
1.文件操作。
2.网卡(socket)
4.进程与线程的区别和联系
【经典面试题】
- 直观理解:进程是包含线程的,一个进程里可以有一个线程,也可以有多个线程。 类比:进程是工厂,线程是生产线
- 系统角度:进程是操作系统资源分配的基本单位,线程是操作系统调度执行的基本单位。
- 每个进程都有独立的内存空间(虚拟地址空间),同一个进程的多个线程之间,共用这个虚拟地址空间(例如共同使用同一个变量)。