操作系统(Operating System)
操作系统是一组做计算机资源管理的软件的统称。目前常见的操作系统有:Windows系列、Unix系列、Linux系列、OSX系列、Android系列、iOS系列、鸿蒙等。
操作系统的定位
操作系统由两个基本功能:
- 防止硬件被时空的应用程序滥用;
- 向应用程序提供简单一致的机制来控制复杂而又通常大相径庭的低级硬件设备。
认识进程
- 进程:正在跑起来的程序~~正在运行的程序
进程是操作系统对一个正在运行的程序的一种抽象,换言之,可以把进程看做程序的一次运行过程;
同时,在操作系统内部,进程又是操作系统进行资源分配的基本单位。
- 程序是可执行文件,只是硬盘上的一个东西(静态的)
- 如果双击程序,此时操作系统,就会把可执行文件中的数据和指令,加载到内存中,并且让 cpu 去执行这里的指令,完成一系列相关的工作。运行起来的(动态的),进程~~
- 运行起来的进程会消耗CPU资源、内存资源、硬盘、网络带宽……
- 进程是系统分配硬件资源的基本单位
- 计算机中“进程”管理的核心思路:先描述再组织
- 描述:会使用一个专门的结构体(PCB 进程控制块)来记录一个进程里面的各个属性
- 组织:会使用一系列的数据结构,把多个进程进行一个有效的组织,随时方便进行遍历,查找,汇总数据……(通常是使用双向链表这样的方式来进行组织)
进程控制块抽象(PCB Process Control Block)
PCB中大概有哪些信息?
// 以下代码是 Java 代码的伪码形式,重在说明,无法直接运行 class PCB { // 进程的唯一标识 —— pid; // 进程关联的程序信息,例如哪个程序,加载到内存中的区域等 // 分配给该资源使用的各个资源 // 进度调度信息(留待下面讲解) }
- 进程的标识(pid):同一个系统上,统一时刻中,每个进程的 pid 一定都是不同的
- 内存指针:表示了该进程对应的内存资源是咋样的
内存资源中要存啥?最主要要存储的就是从exe可执行文件中加载过来的指令(二进制的,就是程序员写的代码的逻辑,进一步的再交给CPU来执行)和数据(执行的这些指令,会依赖到一些数据),还需要保存一些运行过程中的中间结果之类的数据 - 文件描述符表:每个进程就会有一个“文件描述符表”来记录,当前这个进程正在使用哪些文件这就和硬盘资源有关了,硬盘是硬件,应用程序一般是没法直接接触到“硬件”这一层的,实际上是操作系统抽象成“文件”这样的概念,程序操作的是文件,文件实际上是存储在硬盘上的。每个进程就会有一个“文件描述符表”来记录,当前这个进程正在使用哪些文件,操作系统打开一个文件,就会产生一个“文件描述符”(就像文件的身份标识一样,当然,只在进程内部产生),同时会使用文件描述符(类似于数组),把文件描述符给组织起来CPU. 进程是需要在CPU上来执行指令的早期的CPU都是单核心的,但算力不够就变成多核心了进程的调度:
- 并行:同一时刻,两个进程,同时运行在两个 cpu 逻辑核心上
- 并发:两个进程,在同一个舞台上,轮着上。由于CPU切换进程速度极快,微观上,这俩进程是串行执行的;宏观上,看起来这俩进程就是“同时”执行的
- 操作系统在调度这些进程时,两种都有可能
- 在应用程序这一层是感知不到的(在系统内核中感知到)。由于感知不到,通常用“并发”代指“并行”和“并发”
- PCB中关于进程调度相关的属性(这些属性也就描述了进程对应的 cpu 资源的使用情况)
- 状态
就绪状态:一个进程已经随时做好了在CPU上执行的准备
阻塞状态/睡眠状态:进程没有准备好被调度到CPU上
实际上,进程在系统中状态还有很多种,其中最最关键的就是 就绪 和 阻塞 状态 - 优先级:系统给进程进行调度的时候,也不是完全公平的,也会根据优先级的不同,来决定时间分配的权衡就可以把系统资源调配给更重要的进程上了
- 上下文:这些进程是轮着上的,一次运行不完。就需要保证下次上 cpu 运行的时候,能够从上次运行到的位置,继续往后运行
对于操作系统来说所记录的上下文,就是该进程在执行过程中,CPU的寄存器中对应的数据
存档 读档 - 记账信息:相当于是一个统计信息,会统计每个进程在 cpu 上都执行了多久了,执行了多少指令了,是对于进程的调度工作进行一个“兜底“
每个进程有需要有一定的内存资源
在虚拟地址空间的加持下 =>进程就具有了"独立性”=>每进程有自己的虚拟地址空间 =>一个进程无法直接访问或者修改其他进程虚拟地址空间的内容=>强化了系统稳定性
通过虚拟地址空间,把进程隔离开了,但是有时候,还需要让进程之间,产生点配合/联系
进程间通信:就是在进程隔离性的基础上,开个口子,能够有限制的进行相互影响
多进程已经很好的实现了并发编程的效果了,但是有明显的缺点:
- 消耗资源更多
- 速度更慢