一:进程
a):什么是进程
正在跑起来的程序---正在运行的程序.
以QQ为例,QQ.exe为程序.而当我们双击时,此时,程序就会开始运行,此时,这种状态被称为进程.
b):进程的特点
1): 同一个程序运行多次,就可以产生多个进程.
2):进程能够消耗一定的硬件资源.(可执行程序,只是占用了硬盘空间,而进程,会消耗CPU ,内存资源,硬盘,网络带宽)
3):进程是系统分配硬件资源的基本单位.(当运行一个程序时,操作系统会将(硬盘空间,CPU,内存资源,网络带宽等)打包成一份,通过操作系统给这个程序,让其运行起来).
c):操作系统如何管理线程
1):描述:会使用专门的结构体(PCB)---进程控制块,来记录一个进程里面的属性
2):组织:会使用一系列的数据结构(通常使用双向链表的方式进行组织),把多个进程进行一个有效的组织,随时方便进行遍历,查找,汇总数据.
当我们使用双向链表时候---->针对linux来说的
a):查看进程的链表,相当于遍历这个双向链表
b):创建一个进程,相当于创建一个进程控制块,并且插入链表
c);销毁一个进程,相当于把这个pcb从双向链表上删除并释放
d): PCB(进程控制块)包含哪些?
1):pid进程的标识.
同一个系统上同一时刻,每个进程的pid都是不同的
b):内存指针:表示了该进程的内存资源是咋样的
保存main:存储从exe可执行文件加载过来的指令(二进制的指令))和数据(执行的这些指令,会依赖一些数据)
c):文件描述符表----和硬盘资源有关
文件都是保存在硬盘上的.,每个进程都会有一个"文件描述符表",来记录,当前这个进程来使用哪些文件-----
操作系统打开一个文件,就会产生一个"文件描述符"(就像文件的身份标识一样,当然只是在进程内部生效的),同时会使用文件描述符表,将其组织起来.
e):进程在CPU是怎样执行的?
进程是需要在cpu上来执行指令的,每个进程想要执行里面的指令,就需要在cpu上执行!!!,进程有多个,但CPU有一个,各个进程之间是轮着用的!!!,进程调度!!!
重点:cpu只有一个,现在的cpu都是多核心的(即一个cpu里面有多个核心),提高运行速度.
一个CPU的核心,当两个来用----超线程技术,即一个cpu核心,是一个物理核心,相当于两个逻辑核心.
*假设CPU的逻辑结构是16个,但是我要用的进程有几十个,上百个,仍然是不够用的?该如何进行调度?
1:并行:同一时刻,两个进程,同时运行在两个cpu核心上
2:并发:两个进程,在同一个逻辑核心上,轮着上.(由于cpu切换进程速度极快,微观上看起俩是串行进行的)
并发=并行+并发
f):PCB中关于进程调度的相关属性
a):状态----状态可以相互转换的
就绪状态:一个进程已经做好了随时去cpu上执行的准备
阻塞状态:进程没有准备好被调用到cpu上
b):优先级
系统给进程进行完全调度的时候,也不是完全公平的,也会根据优先级不同,来决定时间分配的权衡,把系统资源调配给更重要的进程.
c):上下文
这些进程是轮着上的,一次运行不完,就需要保证下次执行进程的时候,能够从上次运行的位置,继续往后运行.对于操作系统来说,所记录的上下文是啥,就是执行该进程在执行的过程中,CPU的寄存器对应的数据.
d):记账信息
相当于是一个统计信息,会统计每个进程在cpu上执行多少指令,执行了多久,对进程的调度进行一个兜底.
g):每个进程都有一个内存资源,具体是怎么分配的?
一:早期的操作系统,直接将物理内存分配给进程,那么其中一个程序出现bug了,那么就会内存访问越界,影响其他进程.
后来,操作系统就引入了"虚拟地址空间概念",有效解决上述问题.通过虚拟地址空间,把进程隔离开.
进程间通信,在进程隔离性的基础上,开个口子,能够有限制的进行相互影响.
进程之间用来通信的办法:找一个公共的区域,多个进程都能访问到的进程的区域,借助公共区域来完成数据的交互.
二进程的作用
满足"并发编程"这样的需求,并发编程:CPU逐渐变成多个核心,应用程序,也需要做出对应的调整,来让代码可以把多个核心充分利用起来.
并发=并行+并发
二:线程
a):一:线程的引入
a):如果创建和销毁进程不频繁,还好,如果进程创建和销毁太过频繁.即开销(分配内存资源)比较大.那么,并发编程内存资源消耗巨大.
b):如何解决这一问题?创建进程的时候,我们只创建一个关于进程的属性的模块即pcb,而不去分配后续的内存硬盘资源,即能够并发的执行任务,又能够提升创建/销毁的速度??
轻量级进程------>线程(Thread),只创建一个pcb,但是没有分配后续的内存,硬盘,资源.
c):针对b问题,线程只有一个pcb的属性,而没有分配硬件资源,程序无法运行起来,该怎样解决?
创建的还是进程,只不过在创建线程的之前,就在创建进程的时候,将硬件资源分批好;后续创建线程的时候,让线程进入进程内部,(进程和线程之间的关系,进程包含线程),线程复用进程中已经分配好的硬件资源.(在创建第一个线程之前,进程的硬件资源分配比较大,但是,后面创建的线程加入进程之后,不用再分配硬件等资源了,即多个线程可以复用进程中的资源,又能够完成"并发编程",又可以以比较轻量的方式进行)
d):一个pcb对应一个线程.多个pcb对应一个进程.PCB中的内存指针,文件描述附表,同一个进程中的多个PCB(线程),这两个字段是一样的,但是上下文,状态,优先级,记账信息,支持调度的属性,则这些PCB不一样.进程,是操作系统进程资源分配的基本单位.线程,是操作系统调度执行的基本单位.
综上所述:我们不难发现:多线程和多进程都能解决"并发编程"问题,但多进程消耗资源过大,即内存等资源,而多线程提高了效率,但不安全.
b):线程和进程的区别和联系
a):进程包含线程,都是为了实现并发编程的方式,线程比并程更轻量.
b):进程是系统分配资源的基本单位,线程是操作系统调度执行的基本单位,创建进程的时候将分配资源(虚拟地址空间,文件描述符表)的工作给做了创建线程的时候,直接共用之前的资源.
c):进程之间有相互独立的地址空间,彼此之前不会影响,从而使系统的稳定性得到提升,多个线程公用这一份地址空间,一个线程一旦抛出异常,那么多个线程之间也会出现影响.
c):线程池
a):把一些要释放的资源,不要着急释放,而是先放到一个"池子里",以备后续使用
b):申请资源的时候,也是先把提前要申请好的资源申请号,也放到一个池子中,后续申请比较方便