不管Java,C++都有进程、线程相关的内容。在这里统一整理吧。
Python的线程,其实是伪线程,不能真正的并发。下面也有讲。
线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈)。
多个线程共享内存。
参考了这篇文章:http://www.cnblogs.com/qiaoconglovelife/p/5319779.html
进程 线程
进程与PCB
进程:进程是程序的一次执行过程,是系统进行资源分配和调度的一个独立单位。
进程实体(进程映像):由程序段、相关数据段和PCB三部分构成。进程是动态的,进程实体是静态的。
PCB(进程控制块):系统利用PCB来描述进程的基本情况和运行状态,进而控制和管理进程;所谓创建进程,实际上是创建进程映像中的PCB;PCB是进程存在的唯一标志。
进程有5种状态,其中前3种是基本状态:
运行态、就绪态、阻塞态(等待态)。另两种是新建态和终止态。
进程的创建过程
(1)分配ID与PCB:为新进程分配一个唯一的进程标识号,并申请一个空白的PCB(PCB是有限的)。若PCB申请失败则创建失败。
(2)分配资源:为新进程的程序和数据、以及用户栈分配必要的内存空间(在PCB 中体现)。注意:这里如果资源不足(比如内存空间),并不是创建失败,而是处于阻塞态。
(3)初始化PCB:主要初始化(1)标志信息(2)处理机状态信息(3)处理机控制信息,以及(4)设置进程的优先级等。
(4)调度:如果进程就绪队列能够接纳新进程,就将新进程插入到就绪队列,等待被调度运行。
注意,进程的创建是一个原子操作,执行期间不允许中断,它是一个不可分割的基本单位。
进程的终止
引起进程终止的事件主要有:
(1)正常结束
(2)异常结束:如存储区越界、非法指令、I/O故障等
(3)外界干预:如操作员或操作系统干预、父进程请求、父进程终止。
操作系统终止进程的过程如下:
(1)根据被终止进程的ID,检索PCB,从中读出该进程的状态
(2)若被终止进程处于执行状态,立即终止该进程的执行,将处理机资源分配给其他进程
(3)若该进程还有子进程,则应将其所有的子进程终止
(4)将该进程所拥有的资源,或归还给其父进程或归还给操作系统
(5)将该PCB从所在队列(链表)中删除。
进程之间的切换
(1)保存处理机上下文,包括程序计数器和其他寄存器。
(2)更新PCB信息。
(3)把进程的PCB移入相应的队列,如就绪、在某事件阻塞等队列。
(4)选择另一个进程执行,并更新其PCB。
(5)更新内存管理的数据结构。
(6)恢复处理机上下文。
注意:“调度”和“切换”的区别:调度是指决定资源分配给哪个进程的行为,是一种决策行为;切换是指实际分配的行为,是执行行为。一般来说,等有资源的调度,再有进程的切换。
线程
线程是轻量化的进程,是程序执行流的最小单位;由线程ID、程序计数器、寄存器集合和堆栈组成;线程自己不拥有系统资源,只拥有一点在运行中必不可少的资源,但它可与同属一个进程的其他线程共享进程所拥有的全部资源。
进程与线程区别
(1)一个程序至少有一个进程,一个进程至少有一个线程。线程(Thread)是进程的一个实体,是CPU调度和分派的基本单位;
(2)进程拥有独立的内存单元,而多个线程共享内存。从而线程效率更高;
(3)进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程没有单独的地址空间,一个线程死掉就等于整个进程死掉,所以多进程的程序要比多线程的程序健壮;
(4)进程切换时,耗费资源较大,效率要差一些;
(5)进程是系统资源分配的基本单位,线程是调度的基本单位。
线程独有的内容:
线程上下文,包括线程ID、栈、栈指针、PC(程序计数器)、通用目的寄存器、条件码。
线程共享的内容:
文件描述符和整个用户虚拟地址空间,包括只读文本(代码)、静态变量、堆、所有的共享库代码和数据区域组成。
相比进程,线程有什么好处
(1)易于调度。
(2)提高并发性。通过线程可方便有效地实现并发性。进程可创建多个线程来执行同一程序的不同部分。
(3)开销少。创建线程比创建进程要快,所需开销很少。。
(4)利于充分发挥多处理器的功能。
相比进程,线程有什么缺点
(1)线程之间的同步和加锁控制比较麻烦
(2)一个线程的崩溃影响到整个程序的稳定性
(3)线程多了之后,线程本身的调度也是一个麻烦事儿,需要消耗较多的CPU
分离线程
- 线程可以是可结合的,或者是可分离的;
- 可结合的线程能够被其他线程收回其资源和杀死。在被其他线程回收之前,它的存储器资源(例如栈)是没有被释放的,相反一个分离的线程是不能被其他线程回收或杀死的。它的存储器资源在它终止时由系统自动释放;
- 为避免存储器泄漏,每个可结合线程都应该被其他线程显式地收回,要么通过调用pthread_detach函数被分离;(对应于Java就是 Thread.join和Thread.detach )
- 默认情况下,线程被创建成可结合的。(注意:可结合是一种状态,要调用join方法来进行结合/释放)
来一个例子:
package com.company; import static java.lang.Thread.sleep; class Solution { } class MyRunnable implements Runnable { int x = 5; @Override public void run() { synchronized(this) { for (int i = 0; i < 5; i++) { System.out.println("hi " + Thread.currentThread().getName() + ":" + x--); } } System.out.println("here to sleep"); try { sleep(5000); } catch (InterruptedException e) { e.printStackTrace(); } } } public class Main { public static void main(String[] args) throws InterruptedException { MyRunnable mr = new MyRunnable(); Thread t1 = new Thread(mr, "1"); Thread t2 = new Thread(mr, "2"); Thread t3 = new Thread(mr, "3"); t1.start(); t2.start(); t3.start(); System.out.println(); } }
打印结果:
hi 1:5 hi 1:4 hi 1:3 hi 1:2 hi 1:1 here to sleep hi 3:0 hi 3:-1 hi 3:-2 hi 3:-3 hi 3:-4 here to sleep hi 2:-5 hi 2:-6 hi 2:-7 hi 2:-8 hi 2:-9 here to sleep
三个线程,同时sleep了5秒钟,然后整个程序才结束。
如果synchronized加在函数上,那么是每个线程分别sleep 5秒钟,一共sleep 15秒钟。
IPC方式(进程间通信方式)
(1)管道:半双工;用于父子、兄弟之间。
(2)命名管道(FIFO)
(2)消息队列:消息链表存于内核,每个消息队列由消息队列标识符标识;于管道不同的是,消息队列存放在内核中,只有在内核重启时才能删除一个消息队列;消息队列的大小受限制。
(3)信号量(semophore):常用来处理临界资源的访问同步问题。临界资源:为某一时刻只能由一个进程或线程操作的资源。
(4)共享内存:可以说是最有用的进程间通信方式,也是最快的IPC形式。
(5)套接字:也可用于不同机器之间。
(6)信号(Signal)
线程同步方式
(1)临界区:当多个线程访问一个独占性共享资源时,可以使用临界区对象。拥有临界区的线程可以访问被保护起来的资源或代码段,其他线程若想访问,则被挂起,直到拥有临界区的线程放弃临界区为止。
(注:Java的synchronized代码段,也勉强可以算作临界区,只是语言标记互斥的实现方式;要访问代码段,需要获得传给synchronized的Object这个对象的锁。注意,每个java对象都隐含有一把锁。
Java GC需要的safe point,为了让多个线程都停下来,标记的区域-其他线程不进来,里面的线程出来了,就开始GC- 跟临界区的思想也有一点像)
(2)互斥量-mutex:互斥对象和临界区对象非常相似,只是其允许在进程间使用,而临界区只限制与同一进程的各个线程之间使用。
(3)条件变量:一个线程被挂起,直到某件事件发生。
(4)信号量:当需要一个计数器来限制可以使用某共享资源的线程数目时,可以使用“信号量”对象。CSemaphore类对象保存了对当前访问某一个指定资源的线程的计数值,该计数值是当前还可以使用该资源的线程数目。如果这个计数达到了零,则所有对这个CSemaphore类对象所控制的资源的访问尝试都被放入到一个队列中等待,直到超时或计数值不为零为止。
(5)事件:允许一个线程在处理完一个任务后,主动唤醒另外一个线程执行任务。
(6)套接字