一:先介绍一下四个概念:同步,异步,阻塞,非阻塞。
同步
就是在发出一个功能调用时,在没有得到结果之前,该调用就不返回。比如,调用readfrom系统调用时,必须等待IO操作完成才返回。
异步
异步的概念和同步相对。当一个异步过程调用发出后,调用者不能立刻得到结果。实际处理这个调用的部件在完成后,通过状态、通知和回调来通知调用者。比如:调用aio_read系统调用时,不必等IO操作完成就直接返回,调用结果通过信号来通知调用者。
阻塞
阻塞调用是指调用结果返回之前,当前线程会被挂起。函数只有在得到结果之后才会返回。
塞和同步是完全不同的概念。首先,同步是对于消息的通知机制而言,阻塞是针对等待消息通知时的状态来说的。而且对于同步调用来说,很多时候当前线程还是激活的,只是从逻辑上当前函数没有返回而已。
非阻塞
非阻塞和阻塞的概念相对应,指在不能立刻得到结果之前,该函数不会阻塞当前线程,而会立刻返回,并设置相应的errno。
然表面上看非阻塞的方式可以明显的提高CPU的利用率,但是也带了另外一种后果就是系统的线程切换增加。增加的CPU执行时间能不能补偿系统的切换成本需要好好评估。
二:五种Io模型
1.阻塞式Io
<linux/wait.h> <linux/sched.h>
在对设备进行操作的时候,如果条件不满足,阻塞 —>>> 应用层进程处于休眠状态
1.初始化等待队列头
数据类型:wait_queue_head_t /定义并初始化等待队列头/ #define DECLARE_WAIT_QUEUE_HEAD(name) \ wait_queue_head_t name = __WAIT_QUEUE_HEAD_INITIALIZER(name) init_waitqueue_head(wait_queue_head_t *q) //初始化等待队列头
2.初始化等待队列项
数据类型:wait_queue_t void init_waitqueue_entry(wait_queue_t *q, struct task_struct *p) 参数: @q 等待队列项结构体指针 @p task_struct 结构体指针 (current)
3.将等待队列项添加到等待队列头上
void add_wait_queue(wait_queue_head_t *q, wait_queue_t *wait); 参数: @q 等待队列头结构体指针 @wait 等待队列项结构体指针
4.将应用层进程状态切换到休眠态(S/D)
set_current_state(state_value) 功能:设置进程状态的函数宏 参数: @state_value 进程状态 TASK_RUNNING 运行态 TASK_INTERRUPTIBLE 可中断睡眠态 TASK_UNINTERRUPTIBLE 不可中断睡眠态
5.执行进程调度,调度其他进程执行
void schedule(void); =等待条件满足== 唤醒应用层进程 wake_up(x) //唤醒不可中断睡眠态的进程 wake_up_interruptible(x) //唤醒可中断睡眠态的进程 参数: @x wait_queue_head_t *
=====================================================
6.将等待队列项从等待队列头上移除
void remove_wait_queue(wait_queue_head_t *q, wait_queue_t *wait); 参数: @q 等待队列头结构体指针 @wait 等待队列项结构体指针
7.将应用层进程状态由休眠态切换到运行态
set_current_state(state_value)
8.正常往下执行,获取相关数据
驱动实现阻塞的简化方法:
wait_event(wq, condition) //不可中断睡眠态 —>>> 唤醒 wake_up(x) wait_event_interruptible(wq, condition) //可中断睡眠态 —>>>唤醒 wake_up_interruptible(x) 参数: @wq wait_queue_head_t 等待队列头变量 @condition 条件
优点是简单,实时性高,响应及时无延时,但缺点也很明显,需要阻塞等待,性能差;
2.阻塞式Io
在对设备进行操作的时候,如果条件不满足,报错返回
在应用层开启非阻塞模式 O_NONBLOCK
非阻塞模式
#define O_NONBLOCK 00004000 open(fd,O_RDWR|O_NONBLOCK);
在驱动中read接口里,实现非阻塞模式 —>>> 需要在read接口中判断是否是非阻塞模式:
ssize_t demo_read(struct file *filp, char __user *buf, size_t size, loff_t *off) struct file{ … unsigned int f_flags; //标志 … }
优点:能够在等待任务完成的时间里干其他活了(包括提交其他任务,也就是 “后台” 可以有多个任务在同时执行)。
缺点:任务完成的响应延迟增大了,因为每过一段时间才去轮询一次read操作,而任务可能在两次轮询之间的任意时间完成。这会导致整体数据吞吐量的降低。
3.Io多路复用
IO 多路复用的好处就在于单个进程就可以同时处理多个网络连接的IO。它的基本原理就是不再由应用程序自己监视连接,取而代之由内核替应用程序监视文件描述符。
以select为例,当用户进程调用了select,那么整个进程会被阻塞,而同时,kernel会“监视”所有select负责的socket,当任何一个socket中的数据准备好了,select就会返回。这个时候用户进程再调用read操作,将数据从内核拷贝到用户进程。
优势
与传统的多线程/多进程模型比,I/O多路复用的最大优势是系统开销小,系统不需要创建新的额外进程或者线程,也不需要维护这些进程和线程的运行,降底了系统的维护工作量,节省了系统资源。
主要应用场景:
①、服务器需要同时处理多个处于监听状态或者多个连接状态的套接字;
②、服务器需要同时处理多种网络协议的套接字,如同时处理TCP和UDP请求;
③、服务器需要监听多个端口或处理多种服务;
④、服务器需要同时处理用户输入和网络连接。
4.信息驱动式Io
允许Socket进行信号驱动IO,并注册一个信号处理函数,进程继续运行并不阻塞。当数据准备好时,进程会收到一个SIGIO信号,可以在信号处理函数中调用I/O操作函数处理数据。
5.异步Io模型
上述四种IO模型都是同步的。相对于同步IO,异步IO不是顺序执行。用户进程进行aio_read系统调用之后,就可以去处理其他的逻辑了,无论内核数据是否准备好,都会直接返回给用户进程,不会对进程造成阻塞。等到数据准备好了,内核直接复制数据到进程空间,然后从内核向进程发送通知,此时数据已经在用户空间了,可以对数据进行处理了。
在 Linux 中,通知的方式是 “信号”,分为三种情况:
①、如果这个进程正在用户态处理其他逻辑,那就强行打断,调用事先注册的信号处理函数,这个函数可以决定何时以及如何处理这个异步任务。由于信号处理函数是突然闯进来的,因此跟中断处理程序一样,有很多事情是不能做的,因此保险起见,一般是把事件 “登记” 一下放进队列,然后返回该进程原来在做的事。
②、如果这个进程正在内核态处理,例如以同步阻塞方式读写磁盘,那就把这个通知挂起来了,等到内核态的事情忙完了,快要回到用户态的时候,再触发信号通知。
③、如果这个进程现在被挂起了,例如陷入睡眠,那就把这个进程唤醒,等待CPU调度,触发信号通知。