常见IO五种模型-阻塞IO、非阻塞IO、IO多路复用、信号驱动IO、异步IO

简介: 用户空间与内核空间进程的寻址空间会划分为两部分:内核空间、用户空间用户空间只能执行受限的命令,而且不能直接调用系统资源,必须通过内核提供的接口来访问内核空间可以执行特权命令。调用一切系统资源

用户空间与内核空间


进程的寻址空间会划分为两部分:内核空间用户空间

用户空间只能执行受限的命令,而且不能直接调用系统资源,必须通过内核提供的接口来访问

内核空间可以执行特权命令。调用一切系统资源


阻塞IO


019f0f84ac15423d8961009537138dbd.png

在客户端连接数量不高的情况下,是没问题的。但是,当面对十万甚至百万级连接的时候,传统的 BIO 模型是无能为力的。因此,我们需要一种更高效的 I/O 处理模型来应对更高的并发量


非阻塞IO


7f28d4e3982a4ddca1108ad520db91ed.png

应用程序不断进行 I/O 系统调用轮询数据是否已经准备好的过程是十分消耗 CPU 资源的。


IO多路复用



如果调用recvform时,恰好没有数据,阻塞IO会使进程阻塞,非阻塞IO使CPU空转,不能充分发挥CPU作用

如果调用recvform时恰好有数据,则用户进程进入第二个阶段,读取并处理数据


文件描述符: 简称FD,是一个从0开始递增的无符号整数,用来关联Linux中的一个文件。在Linux中一切皆文件。

IO多路复用: 是利用单个线程来同时监听多个FD,并在某个FD可读、可写时得到通知,从而避免无效的等待,充分利用CPU资源

不同监听FD的方式、通知的方式有多种实现,常见的有:

select

poll

epoll

差异

select和poll只会通知进程有FD就绪,但不确定具体是那个FD,需要用户进程逐个遍历FD来确认

epoll则会通知用户进程FD就绪的同时,把已就绪的FD写入用户空间f7bb98ad6b574ee8b8fda12126532b4a.png


IO多路复用-selecte9e290fb506a48febe905729b32053e3.png

缺点

需要将整个fd_set从用户空间拷贝到内核空间,select结束还要再次拷贝回用户空间

select无法得知具体是那个fd就绪,需要遍历整个fd_set

fd_set监听的fd数量不能超过1024

IO多路复用-poll7ed80652660f4ec6994225ee57b00602.png

流程

创建pollfd数组,向其中添加关注fd信息,数组大小自定义

调用poll函数,将pollfd数组拷贝到内核空间,转链表存储,无上限

内核遍历fd,判断是否就绪

数据就绪或超时后,拷贝pollfd数组到用户空间,返回就绪fd数量

用户进程判断n是否大于0

大于0则遍历pollfd数组,找到就绪数组


与select对比

select模式中的fd_set大小固定为1024,而pollfd在内核中采用链表,理论上无上限

监听FD越多,每次遍历消耗时间也越久,性能反而会下降


IO多路复用-epoll7f80bb9e3f6341d3b09aa8fb4f47049e.png9206d0cd9a0b44d1b41beb0030a9537a.png

基于epoll实例中的红黑树保存要监听的FD,理论上无上限,而且增删改查效率都非常高,性能不会随着监听的FD数量增多而下降

每个FD只需执行一次epoll_ctl添加到红黑树,以后每次epol_wait无需传递任何参数,无需重复拷贝FD到内核空间

内核会将就绪的FD直接拷贝到用户空间的指定位置,用户进程无需遍历所有的FD就知道就绪的FD是谁


IO多路复用-事件通知机制

当FD有数据可读时,我们调用epoll_wait就可以得到通知,但是事件通知的模型有两种:

LevelTriggered:简称LT,当FD有数据可读时,会重复通知多次,直到数据处理完成

EdgeTriggered:简称ET,当FD有数据可读时,只会通知一次,不管数据是否处理完成


信号驱动IO


信号驱动IO是与内核建立SIGIO的信号关联并设置回调,当内核有FD就绪时,会发出SIGIO信号通知用户,期间用户应用可以执行其它业务,无需阻塞等待

0a77023eb35c4d8cb78e533402c4bc7a.png

当有大量IO操作时,信号较多,SIGIO处理函数不能及时处理可能导致信号队列溢出

而且内核空间与用户空间的频繁交互性能较低


异步IO


异步IO的整个过程都是非阻塞的,用户进程调用完异步API后就可以去做其它事情,内核等待数据就绪并拷贝到用户空间才会递交信号

d33e4630516745168739acdd679f13ad.png

相关文章
|
3月前
|
存储 缓存 算法
如何优化阻塞IO的性能?
【10月更文挑战第6天】如何优化阻塞IO的性能?
61 5
|
5月前
|
存储 Java 数据库连接
BIO阻塞IO流与数据存储大揭秘:性能与资源消耗,一文让你彻底解锁!
【8月更文挑战第25天】本文探讨了Java中BIO阻塞IO流与数据存储的概念及其实现。BIO作为一种传统IO模型,在处理每个客户端请求时需创建新线程并等待响应,这在并发量大时会导致性能下降和高资源消耗。示例代码展示了如何利用`ServerSocket`实现基于BIO的简单服务器。此外,文章还介绍了数据存储的基本方法,例如通过`BufferedWriter`向文件写入数据。两者对比显示,BIO适合连接数稳定的场景,而数据存储则适用于需要持久化保存信息的情况。通过这些分析和实例,希望能帮助读者更好地掌握这两种技术的应用场景及其优缺点。
57 0
|
5月前
|
C# 开发者 设计模式
WPF开发者必读:命令模式应用秘籍,轻松简化UI与业务逻辑交互,让你的代码更上一层楼!
【8月更文挑战第31天】在WPF应用开发中,命令模式是简化UI与业务逻辑交互的关键技术,通过将请求封装为对象,实现UI操作与业务逻辑分离,便于代码维护与扩展。本文介绍命令模式的概念及实现方法,包括使用`ICommand`接口、`RelayCommand`类及自定义命令等方式,并提供示例代码展示如何在项目中应用命令模式。
63 0
|
5月前
|
Ubuntu Linux
内核实验(九):添加IO驱动的阻塞读写功能
本文通过修改内核模块代码,介绍了如何在Linux内核中为IO驱动添加阻塞读写功能,使用等待队列和条件唤醒机制来实现读写操作的阻塞和非阻塞模式,并在Qemu虚拟机上进行了编译、部署和测试。
29 0
|
6月前
|
Java
什么是阻塞IO?
**阻塞IO是一种IO操作模式,使得调用线程在IO未完成时会暂停,等待操作完成。简单但可能导致线程阻塞,适用于低并发、长处理场景。Java示例中,`ServerSocket`和`Socket`展示了这种模式。服务端接收到客户端连接后读取数据,回应"Echo",每个连接需单独线程处理。高并发时可考虑非阻塞IO(NIO)或异步IO来优化。**
|
6月前
|
缓存 网络协议 算法
【Linux系统编程】深入剖析:四大IO模型机制与应用(阻塞、非阻塞、多路复用、信号驱动IO 全解读)
在Linux环境下,主要存在四种IO模型,它们分别是阻塞IO(Blocking IO)、非阻塞IO(Non-blocking IO)、IO多路复用(I/O Multiplexing)和异步IO(Asynchronous IO)。下面我将逐一介绍这些模型的定义:
305 2
|
5月前
|
存储 Java
【IO面试题 四】、介绍一下Java的序列化与反序列化
Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输,之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。
|
6月前
|
Java 大数据
解析Java中的NIO与传统IO的区别与应用
解析Java中的NIO与传统IO的区别与应用
|
4月前
|
Java 大数据 API
Java 流(Stream)、文件(File)和IO的区别
Java中的流(Stream)、文件(File)和输入/输出(I/O)是处理数据的关键概念。`File`类用于基本文件操作,如创建、删除和检查文件;流则提供了数据读写的抽象机制,适用于文件、内存和网络等多种数据源;I/O涵盖更广泛的输入输出操作,包括文件I/O、网络通信等,并支持异常处理和缓冲等功能。实际开发中,这三者常结合使用,以实现高效的数据处理。例如,`File`用于管理文件路径,`Stream`用于读写数据,I/O则处理复杂的输入输出需求。
268 12
|
5月前
|
Java 数据处理
Java IO 接口(Input)究竟隐藏着怎样的神秘用法?快来一探究竟,解锁高效编程新境界!
【8月更文挑战第22天】Java的输入输出(IO)操作至关重要,它支持从多种来源读取数据,如文件、网络等。常用输入流包括`FileInputStream`,适用于按字节读取文件;结合`BufferedInputStream`可提升读取效率。此外,通过`Socket`和相关输入流,还能实现网络数据读取。合理选用这些流能有效支持程序的数据处理需求。
60 2