Linux系统网络编程——第十九节 多路复用(1)(概念、select、poll)

简介: 等某事件就绪。即有数据可读或者可写的时候,或者达到一定的“水位线”的时候。

概念引出

我们来思考一个问题:



什么叫IO(input output)?


读取或者写入(IO)本质就是:等+拷贝。


读:等+将数据从内核空间(缓冲区)拷贝到用户空间(缓冲区)


写:等+将数据从用户空间(缓冲区)拷贝到内核空间(缓冲区)


等是在等什么呢?


等某事件就绪。即有数据可读或者可写的时候,或者达到一定的“水位线”的时候。


而高效IO即在IO的过程当中,尽可能减少等的比重。


那我们应当怎么促使高效IO呢?


我们有五种IO模型,分别是:


1、阻塞IO;


2、非阻塞IO;


3、信号驱动IO;(发送SIGIO,默认忽略)


4、多路复用,多路转接;


5、异步IO;


前四种都称之为同步IO。


我们之前用到的IO基本都是阻塞式IO。


我们下面所要学的select、poll、epoll做的就是一件事,就是等。


既然一个文件描述符等待结束的概率很小是固定的,那我就通过等待多个文件描述符的方式来去让其去减少等的比重


将一个阻塞式的文件描述符改成一个非阻塞的:(原型如下)


fcntl


函数原型如下.

#include <unistd.h>
#include <fcntl.h>
int fcntl(int fd, int cmd, ... /* arg */ );


传入的cmd的值不同, 后面追加的参数也不相同


实现函数SetNoBlock


基于fcntl, 我们实现一个SetNoBlock函数, 将文件描述符设置为非阻塞.

void SetNoBlock(int fd) {
    int fl = fcntl(fd, F_GETFL);
    if (fl < 0) {
        perror("fcntl");
        return;
    }
    fcntl(fd, F_SETFL, fl | O_NONBLOCK);
}



使用F_GETFL将当前的文件描述符的属性取出来(这是一个位图).


然后再使用F_SETFL文件描述符设置回去. 设置回去的同时, 加上一个O_NONBLOCK参数.


select

它的作用就是来等。

image.png

附fd_set的源码:

image.png



解释说明:老规矩,采用列点式。


1、第一个参数表示我所要等的所有的文件描述符的最大值加1.(注意不是个数+1,因为我们后面要传入位图)


2、最后一个参数:为等的方式:阻塞式等、非阻塞式等,设置某一段时间来去等


3、其返回值有三种形式:大于0表示已经有文件描述符就绪了;等于0表示超时了;小于0表示出错了


4、中间三个参数:表示读/写的文件描述符集,其是用一张位图来表示的。


5、以readfds为例,其既是输入型参数,又是输出型参数。输入的时候,表示告知OS需要关心哪些文件描述符上的读事件是否就绪。(其是一张位图,比如哪一个位置置为1,就表示该位置所对应的文件描述符就需要关心;即需要关心哪些位置上的读事件)


6、然后OS将上述所要关注的文件描述符进行轮询。在输出的时候,哪个位置为1,哪个位置所对应的文件描述符的文件读(写)事件就绪。


7、select结束之后,我们需要用这个readfds去检测哪个就绪了,然后需要对其进行重新设定。


8、注意:我们这里引入一个低水位线:即缓冲区里的最小字节数。


故select的本质方式就是在等,等待就绪事件的方式


注意:对位图的操作必须要用系统调用接口。因为不同的地方位图实现的方式可能不一样


select的特点

可监控的文件描述符个数取决于sizeof(fd_set)的值. 我这边服务器上sizeof(fd_set)= 512,每bit表示一个文件描述符,则我服务器上支持的最大文件描述符是512*8=4096.


将fd加入select监控集的同时,还要再使用一个数据结构array保存放到select监控集中的fd,


一是用于再select 返回后, array作为源数据和fd_set进行FD_ISSET判断。


二是select返回后会把以前加入的但并无事件发生的fd清空,则每次开始select前都要重新从array取得fd逐一加入(FD_ZERO最先),扫描array的同时取得fd最大值maxfd,用于select的第一个参数。


备注: fd_set的大小可以调整,可能涉及到重新编译内核. 感兴趣的同学可以自己去收集相关资料.



select缺点

1、每次调用select, 都需要手动设置fd集合, 从接口使用角度来说也非常不便.


2、每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大


同时每次调用select都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大


select支持的文件描述符数量太小,为有限个


poll

就绪事件通知函数


poll主要是解决了select的两个问题:


1、poll没有上限;


2、输入输出含义让分离(采用两个变量)



timeout如果为0,表示以非阻塞方式等待,如果为-1,表示为永久阻塞方式;如果为一个常数,那就是具体常数的等待的时间。


第一个参数是一个结构体数组;


第二个参数表示该结构体数组里面的元素个数


关于该结构体:


第一个参数表示关注文件描述符。


第二个参数和第三个参数分别是用户->内核、内核->用户 关心该描述符的哪方面以及是否就绪


那么事件具体又指什么呢?

image.png


其选项和read、open的参数类似,采用的是(多标志位,直接按位或)


【poll实验】

运行截图:




一种用poll监听的伪代码

image.png


注意:

image.png

poll中监听的文件描述符数目增多时,和select函数一样, poll返回后,需要轮询pollfd来获取就绪的描述符。每次调用poll都需要把大量的pollfd结构从用户态拷贝到内核中.


同时连接的大量客户端在一时刻可能只有很少的处于就绪状态, 因此随着监视的描述符数量的增长, 其效率也会线性下降.



好啦,本节的内容就到这里啦~~


目录
打赏
0
0
0
0
2
分享
相关文章
|
1月前
|
Linux缓存管理:如何安全地清理系统缓存
在Linux系统中,内存管理至关重要。本文详细介绍了如何安全地清理系统缓存,特别是通过使用`/proc/sys/vm/drop_caches`接口。内容包括清理缓存的原因、步骤、注意事项和最佳实践,帮助你在必要时优化系统性能。
195 78
Linux系统查看操作系统版本信息、CPU信息、模块信息
在Linux系统中,常用命令可帮助用户查看操作系统版本、CPU信息和模块信息
52 23
Kali Linux系统Metasploit框架利用 HTA 文件进行渗透测试实验
本指南介绍如何利用 HTA 文件和 Metasploit 框架进行渗透测试。通过创建反向 shell、生成 HTA 文件、设置 HTTP 服务器和发送文件,最终实现对目标系统的控制。适用于教育目的,需合法授权。
73 9
Kali Linux系统Metasploit框架利用 HTA 文件进行渗透测试实验
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
107 13
linux系统ubuntu中在命令行中打开图形界面的文件夹
在Ubuntu系统中,通过命令行打开图形界面的文件夹是一个高效且实用的操作。无论是使用Nautilus、Dolphin还是Thunar,都可以根据具体桌面环境选择合适的文件管理器。通过上述命令和方法,可以简化日常工作,提高效率。同时,解决权限问题和图形界面问题也能确保操作的顺利进行。掌握这些技巧,可以使Linux操作更加便捷和灵活。
66 3
|
1月前
|
Win10系统上直接使用linux子系统教程(仅需五步!超简单,快速上手)
本文介绍了如何在Windows 10上安装并使用Linux子系统。首先,通过应用商店安装Windows Terminal和Linux系统(如Ubuntu)。接着,在控制面板中启用“适用于Linux的Windows子系统”并重启电脑。最后,在Windows Terminal中选择安装的Linux系统即可开始使用。文中还提供了注意事项和进一步配置的链接。
47 0
服务器数据恢复—LINUX系统删除/格式化的数据恢复流程
Linux操作系统是世界上流行的操作系统之一,被广泛用于服务器、个人电脑、移动设备和嵌入式系统。Linux系统下数据被误删除或者误格式化的问题非常普遍。下面北亚企安数据恢复工程师简单聊一下基于linux的文件系统(EXT2/EXT3/EXT4/Reiserfs/Xfs) 下删除或者格式化的数据恢复流程和可行性。
Java中的网络编程:Socket编程详解
Java中的网络编程:Socket编程详解
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等