在之前的文章《如何不使用任何模型裸建服务器》(详情见上篇文章)中,我们最终使用了多线程来解决多客户端连接问题。Linux下,一般默认为一个线程占有8M的线程栈空间,那么如果有1024*8个连接,就需要8G的线程栈空间,显然具有高额的资源开销。那么IO多路复用模型,就是为了用单线程来实现多客户端连接的技术
Select模型
该模型的图解大致如下:
对应的核心代码如下:
Select模型存在以下缺点:
- 默认情况下,fdset只有1024个bit位,也就是说只能1024个连接。
- 每次select函数调用后,都需要检测所有文件描述符。
- 每次select函数调用时,内核都需要进行拷贝文件描述符集合。
- 参描较多,较难理解。
Poll模型
Poll模型与select模型的运行规则基本一致。
该模型的图解大致如下:
对应的核心代码如下:
Poll模型相比select模型,有以下优点:
- 将文件描述符交给结构体数组进行记录和管理,可连接数量可自定义,并且大大增加。
- 参数相对更简单易懂。
epoll模型
epoll是典型的用于高效地处理大量并发连接的模型
该模型的图解大致如下:
Epoll核心代码:
epoll模型相比select、poll模型,有以下优点:
- 支持边缘触发。当recv函数一次性无法读取全部数据的时候,可以在下次循环中继续读取数据,有效地避免粘包等问题。
- 使用红黑树管理文件描述符和对应事件。在连接数巨大的时候,epoll的红黑树数据结构可以快速地实现节点的增删改查。包括相应事件发生的时候,内核也能迅速地查找到相应的节点并且进行后续操作。
- 直接从内核获取就绪状态的文件描述符。用户无需遍历全部地文件描述符,挨个检测它们是什么状态。
- 数据结构直接建立在内核中,无需将存储文件描述符集合和监听事件的数据结构实例反复复制进入内核中。
- 没有连接数量大小的限制。