IO 多路复用是 Linux 并发处理的一种技术,epoll 是目前常用的一种方式。
epoll 是在 2.6 内核中提出的,是之前的 select 和 poll 的增强版本。相对于 select 和 poll 来说,epoll 更加灵活,没有描述符限制。epoll 使用一个文件描述符管理多个描述符,将用户关系的文件描述符的事件存放到内核的一个事件表中,这样在用户空间和内核空间只需复制一次。
epoll 接口
epoll 操作过程需要三个接口,分别如下:
#include<sys/epoll.h> int epoll_create(int size); int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event); int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
epoll 句柄创建
int epoll_create(int size);
创建一个 epoll 的句柄,size
用来告诉内核需要监听的数目最多有多大,不过现在这个参数已经被废弃,内核会动态维护要监听事件的数目。这个参数不同于 select()
中的第一个参数(给出最大监听的 fd+1 的值)。需要注意的是,当创建好 epoll
句柄后,它会返回一个自身的描述符,因此也会占用一个 fd
值,在 Linux 下如果查看 /proc/pid/fd/
,是能够看到这个 fd 的,所以在使用完 epoll 后,必须调用 close() 关闭,否则可能导致 fd 被耗尽。
epoll 事件管理
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll 的事件注册函数,它不同与 select()
是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。第一个参数是 epoll_create()
的返回值,第二个参数表示动作,用三个宏来表示:
EPOLL_CTL_ADD
:注册新的 fd 到 epfd 中;EPOLL_CTL_MOD
:修改已经注册的 fd 的监听事件;EPOLL_CTL_DEL
:从 epfd 中删除一个 fd;
第三个参数是需要监听的 fd,第四个参数是告诉内核需要监听什么事。
struct epoll_event
表示 epoll 的事件,其结构如下:
struct epoll_event { __uint32_t events; /* Epoll events */ epoll_data_t data; /* User data variable */ };
events 可以是以下几个宏的集合:
EPOLLIN
:表示对应的文件描述符可以读(包括对端 socket 正常关闭);EPOLLOUT
:表示对应的文件描述符可以写;EPOLLPRI
:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);EPOLLERR
:表示对应的文件描述符发生错误;EPOLLHUP
:表示对应的文件描述符被挂断;EPOLLET
: 将 EPOLL 设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的。EPOLLONESHOT
:只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个 socket 的话,需要再次把这个 socket 加入到 EPOLL 队列里
epoll 等待事件发生
int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
等待事件的产生,类似于 select()
调用。参数 events
用来从内核得到事件的集合,maxevents
告之内核这个 events
有多大,这个 maxevents
的值不能大于创建 epoll_create()
时的 size
,参数timeout
是超时时间(毫秒,0 会立即返回,-1 是永久阻塞)。该函数返回需要处理的事件数目,如返回 0 表示已超时。
epoll 工作模式
epoll 对文件描述符的操作有两种模式:LT(level trigger)和ET(edge trigger)。LT 模式是默认模式,LT 模式与 ET 模式的区别如下:
- LT 模式:当
epoll_wait
检测到描述符事件发生并将此事件通知应用程序,应用程序可以不立即处理该事件。下次调用epoll_wait
时,会再次响应应用程序并通知此事件。 - ET 模式:当
epoll_wait
检测到描述符事件发生并将此事件通知应用程序,应用程序必须立即处理该事件。如果不处理,下次调用epoll_wait
时,不会再次响应应用程序并通知此事件。
ET 模式在很大程度上减少了 epoll 事件被重复触发的次数,因此效率要比 LT 模式高。epoll 工作在 ET 模式的时候,必须使用非阻塞套接口,以避免由于一个文件句柄的阻塞读/阻塞写操作把处理多个文件描述符的任务饿死。
总结与思考
总的来说,epoll 相对于 select 和 poll 更加灵活、效率更高,因为它没有描述符限制,而且采用了事件触发的机制。使用 epoll 可以在单线程下管理多个文件描述符,避免了线程和进程切换的开销,同时也能够解决 C10K 问题,提高系统的并发处理能力。
在实际应用中,需要根据具体情况选择合适的工作模式。LT 模式是默认模式,适用于处理较少的事件;而 ET 模式适用于处理大量的事件,可以减少 epoll 的调用次数和资源占用。但是,ET 模式对错误处理更为严格,需要谨慎使用。
最后需要注意,使用 epoll 后必须调用 close()
关闭,否则可能导致文件描述符被耗尽。