三、IO多路复用
非阻塞IO 虽然解决了IO阻塞的问题, 但是不断调动 read 轮询内核是否有数据的方式对CPU的消耗比较高,效率比较低, 需要有一个可以同时处理多个 网络连接IO 并且高效的方式,于是就衍生出了select/poll/epoll的方式
1.SELECT
当用户进程调用了select, 进程将会被阻塞,这个时候select 实际上可以看做对一个 fd集合 进行监听当有数据时便拷贝到 用户进程 中。这边搭配 函数 API 可以加深理解
/* nfds: 最大的文件描述符+1 readfds: 读集合 传入传出参数 writefds: 写文件描述符集合(传入传出参数) execptfds: 异常文件描述符集合(传入传出参数) timeout: NULL--永久阻塞 0 --不阻塞 立即返回 >0 --指定事件,事件发生才返回 */ int select(int nfds, fd_set * readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout); /* 将fd从set集合中清除 */ void FD_CLR(int fd, fd_set *set); /* 判断fd是否在集合中 返回值: 如果fd在set集合中, 返回1, 否则返回0 */ int FD_ISSET(int fd, fd_set *set); /* 将fd设置到set集合中 */ void FD_SET(int fd, fd_set *set); /* 初始化set集合 */ void FD_ZERO(fd_set *set);
使用 select 可以让用户进程在一个线程中同时处理多个 socket 的 IO 请求。它相对于阻塞 IO 把对于数据的读取(read) 分离成了两个系统调用 select() read(), 这样用户注册 socket 跟 数据的 IO处理 不会相互阻塞 , 达到可以处理多个连接的目的, 并且可以跨平台使用。
缺点:
1, 使用select 需要将 socket 请求 加入 select (读写)集合进行监听,这个步骤需要涉及到用户区到内核区的来回拷贝
2, select 本质是对 集合的轮询操作, 效率较低(假设 1024 个 fd 全部打开, 但是只有一个有数据,对于select来说 还是要轮询 1024 次)
3. 最大支持1024个客户端连接(由FD_SETSIZE=1024限制, 这个值可以修改, 但是需要重新编译内核)
2.POLL
poll与select类似, 区别在于把三个文件描述符的集合(readfds, writefds, exceptfds)变成一个集合 (pollfd )
/* fds: 传入传出参数, 类型是一个结构体数组 fds.fd: 要监控的文件描述符 fds.events: POLLIN---->读事件 POLLOUT---->写事件 fds.revents: 返回的事件 */ /* nfds: 数组实际有效内容的个数 timeout: 超时时间, 单位是毫秒 */ int poll(struct pollfd *fds, nfds_t nfds, int timeout);
返回值:
- 成功:返回就绪事件的个数
- 失败: 返回-1。若timeout=0, poll函数不阻塞,且没有事件发生, 此时返回-1, 并且errno=EAGAIN, 这种情况不应视为错误。
1.当 poll 函数返回时, 有没有事件(读事件 or 写事件)发生需要关注 pollfd.revents
2.pollfd.fd设置为 -1 时 poll不会监控
3.poll可以突破1024(select 最大文件描述符)的限制.在/proc/sys/fs/file-max查看一个进程可以打开的socket描述符上限,如果需要可以修改配置文件: /etc/security/limits.conf,加入如下配置信息, 然后重启终端即可生效
soft和hard分别表示ulimit命令可以修改的最小限制和最大限制
* soft nofile 1024 * hard nofile 100000
3.EPOLL
EPOLL 是对 文件描述符 的 I/O事件进行统一管理处理, epoll 把哪个 socket发生怎样的I/O事件通过 epoll_wait通知到用户进程, 用户进程也可以把 I/O事件 通过 epoll_ctl 添加到 eventpoll(管理器) 中进行处理。
eventpoll 内部维护着一个红黑树, 一个双链表, 用户进程调用 epoll_create方法时 ,内核会创建一个eventpoll结构体。用户通过 epoll_ctl 把 socket 添加,删除进内核红黑树中(红黑树的key是fd,val是事件,返回的是事件),当有相应的事件发生时,会把事件添加到双链表中。epoll_wait 会检测双链表中是否有满足条件的事件,有的话就返回。
//创建一个 eventpoll /* size: 最大节点数, 此参数在linux 2.6.8已被忽略, 但必须传递一个大于0的数,历史意义,用epoll_create1也行 返回值: 返回一个大于0的文件描述符 */ int epoll_create(int size); //将要监听的节点在epoll树上添加, 删除和修改 /* epfd: eventpoll 文件描述符 op: EPOLL_CTL_ADD: 添加事件节点到树上 EPOLL_CTL_DEL: 从树上删除事件节点 EPOLL_CTL_MOD: 修改树上对应的事件节点 fd: 事件节点对应的文件描述符 event: 要操作的事件节点, 是一个结构体 event.events常用的有: EPOLLIN: 读事件 EPOLLOUT: 写事件 EPOLLERR: 错误事件 EPOLLET: 边缘触发模式 */ int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event); //检测 eventpoll 的双链表中 有没有满足条件的事件 /* epfd: epoll树根 events: 传出参数, 其实是一个事件结构体数组 maxevents: 数组大小 timeout: -1: 表示永久阻塞; 0: 立即返回; >0: 表示超时等待事件 */ int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
epoll有两种工作模式,ET和LT模式
水平触发:LT 只要缓冲区中有数据, 就一直通知
边缘触发: ET 只会通知一次,下次有数据流入时才会再通知。在此模式下读的时候要循环读,直到读完