前面介绍了NIO中的buffer和Channel,而我们将NIO主要的使用场景还是在网络环境中,在具体介绍之前我们需要了解下IO的模型
I/O模型需要的基础
文件描述符
Linux 的内核将所有外部设备都看做一个文件来操作,对一个文件的读写操作会调用内核提供的系统命令(api),返回一个file descriptor(fd,文件描述符)。而对一个socket的读写也会有响应的描述符,称为socket fd(socket文件描述符),描述符就是一个数字,指向内核中的一个结构体(文件路径,数据区等一些属性)。
所以说:在Linux下对文件的操作是利用文件描述符(file descriptor)来实现的。
用户空间和内核空间
为了保证用户进程不能直接操作内核(kernel),保证内核的安全,操心系统将虚拟空间划分为两部分:内核空间和用户空间
I/O运行过程
我们来看看IO在系统中的运行是怎么样的(我们以read为例)
可以发现的是:当应用程序调用read方法时,是需要等待的—>从内核空间中找数据,再将内核空间的数据拷贝到用户空间的。
这个等待是必要的过程!
下面只讲解用得最多的3个I/0模型:
阻塞I/O
非阻塞I/O
I/O多路复用
阻塞I/O
在进程(用户)空间中调用recvfrom,其系统调用直到数据包到达且被复制到应用进程的缓冲区中或者发生错误时才返回,在此期间一直等待。
非阻塞I/O
recvfrom从应用层到内核的时候,如果没有数据就直接返回一个EWOULDBLOCK错误,一般都对非阻塞I/O模型进行轮询检查这个状态,看内核是不是有数据到来。
I/O多路复用
在Linux下对文件的操作是利用文件描述符(file descriptor)来实现的。在Linux下它是这样子实现I/O复用模型的:
调用select/poll/epoll/pselect其中一个函数,传入多个文件描述符,如果有一个文件描述符就绪,则返回,否则阻塞直到超时。
当用户进程调用了select,那么整个进程会被block;
而同时,kernel会“监视”所有select负责的socket;
当任何一个socket中的数据准备好了,select就会返回;
这个时候用户进程再调用read操作,将数据从kernel拷贝到用户进程(空间)。
所以,I/O 多路复用的特点是通过一种机制一个进程能同时等待多个文件描述符,而这些文件描述符其中的任意一个进入读就绪状态,select()函数就可以返回。
select/epoll的优势并不是对于单个连接能处理得更快,而是在于能处理更多的连接。