最近项目中遇到不少NIO相关知识,之前对这块接触得较少,算是我的一个盲区,打算花点时间学习,简单做一点个人学习总结。
简介
NIO(New IO)是JDK1.4以后推出的全新IO API,相比传统IO方式NIO采用了全新的底层I/O模型。传统IO的设计概念是面向流,而NIO则是面向块。简单点说,传统I/O是基于字节的,所有I/O都被视为单个字节的移动,使用时需先把对象转换为字节码;而NIO是面向块的,以块为单位处理数据,每个操作会生成或消费一个块的数据。从设计理念来看,NIO的操作粒度要比传统IO大很多,采用这种方式性能有很大提高,但也牺牲了java操作的优雅和简洁。
核心模块
Java NIO 由以下三个核心模块组成:
- Selector
- Channel
- Buffer
Selector
线程的花销很大,selector帮助开发者突破IO的瓶颈,它提供了单线程处理多个 Channel的机制。如果你的应用打开了多个连接(通道),但每个连接的流量都很低,使用Selector就会很方便。
这是在一个单线程中使用一个Selector处理3个Channel的图示:
要使用Selector,得先向Selector注册Channel,然后调用它的select()方法。这个方法会一直阻塞到某个注册的通道有事件就绪。一旦这个方法返回,线程就可以处理这些事件,事件的例子有如新连接进来,数据接收等。
使用Selector,先得向Selector注册Channel,然后调用它的select()方法,这个方法会一直阻塞直到某个注册的通道有事件就绪。一旦这个方法返回,线程就可以处理这些事件。
Channel
Channel是一个对象,可以通过它读取和写入数据,所有的IO在NIO中都从一个Channel 开始。Channel中的数据要么写入Buffer,要么从Buffer读取。拿 NIO 与原来的 I/O 做个比较,Channel就像是流。所有数据都通过Buffer对象来处理,NIO不会将字节直接写入通道中,相反,它是将数据写入包含一个或者多个字节的缓冲区。同样,您不会直接从通道中读取字节,而是将数据从通道读入缓冲区,再从缓冲区获取这个字节。
通道与流的不同之处在于通道是双向的,而流只是在一个方向上移动(一个流必须是 InputStream 或者 OutputStream 的子类), 而 通道可以用于读、写或者同时用于读写。因此,通道可以比流更好地反映底层操作系统的真实情况。特别是在UNIX模型中,底层操作系统通道是双向的。
常用的Channel:
- FileChannel:File
- DatagramChannel:UDP
- ScoketChannel:TCP
- ServerSocketChannel:监听TCP连接
Buffer
Buffer与Channel的关系如下图:
Buffer也是NIO的一个亮点,传统的IO操作面向数据流,意味着每次从流中读一个或多个字节,直至完成,数据没有被缓存在任何地方。NIO操作面向缓冲区,数据从Channel读取到Buffer缓冲区,随后在Buffer中处理数据。
Buffer其实就是一块缓存区,内部使用字节数组存储数据,并维护几个特殊变量,实现数据的反复利用。
目前Buffer的实现类有以下几种:
- ByteBuffer
- CharBuffer
- DoubleBuffer
- FloatBuffer
- IntBuffer
- LongBuffer
- ShortBuffer
- MappedByteBuffer
这些都是抽象类,针对各自的应用场景,下面又有很多子类,功能强大。
思考总结
一般我们在工作中遇到NIO相关的场景时,大多都有封装好的三方库,但并不是说就没必要了解其实现原理,知其然而不知其所以然用着也会心虚。
另外,学习优秀的开源项目是提升个人能力的一个有效方法,研究源码可以从以下几个点入手(个人认为):
- 架构文档 (在脑中建立框架图)
- 示例代码与单元测试(知道具体接口使用细节)
- 具体模块实现代码(数据结构 - public方法 - private方法)