为什么一个还没毕业的大学生能够把 IO 讲的这么好?(二)

简介: Java IO 是一个庞大的知识体系,很多人学着学着就会学懵了,包括我在内也是如此,所以本文将会从 Java 的 BIO 开始,一步一步深入学习,引出 JDK1.4 之后出现的 NIO 技术,对比 NIO 与 BIO 的区别,然后对 NIO 中重要的三个组成部分进行讲解(缓冲区、通道、选择器),最后实现一个简易的客户端与服务器通信功能。

9.png



(1)ByteArrayInputStream


ByteArrayInputStream 内部包含一个 buf 字节数组缓冲区,该缓冲区可以从流中读取的字节数,使用 pos 指针指向读取下一个字节的下标位置,内部还维护了一个count 属性,代表能够读取 count 个字节。

10.gifbytearrayinputstream

必须保证 pos 严格小于 count,而 count 严格小于 buf.length 时,才能够从缓冲区中读取数据


(2)FileInputStream


文件输入流,从文件中读入字节,通常对文件的拷贝、移动等操作,可以使用该输入流把文件的字节读入内存中,然后再利用输出流输出到指定的位置上。


(3)PipedInputStream


管道输入流,它与 PipedOutputStream 成对出现,可以实现多线程中的管道通信。PipedOutputStream 中指定与特定的 PipedInputStream 连接,PipedInputStream 也需要指定特定的 PipedOutputStream 连接,之后输出流不断地往输入流的 buffer 缓冲区写数据,而输入流可以从缓冲区中读取数据。


(4)ObjectInputStream


对象输入流,用于对象的反序列化,将读入的字节数据反序列化为一个对象,实现对象的持久化存储。


(5)PushBackInputStream


它是 FilterInputStream 的子类,是一个处理流,它内部维护了一个缓冲数组buf

  • 在读入字节的过程中可以将读取到的字节数据回退给缓冲区中保存,下次可以再次从缓冲区中读出该字节数据。所以PushBackInputStream 允许多次读取输入流的字节数据,只要将读到的字节放回缓冲区即可。

11.png

12.png

13.png

14.png

15.png

16.png

17.png


需要注意的是如果回推字节时,如果缓冲区已满,会抛出 IOException 异常。

它的应用场景:对数据进行分类规整

假如一个文件中存储了数字字母两种类型的数据,我们需要将它们交给两种线程各自去收集自己负责的数据,如果采用传统的做法,把所有的数据全部读入内存中,再将数据进行分离,面对大文件的情况下,例如1G、2G,传统的输入流在读入数组后,由于没有缓冲区,只能对数据进行抛弃,这样每个线程都要读一遍文件

使用 PushBackInputStream 可以让一个专门的线程读取文件,唤醒不同的线程读取字符:

  • 第一次读取缓冲区的数据,判断该数据由哪些线程读取
  • 回退数据,唤醒对应的线程读取数据
  • 重复前两步
  • 关闭输入流

到这里,你是否会想到 AQSCondition 等待队列,多个线程可以在不同的条件上等待被唤醒。


(6)BufferedInputStream


缓冲流,它是一种处理流,对节点流进行封装并增强,其内部拥有一个 buffer 缓冲区,用于缓存所有读入的字节,当缓冲区满时,才会将所有字节发送给客户端读取,而不是每次都只发送一部分数据,提高了效率。


(7)DataInputStream


数据输入流,它同样是一种处理流,对节点流进行封装后,能够在内部对读入的字节转换为对应的 Java 基本数据类型。


(8)SequenceInputStream


将两个或多个输入流看作是一个输入流依次读取,该类的存在与否并不影响整个 IO 生态,在程序中也能够做到这种效果


(9)StringBufferInputStream


将字符串中每个字符的低 8 位转换为字节读入到字节数组中,目前已过期


InputStream 总结:

  • InputStream 是所有输入字节流的抽象基类
  • ByteArrayInputStream 和 FileInputStream 是两种基本的节点流,他们分别从字节数组本地文件中读取数据
  • DataInputStream、BufferedInputStream 和 PushBackInputStream 都是处理流,对基本的节点流进行封装并增强
  • PipiedInputStream 用于多线程通信,可以与其它线程公用一个管道,读取管道中的数据。
  • ObjectInputStream 用于对象的反序列化,将对象的字节数据读入内存中,通过该流对象可以将字节数据转换成对应的对象


OutputStream


OutputStream 是字节输出流的抽象基类,提供了通用的写方法,让继承的子类重写和复用。

方法 功能
public abstract void write(int b) 将指定的字节写出到输出流,写入的字节是参数 b 的低 8 位
public void write(byte b[]) 将指定字节数组中的所有字节写入到输出流当中
public void write(byte b[], int off, int len) 指定写入的起始位置 offer,字节数为 len 的字节数组写入到输出流当中
public void flush() 刷新此输出流,并强制写出所有缓冲的输出字节到指定位置,每次写完都要调用
public void close() 关闭此输出流并释放与此流关联的所有系统资源

18.png

OutputStream 中大多数的类和 InputStream 是对应的,只不过数据的流向不同而已。从上面的图可以看出:

  • OutputStream 是所有输出字节流的抽象基类
  • ByteArrayOutputStream 和 FileOutputStream 是两种基本的节点流,它们分别向字节数组本地文件写出数据
  • DataOutputStream、BufferedOutputStream 是处理流,前者可以将字节数据转换成基本数据类型写出到文件中;后者是缓冲字节数组,只有在缓冲区满时,才会将所有的字节写出到目的地,减少了 IO 次数
  • PipedOutputStream 用于多线程通信,可以和其它线程共用一个管道,向管道中写入数据
  • ObjectOutputStream 用于对象的序列化,将对象转换成字节数组后,将所有的字节都写入到指定位置中
  • PrintStream 在 OutputStream 基础之上提供了增强的功能,即可以方便地输出各种类型的数据(而不仅限于byte型)的格式化表示形式,且 PrintStream 的方法从不抛出 IOEception,其原理是写出时将各个数据类型的数据统一转换为 String 类型,我会在讲解完


字符流对象


字符流对象也会有对应关系,大多数的类可以认为是操作的数据从字节数组变为字符,类的功能和字节流对象是相似的。

字符输入流和字节输入流的组成非常相似,字符输入流是对字节输入流的一层转换,所有文件的存储都是字节的存储,在磁盘上保留的不是文件的字符,而是先把字符编码成字节,再保存到文件中。在读取文件时,读入的也是一个一个字节组成的字节序列,而 Java 虚拟机通过将字节序列,按照2个字节为单位转换为 Unicode 字符,实现字节到字符的映射。

19.png


Reader


Reader 是字符输入流的抽象基类,它内部的重要方法如下所示。

重要方法 方法功能
public int read(java.nio.CharBuffer target) 将读入的字符存入指定的字符缓冲区中
public int read() 读取一个字符
public int read(char cbuf[]) 读入字符放入整个字符数组中
abstract public int read(char cbuf[], int off, int len) 将字符读入字符数组中的指定范围中

还有其它一些额外的方法,与字节输入流基类提供的方法是相同的,只是作用的对象不再是字节,而是字符。

20.png

  • Reader 是所有字符输入流的抽象基类
  • CharArrayReader 和 StringReader 是两种基本的节点流,它们分别从读取 字符数组字符串 数据,StringReader 内部是一个 String 变量值,通过遍历该变量的字符,实现读取字符串,本质上也是在读取字符数组
  • PipedReader 用于多线程中的通信,从共用地管道中读取字符数据
  • BufferedReader 是字符输入缓冲流,将读入的数据放入字符缓冲区中,实现高效地读取字符
  • InputStreamReader 是一种转换流,可以实现从字节流转换为字符流,将字节数据转换为字符


Writer


Reader 是字符输出流的抽象基类,它内部的重要方法如下所示。

重要方法 方法功能
public void write(char cbuf[]) 将 cbuf 字符数组写出到输出流
abstract public void write(char cbuf[], int off, int len) 将指定范围的 cbuf 字符数组写出到输出流
public void write(String str) 将字符串 str 写出到输出流,str 内部也是字符数组
public void write(String str, int off, int len) 将字符串 str 的某一部分写出到输出流
abstract public void flush() 刷新,如果数据保存在缓冲区,调用该方法才会真正写出到指定位置
abstract public void close() 关闭流对象,每次 IO 执行完毕后都需要关闭流对象,释放系统资源

21.png

  • Writer 是所有的输出字符流的抽象基类
  • CharArrayWriter、StringWriter 是两种基本的节点流,它们分别向Char 数组、字符串中写入数据。StringWriter 内部保存了 StringBuffer 对象,可以实现字符串的动态增长
  • PipedWriter 可以向共用的管道中写入字符数据,给其它线程读取。
  • BufferedWriter缓冲输出流,可以将写出的数据缓存起来,缓冲区满时再调用 flush() 写出数据,减少 IO 次数
  • PrintWriter 和 PrintStream 类似,功能和使用也非常相似,只是写出的数据是字符而不是字节
  • OutputStreamWriter字符流转换为字节流,将字符写出到指定位置


字节流与字符流的转换


从任何地方把数据读入到内存都是先以字节流形式读取,即使是使用字符流去读取数据,依然成立,因为数据永远是以字节的形式存在于互联网和硬件设备中,字符流是通过字符集的映射,才能够将字节转换为字符。

所以 Java 提供了两种转换流:

  • InputStreamReader:从字节流转换为字符流,将字节数据转换为字符数据读入到内存
  • OutputStreamWriter:从字符流转换为字节流,将字符数据转换为字节数据写出到指定位置

了解了 Java 传统的 BIO 中字符流和字节流的主要成员之后,至少要掌握以下两个关键点:

(1)传统的 BIO 是以为基本单位处理数据的,想象成水流,一点点地传输字节数据,IO 流传输的过程永远是以字节形式传输。

(2)字节流和字符流的区别在于操作的数据单位不相同,字符流是通过将字节数据通过字符集映射成对应的字符,字符流本质上也是字节流。

接下来我们再继续学习 NIO 知识,NIO 是当下非常火热的一种 IO 工作方式,它能够解决传统 BIO 的痛点:阻塞

  • BIO 如果遇到 IO 阻塞时,线程将会被挂起,直到 IO 完成后才唤醒线程,线程切换带来了额外的开销。
  • BIO 中每个 IO 都需要有对应的一个线程去专门处理该次 IO 请求,会让服务器的压力迅速提高。

我们希望做到的是当线程等待 IO 完成时能够去完成其它事情,当 IO 完成时线程可以回来继续处理 IO 相关操作,不必干干的坐等 IO 完成。在 IO 处理的过程中,能够有一个专门的线程负责监听这些 IO 操作,通知服务器该如何操作。所以,我们聊到 IO,不得不去接触 NIO 这一块硬骨头。


新潮的 NIO


我们来看看 BIO 和 NIO 的区别,BIO 是面向流的 IO,它建立的通道都是单向的,所以输入和输出流的通道不相同,必须建立2个通道,通道内的都是传输==0101001···==的字节数据。

22.jpg

而在 NIO 中,不再是面向流的 IO 了,而是面向缓冲区,它会建立一个通道(Channel),该通道我们可以理解为铁路,该铁路上可以运输各种货物,而通道上会有一个缓冲区(Buffer)用于存储真正的数据,缓冲区我们可以理解为一辆火车

通道(铁路)只是作为运输数据的一个连接资源,而真正存储数据的是缓冲区(火车)。即通道负责传输,缓冲区负责存储。

23.png

理解了上面的图之后,BIO 和 NIO 的主要区别就可以用下面这个表格简单概括。

BIO NIO
面向流(Stream) 面向缓冲区(Buffer)
单向通道 双向通道
阻塞 IO 非阻塞 IO

选择器(Selectors)


缓冲区(Buffer


缓冲区是存储数据的区域,在 Java 中,缓冲区就是数组,为了可以操作不同数据类型的数据,Java 提供了许多不同类型的缓冲区,除了布尔类型以外,其它基本数据类型都有对应的缓冲区数组对象。

24.png

为什么没有布尔类型的缓冲区呢?

在 Java 中,boolean 类型数据只占用 1 bit,而在 IO 传输过程中,都是以字节为单位进行传输的,所以 boolean 的 1 bit 完全可以使用 byte 类型的某一位,或者 int 类型的某一位来表示,没有必要为了这 1 bit 而专门提供多一个缓冲区。

缓冲区 解释
ByteBuffer 存储字节数据的缓冲区
CharBuffer 存储字符数据的缓冲区
ShortBuffer 存储短整型数据的缓冲区
IntBuffer 存储整型数据的缓冲区
LongBuffer 存储长整型数据的缓冲区
FloatBuffer 存储单精度浮点型数据的缓冲区
DoubleBuffer 存储双精度浮点型数据的缓冲区

分配一个缓冲区的方式都高度一致:使用allocate(int capacity)方法。

例如需要分配一个 1024 大小的字节数组,代码就是下面这样子。

ByteBuffer byteBuffer = ByteBuffer.allocate(1024);

缓冲区读写数据的两个核心方法:

  • put():将数据写入到缓冲区中
  • get():从缓冲区中读取数据

缓冲区的重要属性:

  • capacity:缓冲区中最大存储数据的容量,一旦声明则无法改变
  • limit:表示缓冲区中可以操作数据的大小,limit 之后的数据无法进行读写。必须满足 limit <= capacity
  • position:当前缓冲区中正在操作数据的下标位置,必须满足 position <= limit
  • mark:标记位置,调用 reset() 将 position 位置调整到 mark 属性指向的下标位置,实现多次读取数据

缓冲区为高效读写数据而提供的其它辅助方法

  • flip():可以实现读写模式的切换,我们可以看看里面的源码
public final Buffer flip() {

limit = position;
position = 0;
mark = -1;
return this;
}

调用 flip() 会将可操作的大小 limit 设置为当前写的位置,操作数据的起始位置 position 设置为 0,即从头开始读取数据

  • rewind():可以将 position 位置设置为 0,再次读取缓冲区中的数据
  • clear():清空整个缓冲区,它会将 position 设置为 0,limit 设置为 capacity,可以写整个缓冲区

更多的方法可以去查阅 API 文档,本文碍于篇幅原因就不贴出其它方法了,主要是要理解缓冲区的作用

            </div>
目录
相关文章
|
存储 网络协议 安全
为什么一个还没毕业的大学生能够把 IO 讲的这么好?(三)
为什么一个还没毕业的大学生能够把 IO 讲的这么好?(三)
96 0
为什么一个还没毕业的大学生能够把 IO 讲的这么好?(三)
|
存储 NoSQL Java
为什么一个还没毕业的大学生能够把 IO 讲的这么好?(一)
Java IO 是一个庞大的知识体系,很多人学着学着就会学懵了,包括我在内也是如此,所以本文将会从 Java 的 BIO 开始,一步一步深入学习,引出 JDK1.4 之后出现的 NIO 技术,对比 NIO 与 BIO 的区别,然后对 NIO 中重要的三个组成部分进行讲解(缓冲区、通道、选择器),最后实现一个简易的客户端与服务器通信功能。
121 0
为什么一个还没毕业的大学生能够把 IO 讲的这么好?(一)
|
存储 缓存 Java
为什么一个还没毕业的大学生能够把 IO 讲的这么好?(二)
Java IO 是一个庞大的知识体系,很多人学着学着就会学懵了,包括我在内也是如此,所以本文将会从 Java 的 BIO 开始,一步一步深入学习,引出 JDK1.4 之后出现的 NIO 技术,对比 NIO 与 BIO 的区别,然后对 NIO 中重要的三个组成部分进行讲解(缓冲区、通道、选择器),最后实现一个简易的客户端与服务器通信功能。
为什么一个还没毕业的大学生能够把 IO 讲的这么好?(二)
|
存储 NoSQL Java
为什么一个还没毕业的大学生能够把 IO 讲的这么好?(一)
Java IO 是一个庞大的知识体系,很多人学着学着就会学懵了,包括我在内也是如此,所以本文将会从 Java 的 BIO 开始,一步一步深入学习,引出 JDK1.4 之后出现的 NIO 技术,对比 NIO 与 BIO 的区别,然后对 NIO 中重要的三个组成部分进行讲解(缓冲区、通道、选择器),最后实现一个简易的客户端与服务器通信功能。
为什么一个还没毕业的大学生能够把 IO 讲的这么好?(一)
|
存储 网络协议 安全
为什么一个还没毕业的大学生能够把 IO 讲的这么好?(三)
Java IO 是一个庞大的知识体系,很多人学着学着就会学懵了,包括我在内也是如此,所以本文将会从 Java 的 BIO 开始,一步一步深入学习,引出 JDK1.4 之后出现的 NIO 技术,对比 NIO 与 BIO 的区别,然后对 NIO 中重要的三个组成部分进行讲解(缓冲区、通道、选择器),最后实现一个简易的客户端与服务器通信功能。
为什么一个还没毕业的大学生能够把 IO 讲的这么好?(三)
|
5月前
|
存储 Java
【IO面试题 四】、介绍一下Java的序列化与反序列化
Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输,之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。
|
6月前
|
Java 大数据
解析Java中的NIO与传统IO的区别与应用
解析Java中的NIO与传统IO的区别与应用
|
4月前
|
Java 大数据 API
Java 流(Stream)、文件(File)和IO的区别
Java中的流(Stream)、文件(File)和输入/输出(I/O)是处理数据的关键概念。`File`类用于基本文件操作,如创建、删除和检查文件;流则提供了数据读写的抽象机制,适用于文件、内存和网络等多种数据源;I/O涵盖更广泛的输入输出操作,包括文件I/O、网络通信等,并支持异常处理和缓冲等功能。实际开发中,这三者常结合使用,以实现高效的数据处理。例如,`File`用于管理文件路径,`Stream`用于读写数据,I/O则处理复杂的输入输出需求。
266 12
|
5月前
|
Java 数据处理
Java IO 接口(Input)究竟隐藏着怎样的神秘用法?快来一探究竟,解锁高效编程新境界!
【8月更文挑战第22天】Java的输入输出(IO)操作至关重要,它支持从多种来源读取数据,如文件、网络等。常用输入流包括`FileInputStream`,适用于按字节读取文件;结合`BufferedInputStream`可提升读取效率。此外,通过`Socket`和相关输入流,还能实现网络数据读取。合理选用这些流能有效支持程序的数据处理需求。
60 2
|
5月前
|
XML 存储 JSON
【IO面试题 六】、 除了Java自带的序列化之外,你还了解哪些序列化工具?
除了Java自带的序列化,常见的序列化工具还包括JSON(如jackson、gson、fastjson)、Protobuf、Thrift和Avro,各具特点,适用于不同的应用场景和性能需求。