面试官:字节流可以处理一切文件为什么还需要字符流呢?

简介: 【6月更文挑战第8天】面试官:字节流可以处理一切文件为什么还需要字符流呢?

一、写在开头

在计算机领域中百分之九十以上的程序拥有着和外部设备交互的功能,这就是我们常说的IO(Input/Output:输入/输出),所谓输入就是外部数据导入计算机内存中的过程,输出则是将内存或者说程序中的数据导入到外部存储中,如数据库、文件以及其他本地磁盘等。

二、什么是IO流

这种输入输出往往遵循着先入先出,顺序存取的特点,像水流一般,因此我们称这样的操作为流(Stream),如下我们根据不同的标准,将IO流分为几个门类:
image.png

根据数据流向:

  1. 输入流:数据流向程序
  2. 输出流:数据从程序流出。

根据处理单位:

  1. 字节流:一次读入或读出是8位二进制;
  2. 字符流:一次读入或读出是16位二进制
  3. JDK 中后缀是 Stream 是字节流;后缀是 Reader,Writer 是字符流。

根据功能点:

  1. 节点流:直接与数据源相连,读入或写出;
  2. 处理流:与节点流一块使用,在节点流的基础上,再套接一层。

三、输入与输出

在java.io包中多达40多个类,它们的基类来源于InputStream、OutputStream、Reader、Writer这四个,我们一一看过。

3.1 InputStream(字节输入流)

InputStream作为所有字节输入流的父类,主要作用是将外部数据读取到内存中,主要方法如下(JDK8):

  1. read():返回输入流中下一个字节的数据。返回的值介于 0 到 255 之间。如果未读取任何字节,则代码返回 -1 ,表示文件结束。
  2. read(byte b[ ]) : 从输入流中读取一些字节存储到数组 b 中。如果数组 b 的长度为零,则不读取。如果没有可用字节读取,返回 -1。如果有可用字节读取,则最多读取的字节数最多等于 b.length , 返回读取的字节数。这个方法等价于 read(b, 0, b.length)。
  3. read(byte b[], int off, int len):在read(byte b[ ]) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字节数)。
  4. skip(long n):忽略输入流中的 n 个字节 ,返回实际忽略的字节数。
  5. available():返回输入流中可以读取的字节数。
  6. close():关闭输入流释放相关的系统资源。
  7. markSupported() :该输入流是否支持mark()和reset()方法。
  8. mark(int readlimit) :标志输入流的当前位置,随后调用reset()方法将该流重新定位到最近标记的位置;参数readlimit表示:在标记位置失效前可以读取字节的最大限制。
  9. reset() :将此流重新定位到最后一次对此输入流调用 mark 方法时的位置。

image.png

我们使用FileInputStream(文件字节输入流)进行如上方法的使用测试:

public class Test {
   
   
    public static void main(String[] args) throws IOException {
   
   
        try (InputStream fis = new FileInputStream("E:\\input.txt")) {
   
   
            System.out.println("可读取字节数:"
                    + fis.available());
            int content;
            long skip = fis.skip(3);
            System.out.println("忽略字节数:" + skip);
            System.out.print("剩余全量字节:");
            while ((content = fis.read()) != -1) {
   
   
                System.out.print((char) content);
            }
        } catch (IOException e) {
   
   
            e.printStackTrace();
        }
    }
}

image.png

输出:

可读取字节数:20
忽略字节数:3
剩余全量字节:name is JavaBuild

3.2 OutputStream(字节输出流)

outputstream作为所有字节输出流的父类,主要则是将内存或者说程序中的数据以字节流的方式导入到外部存储中,如数据库、文件以及其他本地磁盘等。它的使用方法相比较字节输入流要少:

  1. write(int b):将特定字节写入输出流。
  2. write(byte b[ ]) : 将数组b 写入到输出流,等价于 write(b, 0, b.length) 。
  3. write(byte[] b, int off, int len) : 在write(byte b[ ]) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字节数)。
  4. flush():刷新此输出流并强制写出所有缓冲的输出字节。
  5. close():关闭输出流释放相关的系统资源。

image.png

我们同样以FileOutputStream为例进行上述方法的测试:

public class Test {
   
   
    public static void main(String[] args) throws IOException {
   
   
        try (FileOutputStream output = new FileOutputStream("E://output.txt")) {
   
   
            byte[] array = "JavaBuild".getBytes();
            //将一个字节数组写入本地E盘的外部文件output.txt中
            output.write(array);

            //换行方式1:Windows下的换行符为"\r\n"
            output.write("\r\n".getBytes());
            //换行方式2:推荐使用,具有良好的跨平台性
            String newLine = System.getProperty("line.separator");
            output.write(newLine.getBytes());

            //输出字节,这里的数字会被转为asicc码中对应的字符
            output.write(64);
            output.write(56);
            output.write(56);
            output.write(56);
            //关闭输出流
            output.close();
        } catch (IOException e) {
   
   
            e.printStackTrace();
        }
    }
}

效果:
image.png

这里可以直接输出单字节数据,也可以输出指定的字节数组。输出字节时以int类型输出,最终根据ASCII表转为字符。如十进制64的转为@符号。

3.3 Reader(字符输入流)

在讲解字符流之前,我们来解释一个面试问题:“为什么有了字节流了还需要使用更耗时的字符流”

确实,字节作为信息存储的最小单元,我们可以通过字节流实现所有信息的输入与输出,但有时候会存在一些问题,比如中文输入时的编码问题,将上述3.1中的测试代码稍微改一下,执行结果如下,中文在控制台输出时乱码了。当然我们可以通过设置编码来规避这个问题,但有时候不晓得编码时,乱码真的会带来潜在风险!
image.png

字符流与字节流的区别:

  • 字节流一般用来处理图像、视频、音频、PPT、Word等类型的文件。字符流一般用于处理纯文本类型的文件,如TXT文件等,但不能处理图像视频等非文本文件。
  • 字节流本身没有缓冲区,缓冲字节流相对于字节流,效率提升非常高。而字符流本身就带有缓冲区,缓冲字符流相对于效率提升不明显。

说了这么多,我们现在来看一下Reader这个字符输入流提供的主要方法吧,其实和InputStream差不多,只不过一个是以字节为单位的读取,一个是以字符为单位。

  1. read() : 从输入流读取一个字符。
  2. read(char[] cbuf) : 从输入流中读取一些字符,并将它们存储到字符数组 cbuf中,等价于 read(cbuf, 0, cbuf.length) 。
  3. read(char[] cbuf, int off, int len):在read(char[] cbuf) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  4. skip(long n):忽略输入流中的 n 个字符 ,返回实际忽略的字符数。
  5. close() : 关闭输入流并释放相关的系统资源。

image.png

我们将上述3.1中的测试代码稍作加工,采用FileReader流进行输入,打印结果:

image.png

可以看到即便有中文,输出在控制台也没有乱码,因为字符流默认采用的是 Unicode 编码。

那么字符流是如何实现txt文件读取的呢?通过FileReader类的继承关系我们可以看到它继承了InputStreamReader,这是一个字节转字符输入流,所以说从根本上,字符流底层依赖的还是字节流!

// 字节流转换为字符流的桥梁
public class InputStreamReader extends Reader {
   
   
}
// 用于读取字符文件
public class FileReader extends InputStreamReader {
   
   
}

3.4 Writer(字符输出流)

writer是将内存或者说程序中的数据以字符流的方式导入到外部存储中,如数据库、文件以及其他本地磁盘等。
常用方法也和OutputStream相似:

  1. write(int c) : 写入单个字符。
  2. write(char[] cbuf):写入字符数组 cbuf,等价于write(cbuf, 0, cbuf.length)。
  3. write(char[] cbuf, int off, int len):在write(char[] cbuf) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  4. write(String str):写入字符串,等价于 write(str, 0, str.length()) 。
  5. write(String str, int off, int len):在write(String str) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  6. append(CharSequence csq):将指定的字符序列附加到指定的 Writer 对象并返回该 Writer 对象。
  7. append(char c):将指定的字符附加到指定的 Writer 对象并返回该 Writer 对象。
  8. flush():刷新此输出流并强制写出所有缓冲的输出字符。
  9. close():关闭输出流释放相关的系统资源。

我们同样以FileWriter为例,去测试一下:

public class Test {
   
   
    public static void main(String[] args) throws IOException {
   
   
        try (FileWriter fw = new FileWriter("E:\\outwriter.txt")) {
   
   
           fw.write("大家好!!!");
           fw.append("我是JavaBuild");
        } catch (IOException e) {
   
   
            e.printStackTrace();
        }
    }
}

image.png

目录
相关文章
【面试题精讲】java字符流
【面试题精讲】java字符流
|
2月前
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
106 2
|
8月前
|
数据采集 JSON 数据挖掘
2024年利用Python查询IP地址_怎么查python文件中ip地址,2024年最新15个经典面试问题及答案英语
2024年利用Python查询IP地址_怎么查python文件中ip地址,2024年最新15个经典面试问题及答案英语
|
5月前
|
Java
【Java基础面试二】、个Java文件里可以有多个类吗(不含内部类)?
这篇文章讨论了Java文件中类的定义规则,指出一个Java文件可以包含多个类(不包含内部类),但其中最多只能有一个public类,且如果有public类,它的名称必须与文件名一致。
|
6月前
|
存储 关系型数据库 MySQL
面试题MySQL问题之FastDFS中的文件重复上传如何解决
面试题MySQL问题之FastDFS中的文件重复上传如何解决
73 1
|
8月前
|
数据采集 数据安全/隐私保护 Python
2024年最新【Python】如何用Python来操作PDF文件,收藏(2),2024年最新阿里p7Python面试题
2024年最新【Python】如何用Python来操作PDF文件,收藏(2),2024年最新阿里p7Python面试题
2024年最新【Python】如何用Python来操作PDF文件,收藏(2),2024年最新阿里p7Python面试题
|
8月前
|
开发工具 Python
2024年最新【Python】关于Python打开文件&&上下文管理器(1),2024华为Python面试真题解
2024年最新【Python】关于Python打开文件&&上下文管理器(1),2024华为Python面试真题解
2024年最新【Python】关于Python打开文件&&上下文管理器(1),2024华为Python面试真题解
|
7月前
|
存储 Java 编译器
【搞定Jvm面试】 面试官:谈谈 JVM 类文件结构的认识
【搞定Jvm面试】 面试官:谈谈 JVM 类文件结构的认识
|
8月前
|
数据安全/隐私保护 Python
Python文件与目录操作:面试中的高频考点
【4月更文挑战第15天】本文介绍了Python文件和目录操作的面试重点,包括文件的读写、目录遍历及权限管理。强调了文件关闭、异常处理、特殊文件判断以及权限位和权限字符串的理解。提供了代码示例,如读写文件、遍历目录和更改文件权限,帮助读者在面试中表现出色。掌握这些技能将对编程求职之路大有裨益。
49 0
|
存储 Java 索引
【面试题精讲】字节码文件的组成
【面试题精讲】字节码文件的组成