满地坑!细数IO操作的几个坑

简介: IO是我们日常开发中经常使用到的技能,但是一不小心我们就会踩坑,今天梳理了我在工作中遇到的一些问题

前言

大家好,我是小郭,今天我们一起来回顾一下,IO是我们日常开发中经常使用到的技能,但是一不小心我们就会踩坑,今天梳理了我在工作中遇到的一些问题。

第一坑:文件读写需要确保字符编码一致

场景:我们先将编码格式为GBK的值写入 outputStream 中,然后再使用 UTF-8 的格式将他输出。

private void ByteArrayOutputStreamTest(){
    byte[] bytes;
    try (ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream()){

        byteArrayOutputStream.write("you ".getBytes());
        byteArrayOutputStream.write("see ".getBytes());
        byteArrayOutputStream.write("see 你 ".getBytes()));

        bytes = byteArrayOutputStream.toByteArray();

        System.out.println(new String(bytes, Charset.forName("GBK")));
    } catch (IOException e) {
        e.printStackTrace();
    }
}

输出结果:
在这里插入图片描述

话不多说,我们看源码,发现它是有一个默认值的,而且默认的格式为 UTF-8

public static Charset defaultCharset() {
    if (defaultCharset == null) {
        synchronized (Charset.class) {
            String csn = AccessController.doPrivileged(
                new GetPropertyAction("file.encoding"));
            Charset cs = lookup(csn);
            if (cs != null)
                defaultCharset = cs;
            else
                defaultCharset = forName("UTF-8");
        }
    }
    return defaultCharset;
}

接下来我们需要做什么?

那必须是将它们的字符编码都保持一致,再看下输出结果
在这里插入图片描述

第二坑:Files类调用readAllLines,会造成OOM

直接看源码,就知道为什么,一次将所有文件中的内容都读取出,要是文件内容过大就会撑爆内存

public static List<String> readAllLines(Path path, Charset cs) throws IOException {
    //使用BufferedReader读取文件
    try (BufferedReader reader = newBufferedReader(path, cs)) {
        //声明一个List
        List<String> result = new ArrayList<>();
        //将读出的值,塞入list
        for (;;) {
            String line = reader.readLine();
            if (line == null)
                break;
            result.add(line);
        }
        return result;
    }
}

解决方案:
可以调用limit来限制需要读出的数据

Files.lines(Paths.get("read1.txt")).limit(2000);

第三坑:使用FIles类静态方法进行文件操作注意释放文件句柄

private static void wrong() {
    //ps aux | grep CommonMistakesApplication
    //lsof -p 63937
    LongAdder longAdder = new LongAdder();
    IntStream.rangeClosed(1, 1000000).forEach(i -> {
        try {
            Files.lines(Paths.get("demo.txt")).forEach(line -> longAdder.increment());
        } catch (IOException e) {
            e.printStackTrace();
        }
    });
    log.info("total : {}", longAdder.longValue());
}

输出结果:
在这里插入图片描述

为什么会造成这个问题呢?

主要是因为lines方法返回的是stream,句柄没有释放。
利用try-with-resources来解决这个问题,在结束的时候自动去关闭句柄

第四坑:注意读写文件要考虑设置缓冲区

在进行文件操作的时候,很少时候字节是使用字节流来读写文件,主要是字节流慢。
更多时候利用缓存区,进行批量的操作,减少传输的消耗,提高速度。

//操作字节流
private static void perByteOperation() throws IOException {
    Files.deleteIfExists(Paths.get("dest.txt"));

    try (FileInputStream fileInputStream = new FileInputStream("src.txt");
         FileOutputStream fileOutputStream = new FileOutputStream("dest.txt")) {
        int i;
        while ((i = fileInputStream.read()) != -1) {
            fileOutputStream.write(i);
        }
    }
}

//添加缓冲区
private static void bufferOperationWith100Buffer() throws IOException {
    Files.deleteIfExists(Paths.get("dest.txt"));

    try (FileInputStream fileInputStream = new FileInputStream("src.txt");
         FileOutputStream fileOutputStream = new FileOutputStream("dest.txt")) {
        byte[] buffer = new byte[100];
        int len = 0;
        while ((len = fileInputStream.read(buffer)) != -1) {
            fileOutputStream.write(buffer, 0, len);
        }
    }
}
//操作缓冲字节流
private static void bufferedStreamBufferOperation() throws IOException {
    Files.deleteIfExists(Paths.get("dest.txt"));

    try (BufferedInputStream bufferedInputStream = new BufferedInputStream(new FileInputStream("src.txt"));
         BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(new FileOutputStream("dest.txt"))) {
        byte[] buffer = new byte[8192];
        int len = 0;
        while ((len = bufferedInputStream.read(buffer)) != -1) {
            bufferedOutputStream.write(buffer, 0, len);
        }
    }
}

总结

在操作IO流的时候,需要在涉及编码、内存的时候特别注意一下
在这里插入图片描述

相关文章
|
3月前
|
存储 Linux API
Linux应用开发基础知识——文件IO操作(三)
Linux应用开发基础知识——文件IO操作(三)
56 2
Linux应用开发基础知识——文件IO操作(三)
|
7月前
|
Java 测试技术 Apache
Java IO 与 NIO:高效的输入输出操作探究
输入输出(IO)是任何编程语言中的核心概念,而在Java中,IO操作更是应用程序成功运行的基石。随着计算机系统变得越来越复杂,对IO的要求也日益增加。在本文中,我们将探讨Java IO和非阻塞IO(NIO)的重要性以及如何在Java中实现高效的输入输出操作。
|
7月前
|
存储 数据处理 索引
【100天精通python】Day27:文件与IO操作_CSV文件处理
【100天精通python】Day27:文件与IO操作_CSV文件处理
32 0
|
3月前
|
大数据 程序员 Python
Python中的异步编程:使用asyncio库实现高效IO操作
传统的同步编程模式在处理IO密集型任务时效率较低,因此异步编程成为了解决这一问题的关键。本文将介绍如何利用Python中的asyncio库实现异步编程,以及如何利用异步特性提高IO操作的效率,让你的程序更加响应迅速。
|
4月前
|
Java
【JavaEE】IO 操作
【JavaEE】IO 操作
|
4月前
|
存储 缓存 Linux
Linux系统IO—探索输入输出操作的奥秘
Linux系统IO—探索输入输出操作的奥秘
|
5月前
|
JSON 数据挖掘 数据库
Pandas 高级教程——IO 操作
Pandas 高级教程——IO 操作
172 2
|
7月前
|
存储 Linux 程序员
嵌入式 Linux 文件IO操作
嵌入式 Linux 文件IO操作
|
7月前
|
Java
网络通信优化-传统IO流及如何优化IO操作
网络通信优化-传统IO流及如何优化IO操作
|
7月前
|
XML 存储 JSON
【100天精通python】Day29:文件与IO操作_XML文件处理
【100天精通python】Day29:文件与IO操作_XML文件处理
52 0