满地坑!细数IO操作的几个坑

简介: IO是我们日常开发中经常使用到的技能,但是一不小心我们就会踩坑,今天梳理了我在工作中遇到的一些问题

前言

大家好,我是小郭,今天我们一起来回顾一下,IO是我们日常开发中经常使用到的技能,但是一不小心我们就会踩坑,今天梳理了我在工作中遇到的一些问题。

第一坑:文件读写需要确保字符编码一致

场景:我们先将编码格式为GBK的值写入 outputStream 中,然后再使用 UTF-8 的格式将他输出。

private void ByteArrayOutputStreamTest(){
    byte[] bytes;
    try (ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream()){

        byteArrayOutputStream.write("you ".getBytes());
        byteArrayOutputStream.write("see ".getBytes());
        byteArrayOutputStream.write("see 你 ".getBytes()));

        bytes = byteArrayOutputStream.toByteArray();

        System.out.println(new String(bytes, Charset.forName("GBK")));
    } catch (IOException e) {
        e.printStackTrace();
    }
}

输出结果:
在这里插入图片描述

话不多说,我们看源码,发现它是有一个默认值的,而且默认的格式为 UTF-8

public static Charset defaultCharset() {
    if (defaultCharset == null) {
        synchronized (Charset.class) {
            String csn = AccessController.doPrivileged(
                new GetPropertyAction("file.encoding"));
            Charset cs = lookup(csn);
            if (cs != null)
                defaultCharset = cs;
            else
                defaultCharset = forName("UTF-8");
        }
    }
    return defaultCharset;
}

接下来我们需要做什么?

那必须是将它们的字符编码都保持一致,再看下输出结果
在这里插入图片描述

第二坑:Files类调用readAllLines,会造成OOM

直接看源码,就知道为什么,一次将所有文件中的内容都读取出,要是文件内容过大就会撑爆内存

public static List<String> readAllLines(Path path, Charset cs) throws IOException {
    //使用BufferedReader读取文件
    try (BufferedReader reader = newBufferedReader(path, cs)) {
        //声明一个List
        List<String> result = new ArrayList<>();
        //将读出的值,塞入list
        for (;;) {
            String line = reader.readLine();
            if (line == null)
                break;
            result.add(line);
        }
        return result;
    }
}

解决方案:
可以调用limit来限制需要读出的数据

Files.lines(Paths.get("read1.txt")).limit(2000);

第三坑:使用FIles类静态方法进行文件操作注意释放文件句柄

private static void wrong() {
    //ps aux | grep CommonMistakesApplication
    //lsof -p 63937
    LongAdder longAdder = new LongAdder();
    IntStream.rangeClosed(1, 1000000).forEach(i -> {
        try {
            Files.lines(Paths.get("demo.txt")).forEach(line -> longAdder.increment());
        } catch (IOException e) {
            e.printStackTrace();
        }
    });
    log.info("total : {}", longAdder.longValue());
}

输出结果:
在这里插入图片描述

为什么会造成这个问题呢?

主要是因为lines方法返回的是stream,句柄没有释放。
利用try-with-resources来解决这个问题,在结束的时候自动去关闭句柄

第四坑:注意读写文件要考虑设置缓冲区

在进行文件操作的时候,很少时候字节是使用字节流来读写文件,主要是字节流慢。
更多时候利用缓存区,进行批量的操作,减少传输的消耗,提高速度。

//操作字节流
private static void perByteOperation() throws IOException {
    Files.deleteIfExists(Paths.get("dest.txt"));

    try (FileInputStream fileInputStream = new FileInputStream("src.txt");
         FileOutputStream fileOutputStream = new FileOutputStream("dest.txt")) {
        int i;
        while ((i = fileInputStream.read()) != -1) {
            fileOutputStream.write(i);
        }
    }
}

//添加缓冲区
private static void bufferOperationWith100Buffer() throws IOException {
    Files.deleteIfExists(Paths.get("dest.txt"));

    try (FileInputStream fileInputStream = new FileInputStream("src.txt");
         FileOutputStream fileOutputStream = new FileOutputStream("dest.txt")) {
        byte[] buffer = new byte[100];
        int len = 0;
        while ((len = fileInputStream.read(buffer)) != -1) {
            fileOutputStream.write(buffer, 0, len);
        }
    }
}
//操作缓冲字节流
private static void bufferedStreamBufferOperation() throws IOException {
    Files.deleteIfExists(Paths.get("dest.txt"));

    try (BufferedInputStream bufferedInputStream = new BufferedInputStream(new FileInputStream("src.txt"));
         BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(new FileOutputStream("dest.txt"))) {
        byte[] buffer = new byte[8192];
        int len = 0;
        while ((len = bufferedInputStream.read(buffer)) != -1) {
            bufferedOutputStream.write(buffer, 0, len);
        }
    }
}

总结

在操作IO流的时候,需要在涉及编码、内存的时候特别注意一下
在这里插入图片描述

相关文章
|
7月前
|
存储 Linux API
Linux应用开发基础知识——文件IO操作(三)
Linux应用开发基础知识——文件IO操作(三)
90 2
Linux应用开发基础知识——文件IO操作(三)
|
Java 测试技术 Apache
Java IO 与 NIO:高效的输入输出操作探究
输入输出(IO)是任何编程语言中的核心概念,而在Java中,IO操作更是应用程序成功运行的基石。随着计算机系统变得越来越复杂,对IO的要求也日益增加。在本文中,我们将探讨Java IO和非阻塞IO(NIO)的重要性以及如何在Java中实现高效的输入输出操作。
|
存储 数据处理 索引
【100天精通python】Day27:文件与IO操作_CSV文件处理
【100天精通python】Day27:文件与IO操作_CSV文件处理
82 0
|
7月前
|
数据采集 异构计算
LabVIEW编程LabVIEW开发高级数据采集技术 操作数字IO 例程与相关资料
LabVIEW编程LabVIEW开发高级数据采集技术 操作数字IO 例程与相关资料
103 22
|
6月前
|
缓存 NoSQL Redis
redis管道操作(节省网络IO开销)
pipeline中发送的每个command都会被server立即执行,如果执行失败,将会在此后的响应中得到信息;也就是pipeline并不是表达“所有command都一起成功”的语义,管道中前面命令失败,后面命令不会有影响,继续执行。
58 1
|
7月前
|
Java
|
7月前
|
消息中间件 关系型数据库 Kafka
实时计算 Flink版操作报错之在执行任务时遇到了一个IO错误,具体表现为无法从本地主机(localhost)下载文件,该怎么解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
7月前
|
监控 Java
Java一分钟之-NIO:非阻塞IO操作
【5月更文挑战第14天】Java的NIO(New IO)解决了传统BIO在高并发下的低效问题,通过非阻塞方式提高性能。NIO涉及复杂的选择器和缓冲区管理,易出现线程、内存和中断处理的误区。要避免这些问题,可以使用如Netty的NIO库,谨慎设计并发策略,并建立标准异常处理。示例展示了简单NIO服务器,接收连接并发送欢迎消息。理解NIO工作原理和最佳实践,有助于构建高效网络应用。
97 2
|
7月前
|
存储 Go 数据处理
Golang简单实现IO操作
Golang简单实现IO操作
62 1
|
7月前
|
存储 Java 编译器
Java文件IO操作基础
Java文件IO操作基础
59 0