JAVA字符流读写问题:报错 -问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

JAVA字符流读写问题:报错

kun坤 2020-06-07 20:24:34 155

java中用InputStreamReader读取utf-8的文件,因为默认编码是GBK,读出来中文是乱码,但是再以默认GBK写出去,中文恢复,如果用utf-8写出去,反而乱码,是怎么回事,萌新求解。

Java
分享到
取消 提交回答
全部回答(1)
  • kun坤
    2020-06-07 20:24:38

    因为那个文件本来就是gbk编码格式的######回复 @lemondwm : 是什么文件?如果是文本文件你用txt打开看下,然后用另存为的方式保存为utf8格式的######但是用GBK拿到的是乱码呀~~~~######

    InputStreamReader reader = new InputStreamReader(new FileInputStream("\test.txt"), "GBK");

    BufferedReader bufferedReader = new BufferedReader(reader);

    String str; while ((str = bufferedReader.readLine()) != null) { System.out.println(str); }


    读取文件时指定编码试试

    ######谢谢,楼下详解懂了######

    不论什么数据,存储上(无论是磁盘,还是内存),本质上都可以看成二进制的字节数组。而字符流的字符编码,是把二进制数据和字符进行的双向映射。

    Java内部char类型整形值表示,你可以看成一个固定的字符编码(unicode,简单点可以理解成UTF16,实际还有代码点等问题,这部分建议阅读下Core Java2的相关章节)。

    UTF8编码的文件,以GBK的方式读入Java进程,可以理解为,把文件的二进制流按GBK解码为对应的字符(这时候会出现乱码),再按Java的内部编码转换为对应的char[]。输出也是把这个过程反过来。

    如果一个二进制数据,使用同一个字符编码解码,编码这两个操作是可逆的。最终,GBK读再GBK写,当然会还原回去(然后你再用外部工具按UTF8)。但要注意一个特殊情况,对于一个字符编码,并不是所有的二进制内容都是合法的,如果在解码的时候发生无法解码的情况,这时候数据可能会出现损坏丢失。

    ######谢谢,懂了( ̄∀ ̄)######

    java的编码我认为是有3种。

    1.文件编码。这里的文件只是单只文件而已。

    2.流编码。就是你的IO设置的编码。

    3.内容编码。这里是你写入的内容的编码。

    这3个编码,缺一不可,只要某一项不一致,读出来都会乱码。

    0 0
开发与运维
使用钉钉扫一扫加入圈子
+ 订阅

集结各类场景实战经验,助你开发运维畅行无忧

推荐文章
相似问题
推荐课程