教你用不同的编码标准解码字符 | 带你学《Java语言高级特性》之六十-阿里云开发者社区

教你用不同的编码标准解码字符 | 带你学《Java语言高级特性》之六十

2020-02-26 1580

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 在Java开发过程中，有时会发现自己曾经的代码里汉字部分变成了奇形怪状的字符，这往往是由于字符的编码解码标准不统一引起的，本节将为读者介绍几种常用的编码标准。

上一篇：实战文件流，完成文件拷贝 | 带你学《Java语言高级特性》之五十九
在Java开发过程中，有时会发现自己曾经的代码里汉字部分变成了奇形怪状的字符，这往往是由于字符的编码解码标准不统一引起的，本节将为读者介绍几种常用的编码标准。

【本节目标】
通过阅读本节内容，你将了解到几种常见的编码标准与其表达能力，知道UTF-8是最常用的编码标准，并能够通过代码查看机器的属性，学会强制使用指定的编码标准对数据进行编码或解码。

字符编码

在计算机的世界里面只认0、1的数据。如果要想描述一些文字的编码就需要对这些二进制的数据进行组合，所以才有了现在可以看见的中文。但是在进行编码的时候如果要想正确显示出内容则一定需要有解码，所以编码和解码肯定要采用统一的标准。那么如果不统一的时候就会出现乱码。

那么在实际开发中，对于常用的编码有如下几种：

GBK/GB2312：国标编码，可以描述中文信息，其中GB2312只描述简体中文，而GBK包含简体中文和繁体中文；
ISO8859-1：国际通用编码，可以用其描述所有的字母信息，如果是象形文字，则需要进行编码处理；
UNICODE编码：采用十六进制的方式存储，可以描述所有文字信息；
UTF编码：象形文字部分使用十六进制编码，而普通的字母采用 ISO8859-1编码，它的优势在于适合快速的传输，节约带宽，也就成为了开发中首选的编码，主要使用“UTF-8”编码。

如果要想知道当前系统中支持的编码规则，则可以采用如下代码列出全部的本机属性。

范例：列出本机属性

public class JavaAPIDemo {
    public static void main(String[] args) throws Exception {
        System.getProperties().list(System.out);
    }
}

部分信息：
文件的路径分割符：file.separator=；
文件默认编码：file.encoding=UTF-8；

也就是说如果现在什么都不设置，则采用的编码就是UTF-8；

范例：编写程序

import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
public class JavaAPIDemo {
    public static void main(String[] args) throws Exception {
        OutputStream output=new FileOutputStream("D:" + File.separator + "mldn.txt");
        output.write("中华人民共和国万岁".getBytes());
       //   output.write("中华人民共和国万岁".getBytes("utf-8"));
        output.close();
    }
}

此时为默认的处理操作，不设置编码的时候就将采用默认的编码方式进行。

范例：强制性设置编码

import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
public class JavaApiDemo {
    public static void main(String[] args) throws Exception {
        OutputStream output=new FileOutputStream("D:" + File.separator + "mldn.txt");
        output.write("中华人民共和国万岁".getBytes("ISO8859-1"));
        output.close();      
    }
}

项目中出现的乱码问题就是编码和解码标准不统一，而最好的解决乱码的方式，就是所有的编码都采用“UTF-8”。

想学习更多的Java的课程吗？从小白到大神，从入门到精通，更多精彩不容错过！免费为您提供更多的学习资源。
本内容视频来源于阿里云大学

下一篇：运用内存操作流实现IO操作 | 带你学《Java语言高级特性》之六十一
 更多Java面向对象编程文章查看此处

教你用不同的编码标准解码字符 | 带你学《Java语言高级特性》之六十

字符编码

Java开发者

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

教你用不同的编码标准解码字符 | 带你学《Java语言高级特性》之六十

字符编码

Java开发者

热门文章

最新文章

相关课程

相关电子书