字节编码学习

简介: 字节编码学习

01_字节与ASCII码表

public class Demo01 {
    public static void main(String[] args) {
        // 计算机的底层全部都是字节 ---- ----
        // 一个字节由八个位构成的
        // 每个位状态只有 0 1
        // 一个字节的所有状态 2^8状态=256个状态
        // 美国发明了计算机的字节,存储各种各样的信息,自己的文字
        // 一个字节的一半就可以了
        // 0--- ----
        // 建立了一张数字与文字的映射表
        // 0~127 97 a
        char c1 = 97;
        char c2 = 'a';
        System.out.println(c1);
        System.out.println(c2);
        // ASCII是最最基础的一张码表 0-127
    }
}

02_每个国家都有独特的码表

public class Demo02 {
    public static void main(String[] args) {
        // 计算机的底层全部都是字节 ---- ----
        // 一个字节由八个位构成的
        // 每个位状态只有 0 1
        // 一个字节的所有状态 2^8状态=256个状态
        // ASCII是最最基础的一张码表
        // 其它国家,中国、日本、韩国...
        // 码表本质都是一个数字对应一个文字
        // 至少要两个字节 256*256=65536
        // 中国 GB2312 0-127 兼容ASCII码表 97应该是a的意思  3322೺
        // 日本 JP.... 0-127 兼容ASCII码表 97应该是a的意思  3322.
        // 韩国 HG.... 0-127 兼容ASCII码表 97应该是a的意思  3322.
        // 地球上所有的码表,都必须兼容ASCII码表,这就是英文不会乱码的原因
        char c = 3322;
        System.out.println(c);
        // 乱码的原因,是解码和编码,没有采用同一张码表
    }
}

03_国际化UTF-8

public class Demo03 {
    public static void main(String[] args) {
        // 计算机的底层全部都是字节 ---- ----
        // 中国 GB2312 0-127 兼容ASCII码表 97应该是a的意思  3322?
        // 日本 JP.... 0-127 兼容ASCII码表 97应该是a的意思  3322.
        // 韩国 HG.... 0-127 兼容ASCII码表 97应该是a的意思  3322.
        // 地球上码表不兼容,国际化组织,出了一张UTF-8编码表,保罗万象
        // 1. 英文只有一个字节
        // 2. 中文有三个字节
        // 国际化组织要求每一款浏览器,必须支持UTF-8
    }
}

04_编码本和解码本不一致,乱码

相关文章
|
JavaScript 数据安全/隐私保护
41 # 编码的问题
41 # 编码的问题
64 0
2 字节的 UTF-8 序列的字节 2 无效 解决方法
2 字节的 UTF-8 序列的字节 2 无效 解决方法: 用记事本打开xml文件,另存为 编码 选择 UTF-8,保存替换掉之前的文件,解决问题博客内容仅代表个人观点,如发现阐述有误,麻烦指正,谢谢!
4161 0
|
2月前
|
存储
编码
编码。
68 7
|
3月前
|
自然语言处理
字符编码问题之UTF-16不直接采用4字节定长编码来支持所有字符如何解决
字符编码问题之UTF-16不直接采用4字节定长编码来支持所有字符如何解决
47 0
|
6月前
|
Python
Python字符串和字节使用正确的编码/解码
【5月更文挑战第6天】Python字符串和字节使用正确的编码/解码
40 2
|
存储 开发者 Python
|
开发者 Python
字符串的编码|学习笔记
快速学习字符串的编码
|
存储
基础知识 - 字符、字节区别
基础知识 - 字符、字节区别
301 0
|
机器学习/深度学习 算法 索引
关于Onehot编码的总结
关于Onehot编码的总结
611 0
关于Onehot编码的总结
|
存储 数据处理
位,字节与字
位、字节、字(bits, Bytes, words)是计算机数据存储的单位。位是最小的存储单位,每一个位存储一个1位的二进制码(0 or 1),一个字节由8位(8个二进制0 or 1 串)组成。而字通常为16、32或64个位组成。
808 0