字符编码问题之GB18030实现字节变长编码的如何解决

简介: 字符编码问题之GB18030实现字节变长编码的如何解决

问题一:既然有UTF编码,为什么还需要GB18030?


既然有UTF编码,为什么还需要GB18030?


参考回答:

UTF-8/UCS-2他们是不兼容GB2312的,如果直接升级那么就全乱码了。GB18030是为了兼容GB系列编码,当原先的GB2312(GBK)软件考虑升级到国际化Unicode时,可以直接使用GB18030进行升级。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653954


问题二:GB18030是如何实现字节变长编码的?


GB18030是如何实现字节变长编码的?


参考回答:

GB18030采用字节变长编码,单字节区兼容ASCII,双字节区兼容GBK,四字节区对齐所有Unicode码位。通过第二字节未使用到的0x30~0x39编码空间来判断是否四字节编码。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653955


问题三:GB18030的四字节编码范围是什么?GB18030的单字节和双字节编码范围分别是什么?


GB18030的四字节编码范围是什么?GB18030的单字节和双字节编码范围分别是什么?


参考回答:

GB18030的四字节编码范围是第一个字节的值从0x81到0xFE,第二个字节的值从0x30到0x39,第三个字节的值从0x81到0xFE,第四个字节的值从0x30到0x39。

GB18030的单字节编码范围是0x00到0x7F,双字节编码范围是第一个字节的值从0x81到0xFE,第二个字节的值从0x40到0xFE(不包括0x7F)。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653956


问题四:GB18030与GB2312和GBK相比,有哪些主要的改进?


GB18030与GB2312和GBK相比,有哪些主要的改进?


参考回答:

GB18030相比GB2312和GBK,主要改进在于其编码空间更大,能够支持包括所有Unicode字符集在内的更多字符,采用字节变长编码方式,既兼容了GB系列编码,也支持国际化Unicode标准。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653957


问题五:Unicode联盟是如何形成的,以及它的主要目的是什么?


Unicode联盟是如何形成的,以及它的主要目的是什么?


参考回答:

Unicode联盟是由苹果、Sun、微软等公司组成,其主要目的是讨论和制定一个囊括全世界所有字符的统一编码标准。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653958



目录
相关文章
2 字节的 UTF-8 序列的字节 2 无效 解决方法
2 字节的 UTF-8 序列的字节 2 无效 解决方法: 用记事本打开xml文件,另存为 编码 选择 UTF-8,保存替换掉之前的文件,解决问题博客内容仅代表个人观点,如发现阐述有误,麻烦指正,谢谢!
4158 0
|
3月前
字符编码问题之GB2312编码设计来避免与ASCII字符编码冲突如何解决
字符编码问题之GB2312编码设计来避免与ASCII字符编码冲突如何解决
58 0
|
3月前
|
自然语言处理
字符编码问题之UTF-16不直接采用4字节定长编码来支持所有字符如何解决
字符编码问题之UTF-16不直接采用4字节定长编码来支持所有字符如何解决
47 0
|
3月前
字符编码问题之GB2312编码扩充到包括更多汉字和生僻字的如何解决
字符编码问题之GB2312编码扩充到包括更多汉字和生僻字的如何解决
70 0
|
3月前
字符编码问题之UTF-16支持超过6w多个码点的如何解决
字符编码问题之UTF-16支持超过6w多个码点的如何解决
33 0
|
12月前
|
自然语言处理 Java 索引
Java中的Unicode字符编码与占用比特位解析
Java中的Unicode字符编码与占用比特位解析
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(5)
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(5)
138 0
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(1)
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(1)
162 0
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(4)
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(4)
146 0