字符编码问题之GBK确保与ASCII码的兼容性如何解决

简介: 字符编码问题之GBK确保与ASCII码的兼容性如何解决

问题一:GBK中的不同部分(GBK/1、GBK/2等)分别收录了什么内容?


GBK中的不同部分(GBK/1、GBK/2等)分别收录了什么内容?


参考回答:

GBK/1收录除 GB 2312 字符外的其他增补字符,GBK/2收录 GB2312 字符,GBK/3收录 CJK 字符,GBK/4收录 CJK 字符和增补字符,GBK/5为非中文字符,UDC为用户自定义字符。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653949


问题二:为什么GBK的尾字节要从40开始,而不是从00开始?


为什么GBK的尾字节要从40开始,而不是从00开始?


参考回答:

GBK的尾字节编码高位没有强制要求是1,当高位是0时跟ASCII码是冲突的,ASCII码里00-40之间大部分都是控制字符,所以排除控制字符主要是为了防止丢失高字节导致出现系统性严重后果。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653950


问题三:为什么GBK要排除FF和xx7F这两条线的编号?


为什么GBK要排除FF和xx7F这两条线的编号?


参考回答:

排除FF是为了兼容GB2312,GB2312在这个位是保留不使用的;而7F表示DEL字符就是向后删除一个字符,如果传输过程中丢失首字节,那么就会出现严重的后果,所以需要将xx7F也排除。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653951


问题四:GBK如何确保与ASCII码的兼容性?


GBK如何确保与ASCII码的兼容性?


参考回答:

GBK通过规定第一个字节大于127来表示汉字的开始,并且尾字节避免与ASCII码中的控制字符冲突(即尾字节从40开始),从而确保与ASCII码的兼容性。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653952


问题五:GB18030是如何实现对Unicode标准的兼容的?


GB18030是如何实现对Unicode标准的兼容的?


参考回答:

GB18030其实是对齐Unicode标准的,里面包括了所有Unicode字符集,也算是Unicode的一种实现(UTF)。它采用字节变长编码,单字节区兼容ASCII、双字节区兼容GBK、四字节区对齐所有Unicode码位。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653953


目录
相关文章
|
Oracle 关系型数据库 Java
解决读取Oracle数据库US7ASCII编码乱码问题
今天和第三方对接数据时,对方提供了一个视图US7ASCII编码,给代码调试带来了很大的不便。程序输出的mybatis获取的对象及new String(s.getBytes("ISO8859-1"), "GB2312")加解密后都是乱码。
1679 1
|
1月前
|
文件存储
Unicode标准与其他编码规则
Unicode标准与其他编码规则
50 6
|
2月前
|
存储 自然语言处理
字符编码问题之Unicode传统字符编码方案中的语言编码冲突如何解决
字符编码问题之Unicode传统字符编码方案中的语言编码冲突如何解决
40 1
|
2月前
字符编码问题之GB2312编码设计来避免与ASCII字符编码冲突如何解决
字符编码问题之GB2312编码设计来避免与ASCII字符编码冲突如何解决
51 0
|
2月前
|
存储
字符编码问题之计算机需要编码转换过程如何解决
字符编码问题之计算机需要编码转换过程如何解决
29 0
|
2月前
|
自然语言处理
字符编码问题之UTF-16不直接采用4字节定长编码来支持所有字符如何解决
字符编码问题之UTF-16不直接采用4字节定长编码来支持所有字符如何解决
40 0
|
2月前
字符编码问题之UTF-16支持超过6w多个码点的如何解决
字符编码问题之UTF-16支持超过6w多个码点的如何解决
33 0
|
5月前
|
存储 JavaScript Java
[字符编码] 理论篇:常见字符集与编码方式
[字符编码] 理论篇:常见字符集与编码方式
157 0
|
存储 Java 关系型数据库
【精炼易懂】字符集、编码、乱码问题、ASCII、GBK、Unicode、UTF-8详解+实例说明
【精炼易懂】字符集、编码、乱码问题、ASCII、GBK、Unicode、UTF-8详解+实例说明
5739 4
|
存储 Windows
“浅入深处“编码历史,字符串编码(ASCII, GBK, ANSI, Unicode, UTF-8编码),为什么记事本默认ANSI编码,Unicode和UTF8有什么区别
“浅入深处“编码历史,字符串编码(ASCII, GBK, ANSI, Unicode, UTF-8编码),为什么记事本默认ANSI编码,Unicode和UTF8有什么区别
128 0