字符编码问题之GB2312编码设计来避免与ASCII字符编码冲突如何解决

简介: 字符编码问题之GB2312编码设计来避免与ASCII字符编码冲突如何解决

问题一:ASCII编码中哪些字符是不可见的控制字符?ASCII编码和EBCDIC编码有何主要区别?


ASCII编码中哪些字符是不可见的控制字符?ASCII编码和EBCDIC编码有何主要区别?


参考回答:

ASCII编码中前32个字符(0~31)是不可见的控制字符。

ASCII编码和EBCDIC编码的主要区别在于字符编号的连续性以及ASCII编码只使用了字节的低7位,最高位永远是0,这使得其他编码规范能够对ASCII码无缝兼容。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653939


问题二:ISO-8859-1(Latin-1)字符集扩展了ASCII编码的哪部分?


ISO-8859-1(Latin-1)字符集扩展了ASCII编码的哪部分?


参考回答:

ISO-8859-1(Latin-1)字符集扩展了ASCII编码后的128个字符,仍然属于单字节编码。ISO-8859系列字符集在最高位是0的时候仍然表示原先的ASCII字符不变,当最高位是1的时候表示扩展的欧洲字符。

image.png


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653940


问题三:ISO-8859系列字符集有哪些变种,并请列举其中几个?


ISO-8859系列字符集有哪些变种,并请列举其中几个?ISO-8859-2(Latin-2)字符集主要收集了哪些地区的字符?


参考回答:

ISO-8859系列字符集有ISO-8859-2/3/.../16等多个变种,例如ISO8859-1(Latin-1)、ISO8859-2(Latin-2)、ISO8859-3(Latin-3)等。ISO-8859-2(Latin-2)字符集主要收集了东欧字符。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653941


问题四:GB2312编码是如何设计来避免与ASCII字符编码冲突的?


GB2312编码是如何设计来避免与ASCII字符编码冲突的?


参考回答:

GB2312编码规定表示一个汉字的编码字节其值必须大于127(即字节的最高位为 1 ),并且必须是两个大于 127 的字节连在一起来共同表示一个汉字,所以GB2312 是对 ASCII 的中文扩展。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653942


问题五:GB2312编码中英文字符和中文字符分别占用多少个字节?


GB2312编码中英文字符和中文字符分别占用多少个字节?


参考回答:

按照 GB 系列编码方案,在一段文本中,如果一个字节是 0~127,那么这个字节的含义与 ASCII 编码相同,即英文字符占一个字节;否则,这个字节和下一个字节共同组成汉字(或是 GB 编码定义的其他字符),即中文字符占两个字节。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653943




目录
相关文章
|
存储 数据库
编码集的作用是什么?常见的编码集有什么?为什么常用utf-8?
编码集的作用是什么?常见的编码集有什么?为什么常用utf-8?
92 0
|
3月前
|
存储 自然语言处理
字符编码问题之Unicode传统字符编码方案中的语言编码冲突如何解决
字符编码问题之Unicode传统字符编码方案中的语言编码冲突如何解决
48 1
|
3月前
|
自然语言处理 Unix Linux
字符编码问题之UTF-16和UCS-2的关系如何解决
字符编码问题之UTF-16和UCS-2的关系如何解决
72 1
|
3月前
字符编码问题之GBK确保与ASCII码的兼容性如何解决
字符编码问题之GBK确保与ASCII码的兼容性如何解决
42 0
|
3月前
|
自然语言处理
字符编码问题之UTF-16不直接采用4字节定长编码来支持所有字符如何解决
字符编码问题之UTF-16不直接采用4字节定长编码来支持所有字符如何解决
47 0
|
3月前
字符编码问题之GB2312编码扩充到包括更多汉字和生僻字的如何解决
字符编码问题之GB2312编码扩充到包括更多汉字和生僻字的如何解决
70 0
|
3月前
字符编码问题之GB18030实现字节变长编码的如何解决
字符编码问题之GB18030实现字节变长编码的如何解决
37 0
|
6月前
|
存储 JavaScript Java
[字符编码] 理论篇:常见字符集与编码方式
[字符编码] 理论篇:常见字符集与编码方式
168 0
|
存储 Java 关系型数据库
【精炼易懂】字符集、编码、乱码问题、ASCII、GBK、Unicode、UTF-8详解+实例说明
【精炼易懂】字符集、编码、乱码问题、ASCII、GBK、Unicode、UTF-8详解+实例说明
5888 4
|
存储 Windows
“浅入深处“编码历史,字符串编码(ASCII, GBK, ANSI, Unicode, UTF-8编码),为什么记事本默认ANSI编码,Unicode和UTF8有什么区别
“浅入深处“编码历史,字符串编码(ASCII, GBK, ANSI, Unicode, UTF-8编码),为什么记事本默认ANSI编码,Unicode和UTF8有什么区别
141 0