字符编码问题之GB2312编码扩充到包括更多汉字和生僻字的如何解决

简介: 字符编码问题之GB2312编码扩充到包括更多汉字和生僻字的如何解决

问题一:什么是区位码,它在GB2312编码中有什么作用?


什么是区位码,它在GB2312编码中有什么作用?


参考回答:

区位码是GB2312字符集编号空间的一个94*94的二维表,行表示区(高位字节),列表示位(低位字节),每区有94个位,每个区位对应一个字符。区位码加上特定的数值可以转换为国标码或机内码。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653944


问题二:国标码是如何从区位码转换而来的?什么是机内码,它与国标码有何不同?


国标码是如何从区位码转换而来的?什么是机内码,它与国标码有何不同?


参考回答:

区位码加2020H(即区码和位码分别 + 32 或 + 20H)就得到国标码。

机内码是微软为了解决ASCII码与国标码冲突问题而设计的。国标码加8080H(即区码和位码分别 + 128 或 + 80H)就得到机内码。机内码与ASCII码不再冲突,可以兼容早期的ASCII编码文本。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653945


问题三:在GB2312编码中,哪些区域被用于表示特殊符号、数字和英文字符?


在GB2312编码中,哪些区域被用于表示特殊符号、数字和英文字符?


参考回答:

在GB2312编码中,01~09区(682个)被用于表示特殊符号、数字、英文字符、制表符等,包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母等在内的682个全角字符。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653946


问题四:GB2312编码是如何扩充到包括更多汉字和生僻字的?

GB2312编码是如何扩充到包括更多汉字和生僻字的?


参考回答:

为了扩充更多的字符包括一些生僻字,我们国家有关部门设计了GBK、GB18030、GB13000等编码标准,这些标准都是基于GB2312进行扩展的。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653947


问题五:GBK是什么,它与GB2312有何关系?GBK编码是如何扩展GB2312的?


GBK是什么,它与GB2312有何关系?GBK编码是如何扩展GB2312的?


参考回答:

GBK即“国标扩展”的意思,它对GB2312进行了扩展,对GB2312的字符不重新编码直接沿用,因此完全兼容GB2312。GBK虽然也是双字节编码,但是只要求第一个字节大于 127 就固定表示这是一个汉字的开始,这使得GBK的编码空间比GB2312大很多。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653948

目录
相关文章
|
3月前
字符编码问题之GB2312编码设计来避免与ASCII字符编码冲突如何解决
字符编码问题之GB2312编码设计来避免与ASCII字符编码冲突如何解决
58 0
|
3月前
|
自然语言处理
字符编码问题之UTF-16不直接采用4字节定长编码来支持所有字符如何解决
字符编码问题之UTF-16不直接采用4字节定长编码来支持所有字符如何解决
47 0
|
3月前
字符编码问题之GB18030实现字节变长编码的如何解决
字符编码问题之GB18030实现字节变长编码的如何解决
37 0
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(6)
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(6)
167 0
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(4)
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(4)
146 0
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(3)
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(3)
137 0
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(5)
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(5)
138 0
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(1)
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(1)
162 0
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(2)
带你读《全景揭秘字符编码》之九:九、常见字符编码3:GB系列(2)
154 0
带你读《全景揭秘字符编码》之七:七、常见字符编码1:ASCII
带你读《全景揭秘字符编码》之七:七、常见字符编码1:ASCII
167 0