问题一:GBK中的不同部分(GBK/1、GBK/2等)分别收录了什么内容?
GBK中的不同部分(GBK/1、GBK/2等)分别收录了什么内容?
参考回答:
GBK/1收录除 GB 2312 字符外的其他增补字符,GBK/2收录 GB2312 字符,GBK/3收录 CJK 字符,GBK/4收录 CJK 字符和增补字符,GBK/5为非中文字符,UDC为用户自定义字符。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653949
问题二:为什么GBK的尾字节要从40开始,而不是从00开始?
为什么GBK的尾字节要从40开始,而不是从00开始?
参考回答:
GBK的尾字节编码高位没有强制要求是1,当高位是0时跟ASCII码是冲突的,ASCII码里00-40之间大部分都是控制字符,所以排除控制字符主要是为了防止丢失高字节导致出现系统性严重后果。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653950
问题三:为什么GBK要排除FF和xx7F这两条线的编号?
为什么GBK要排除FF和xx7F这两条线的编号?
参考回答:
排除FF是为了兼容GB2312,GB2312在这个位是保留不使用的;而7F表示DEL字符就是向后删除一个字符,如果传输过程中丢失首字节,那么就会出现严重的后果,所以需要将xx7F也排除。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653951
问题四:GBK如何确保与ASCII码的兼容性?
GBK如何确保与ASCII码的兼容性?
参考回答:
GBK通过规定第一个字节大于127来表示汉字的开始,并且尾字节避免与ASCII码中的控制字符冲突(即尾字节从40开始),从而确保与ASCII码的兼容性。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653952
问题五:GB18030是如何实现对Unicode标准的兼容的?
GB18030是如何实现对Unicode标准的兼容的?
参考回答:
GB18030其实是对齐Unicode标准的,里面包括了所有Unicode字符集,也算是Unicode的一种实现(UTF)。它采用字节变长编码,单字节区兼容ASCII、双字节区兼容GBK、四字节区对齐所有Unicode码位。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/653953