开发者社区> 问答> 正文

字符集编码的发展历史中双字节的具体内容是什么呀?

已解决

字符集编码的发展历史中双字节的具体内容是什么呀?

展开
收起
去校区学技术 2022-04-01 22:32:07 587 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    双字节:

    1.当计算机传到了亚洲,256 个码位就不够用了。于是乎继续扩大二维表,单字节改双字节,16 位二进制数,65536 个码位。在不同国家和地区又出现了很多编码,大陆的 GB2312、港台的 BIG5、日本的 Shift JIS 等等

    2.注意 65536 个码位这种说法只是理想情况,由于双字节编码可以是变长的,也就是说同一个编码里面有些字符是单字节表示,有些字符是双字节表示。这样做的好处是,一方面可以兼容 ASCII,另一方面可以节省存储容量,代价就是会损失一部分码位

    3.GBK(Chinese Internal Code Specification 汉字内码扩展规范):

    (1)是GB2312 的扩展(gbk 编码能够用来同时表示繁体字和简体字),按理说都属于双字节编码,码位是一样的,根本谈不上扩展,但实际上是预留空间在起作用

    (2)比如下图为 GBK 的编码空间,GBK/1、GBK/2 是 GB2312 的区域,GBK/3、GBK/4、GBK/5 是 GBK 的区域,红色是用户自定义区域,白色可能就是由于变长编码损失的区域了

    (3)支持国际标准 ISO/IEC10646-1 和国家标准 GB13000-1 中的全部中日韩汉字。 GBK 字符集中所有中文字符和全角符号占 2 个字节,字母和半角符号占一个字节。 没有特殊的编码方式,习惯称呼 GBK 编码。一般在国内,汉字较多时使用

    2022-04-01 22:33:31
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
分析型数据库标准发展与行业观察 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载