带你读《全景揭秘字符编码》之五:五、字符编码的历史(3)

简介: 带你读《全景揭秘字符编码》之五:五、字符编码的历史(3)

带你读《全景揭秘字符编码》之五:五、字符编码的历史(2) https://developer.aliyun.com/article/1240939?groupCode=tech_library


5.3、百花齐放



统一ASCII 码标准对于英语国家很开心,但是ASCII编码只考虑了英文字母,后来计算机传到欧洲地区,法国人需要加个字母符号(如:é),德国人又需要加几个字母(Ä ä、Ö ö、ü ü、ß),幸好ASCII只用了前127个编号,于是欧洲人就将ASCII没用完的编码(128-255)为自己特有的符号编码,也能很好的一起玩耍。


但是等传到我们中国后,做为博大精深的汉语言就彻底蒙圈了,我们有几万个汉字,255个编号完全不够用啊,所以有了后来的多字节编码… 因此,各个国家都推出了本国语言的编码表,也就有了后来的 ISO 8859 系列、GB系列(GB2312、GBK、GB18030、GB13000)、Big5、EUC-KR、JIS … ,不过为了能在计算机系统中通用,这些扩展的编码均直接或间接兼容 ASCII 码。


而微软/IBM这些国际化产商为了把自己的产品卖到全世界,就需要支持各个国家的语言,要在不同的地方采用当地的编码方式,于是他们就把全世界的编码方式都集中到一起并编上号,并且起了个名字叫代码页(Codepage,又称内码表),所以我们有时候也会看到xx代码页来指代某种字符编码,比如在微软系统里 中文GBK编码对应的是936代码页,繁体中文 Big5编码对应的是950代码页。


这些既兼容ASCII又互相之间不兼容的字符编码,后来又统称为ANSI编码。看到下面这张图估计大家就很熟悉了,window下面我们基本上都用ANSI编码保存。


ANSI的字面意思并非指字符编码,而是美国的一个非营利组织,是美国国家标准学会(American National Standards Institute)的缩写,ANSI这个组织为字符编码做了很多标准制定工作,后来大家习惯把这类混乱的多字节编码叫ANSI编码或者标准代码页。


ANSI编码只是一个范称,一般代表系统默认的编码方式,而且并不是确定的某一种编码方式——比如在Window操作系统里,中国区ANSI编码指的是GB编码,在香港地区ANSI编码指的是Big5编码,在韩国ANSI编码指的是EUC-KR编码。



带你读《全景揭秘字符编码》之五:五、字符编码的历史(4) https://developer.aliyun.com/article/1240937?groupCode=tech_library

相关文章
|
存储
带你读《全景揭秘字符编码》之二:二、什么是字符编码?
带你读《全景揭秘字符编码》之二:二、什么是字符编码?
226 1
|
程序员
带你读《全景揭秘字符编码》之一:一、引言
带你读《全景揭秘字符编码》之一:一、引言
251 0
带你读《全景揭秘字符编码》之五:五、字符编码的历史(2)
带你读《全景揭秘字符编码》之五:五、字符编码的历史(2)
114 0
带你读《全景揭秘字符编码》之五:五、字符编码的历史(1)
带你读《全景揭秘字符编码》之五:五、字符编码的历史(1)
131 0
带你读《全景揭秘字符编码》之五:五、字符编码的历史(4)
带你读《全景揭秘字符编码》之五:五、字符编码的历史(4)
132 0
带你读《全景揭秘字符编码》之六:六、字符编码模型(2)
带你读《全景揭秘字符编码》之六:六、字符编码模型(2)
138 0
|
存储
带你读《全景揭秘字符编码》之六:六、字符编码模型(5)
带你读《全景揭秘字符编码》之六:六、字符编码模型(5)
129 0
|
存储
带你读《全景揭秘字符编码》之六:六、字符编码模型(4)
带你读《全景揭秘字符编码》之六:六、字符编码模型(4)
128 0
带你读《全景揭秘字符编码》之六:六、字符编码模型(1)
带你读《全景揭秘字符编码》之六:六、字符编码模型(1)
123 0
带你读《全景揭秘字符编码》之六:六、字符编码模型(3)
带你读《全景揭秘字符编码》之六:六、字符编码模型(3)
130 0