带你读《全景揭秘字符编码》之六:六、字符编码模型(3)

简介: 带你读《全景揭秘字符编码》之六:六、字符编码模型(3)

带你读《全景揭秘字符编码》之六:六、字符编码模型(2) https://developer.aliyun.com/article/1240933?groupCode=tech_library


6.3、第一层:抽象字符集 ACR


所谓抽象字符集,就是抽象字符的合集。


它是一个无序集合,这里强调了字符是抽象的,也就是不仅包括我们视觉上能看到的狭义字符,比如“a”这样的有形字符,也包括一些我们看不到的无形字符,比如一些控制字符“DELETE”、“NULL”等。


抽象的另一层含义是有些字形是由多个字符组合成的,比如西班牙语的 “ñ” 由“n”和“~”两个字符组成,这一点上 Unicode 和传统编码标准不同,传统编码标准多是将 ñ 视作一个独立的字符,而 Unicode 中将其视为两个字符的组合。


同时一个字符也可能会有多种视觉上的字形表示,比如一个汉字有楷、行、草、隶等多种形体,这些都视为同一个抽象字符(即字符集编码是对字符而非字形编码),如何显示是字形库的事。


汉字“人”的不同形态:



抽象字符集有开放与封闭之分:开放的字符集指还会不断新增字符的字符集,封闭字符集是指不会新增字符的字符集。比如ASCII就是封闭式的,只有128个字符,以后也不会再加,但是Unicode是开放式的,会不断往里加新字符的,已经从最初的 7163 个增加到现在的144,697 个字符。


带你读《全景揭秘字符编码》之六:六、字符编码模型(4) https://developer.aliyun.com/article/1240930?groupCode=tech_library

相关文章
|
存储
带你读《全景揭秘字符编码》之二:二、什么是字符编码?
带你读《全景揭秘字符编码》之二:二、什么是字符编码?
226 1
带你读《全景揭秘字符编码》之六:六、字符编码模型(1)
带你读《全景揭秘字符编码》之六:六、字符编码模型(1)
123 0
|
存储
带你读《全景揭秘字符编码》之六:六、字符编码模型(5)
带你读《全景揭秘字符编码》之六:六、字符编码模型(5)
129 0
带你读《全景揭秘字符编码》之六:六、字符编码模型(2)
带你读《全景揭秘字符编码》之六:六、字符编码模型(2)
138 0
|
存储
带你读《全景揭秘字符编码》之六:六、字符编码模型(4)
带你读《全景揭秘字符编码》之六:六、字符编码模型(4)
127 0
|
存储 数据库 Swift
带你读《全景揭秘字符编码》之六:六、字符编码模型(6)
带你读《全景揭秘字符编码》之六:六、字符编码模型(6)
144 0
带你读《全景揭秘字符编码》之五:五、字符编码的历史(2)
带你读《全景揭秘字符编码》之五:五、字符编码的历史(2)
114 0
带你读《全景揭秘字符编码》之五:五、字符编码的历史(3)
带你读《全景揭秘字符编码》之五:五、字符编码的历史(3)
129 0
带你读《全景揭秘字符编码》之五:五、字符编码的历史(1)
带你读《全景揭秘字符编码》之五:五、字符编码的历史(1)
130 0
带你读《全景揭秘字符编码》之五:五、字符编码的历史(4)
带你读《全景揭秘字符编码》之五:五、字符编码的历史(4)
132 0