带你读《全景揭秘字符编码》之六:六、字符编码模型(2) https://developer.aliyun.com/article/1240933?groupCode=tech_library
6.3、第一层:抽象字符集 ACR
所谓抽象字符集,就是抽象字符的合集。
它是一个无序集合,这里强调了字符是抽象的,也就是不仅包括我们视觉上能看到的狭义字符,比如“a”这样的有形字符,也包括一些我们看不到的无形字符,比如一些控制字符“DELETE”、“NULL”等。
抽象的另一层含义是有些字形是由多个字符组合成的,比如西班牙语的 “ñ” 由“n”和“~”两个字符组成,这一点上 Unicode 和传统编码标准不同,传统编码标准多是将 ñ 视作一个独立的字符,而 Unicode 中将其视为两个字符的组合。
同时一个字符也可能会有多种视觉上的字形表示,比如一个汉字有楷、行、草、隶等多种形体,这些都视为同一个抽象字符(即字符集编码是对字符而非字形编码),如何显示是字形库的事。
汉字“人”的不同形态:
抽象字符集有开放与封闭之分:开放的字符集指还会不断新增字符的字符集,封闭字符集是指不会新增字符的字符集。比如ASCII就是封闭式的,只有128个字符,以后也不会再加,但是Unicode是开放式的,会不断往里加新字符的,已经从最初的 7163 个增加到现在的144,697 个字符。
带你读《全景揭秘字符编码》之六:六、字符编码模型(4) https://developer.aliyun.com/article/1240930?groupCode=tech_library