带你读《全景揭秘字符编码》之六:六、字符编码模型(3) https://developer.aliyun.com/article/1240931?groupCode=tech_library
6.4、第二层:编号字符集 CCS
编号字符集就是对抽象字符集里的每个字符进行编号,映射到一个非负整数的集合。
编号一般用方便人类阅读的十进制、十六进制来表示,比如“A”字符编号“65”,“B”字符编号是“66”。
大家需要清楚对于有些字符编码的编号就是存储的二进制序列,如ASCII编码;有些字符编码的编号跟存储的二进制序列并不一样,比如GB2312、Unicode等。
另外:编号字符集合是有范围限制的,比如ASCII字符集范围是0~127,ISO-8859-1范围是0~256,而GB2312是用一个94*94的二维矩阵空间来表示,Unicode是用Plane平面空间的概念来表示,这称为字符集的编号空间。
编号空间中的一个位置称为码点( Code Point 代码点 )。一个字符占用的码点所在的坐标(非负整数值对)或所代表的非负整数值,就是该字符的码值(码点编号)。
ASCII码点编号:
带你读《全景揭秘字符编码》之六:六、字符编码模型(5) https://developer.aliyun.com/article/1240929?groupCode=tech_library