unicode17个平面,每个平面16位, 17需要5位,共21位。
utf8 4个byte可以表示21位,所以目前4byte够了。
unicode17个平面,大约可以表示110万个字符,已经用了10万左右
常用汉字,如:一汉龥 占用3字节
非常用汉字,如: 占用4个字节
utf16 前者两个字节,后者4个字节。
utf表示ascll码时,只要1个字节,utf16要两个字节
unicode17个平面,每个平面16位, 17需要5位,共21位。
utf8 4个byte可以表示21位,所以目前4byte够了。
unicode17个平面,大约可以表示110万个字符,已经用了10万左右
常用汉字,如:一汉龥 占用3字节
非常用汉字,如: 占用4个字节
utf16 前者两个字节,后者4个字节。
utf表示ascll码时,只要1个字节,utf16要两个字节