Unicode 与 UTF-8 编码的转换

简介: Unicode 与 UTF-8 编码的转换

cc4b9dcae7c54b8abf137f4086641736.png

Unicdoe【真正的完整码表】对照表(二)汉字Unicode表_hherima的博客-CSDN博客_unicode中文对照表注意:下面这两段是代理区。即第1——16平面的间接表示,四个字节的汉字就在这里表示D800-DBFF:High-half zone of UTF-16 DC00-DFFF:Low-half zone of UTF-16 本篇中包含了所有常用汉字27973个,剩余汉字使用代理区标识欢迎查看字符编码相关博客专栏比如:由iPhone emoji问题牵出的UTF-16编码,UTF-8编码探究
从以上链接中查询到汉字 “眀”的码值为 7700

6be1f8467b244ea3a03ac9d144a67929.png


汉字“明” 的7700 的二进制为

0111 0111 0000 0000

转换为十进制是 30464

d7d12ee63ac444e5a26a64ff7815a8d3.png


所以码值范围在第三行。

填充值如下:

1110 0111 1001 1100 1000 0000

填充后对应的十六进制为:

E79C80

接下来我们把这个字符在16进制编辑器中保存在Txt文件中

56df2d7a929d49ef932270e4526734f5.png


保存完Txt 文件,再打开
25e75324a14248a1a0af14d386687b41.png
以上就是Unicode 与 UTF-8 转换的方式。

相关文章
|
6月前
|
存储 自然语言处理 C++
Unicode编码
Unicode编码
206 4
|
1月前
|
自然语言处理
UTF-8编码的意义
UTF-8编码的意义
51 0
|
5月前
|
存储 自然语言处理 Java
UTF-8编码详解
UTF-8编码详解
|
存储 自然语言处理 算法
UTF-8编码
通过阅读本篇文章,你可以了解到:UTF-8编码的规则。
346 0
UTF-8编码
|
存储 JavaScript 程序员
【字符编码详解】ASCII、GB2312、GBK、UTF-8、UTF-16编码与Unicode字符集
【字符编码详解】ASCII、GB2312、GBK、UTF-8、UTF-16编码与Unicode字符集
902 0
NSURL汉字UTF8编码
NSURL汉字UTF8编码
108 0
ANSI - Unicode - UTF8 转换
ANSI - Unicode - UTF8 转换
100 0
|
Web App开发 存储 Windows
字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?
转自:  http://apps.hi.baidu.com/share/detail/17798660 字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得字符编码的知识。不注意的人可能对这个不在意,但这些名词有时候实在让人迷惑,对想学习计算机知识的人来说,搞懂它也十分重要,我也是在学习中慢慢了解了一些这方面的知识。
1900 0
|
存储 自然语言处理
最基础的ASCII、Unicode、UTF-8一起来多了解点
最基础的ASCII、Unicode、UTF-8一起来多了解点
252 0
最基础的ASCII、Unicode、UTF-8一起来多了解点
|
存储 算法 Java
Java编码ASCII、GB2312、GBK、Unicode、UTF-8、UTF-16 编码方式详解
Java编码ASCII、GB2312、GBK、Unicode、UTF-8、UTF-16 编码方式详解
393 0