开发者社区> mydcool> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

utf8和unicode

简介: 下表总结了编码规则,字母x表示可用编码的位。       Unicode符号范围 | UTF-8编码方式          (二进制)|(十六进制) ——————–--——————————————— 0000 0000-0000 007F | 0xxxxxxx 0000 0080-0000...
+关注继续查看

下表总结了编码规则,字母x表示可用编码的位。

      Unicode符号范围 | UTF-8编码方式

         (二进制)|(十六进制)

——————–--———————————————

0000 0000-0000 007F | 0xxxxxxx

0000 0080-0000 07FF | 110xxxxx 10xxxxxx

0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx

0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

下面,还是以汉字“严”为例,演示如何实现UTF-8编码。

已知“严”的unicode是4E25(100111000100101),根据上表,可以发现4E25处在第三行的范围内(0000 0800-0000 FFFF),因此“严”的UTF-8编码需要三个字节,即格式是“1110xxxx 10xxxxxx 10xxxxxx”。然后,从“严”的最后一个二进制位开始,依次从后向前填入格式中的x,多出的位补0。这样就得到了,“严”的UTF-8编码是“11100100 10111000 10100101”,转换成十六进制就是E4B8A5。

转自:http://blog.sina.com.cn/s/blog_5d837bef0100pbhy.html

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Unicode编码表
Unicode编码表
110 0
字符编码unicode,utf-8和ascii
Ascii编码 由于计算机是美国人发明的,因此,最早只有127个字符被编码到计算机里,也就是大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母A的编码是65,小写字母z的编码是122。
911 0
跨平台Unicode与UTF8互转代码
参考来源:http://blog.csdn.net/flying8127/article/details/1598521 在原来原基础上,将代码整理,并加强安全性. 并按照WindowsAPI设计, 添加输出缓冲长度探测功能 当OutUTFString为NULL时, 可以进行输出的UTF8字符串...
856 0
将unicode编码的txt文件转为utf-8编码
利用codes编写: # coding=UTF-8import stringimport codecsdef changecode(): tt=codecs.open('c:\\111.txt','rb','utf-16') #111.
801 0
JS中的UniCode转码问题
var GB2312UnicodeConverter = { ToUnicode: function (str) { return escape(str).
466 0
Unicode函数
一、计算unicode字符串的Ansi编码的长度 Function strUnicodeLen(asContents)     asContents1="a" & asContents     len1=len(asContents1)     k=0     for i=1 to len...
637 0
+关注
mydcool
php相关专家
286
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载