字符编码小结

简介:
ANSI      -> Ascii :    American Standard Code for information interchange;一个字节/字符;0~0x32 为控制码;33~255 为 字符;
http://www.cs.utk.edu/~pham/ascii.html

中 国人民  ->GB2312:  去掉Ascii表127之后的定义. 规定:一个小于127的字符意义与原来相同, 两个大于127的字符组合在一起就表示一个汉字,这些由两个字符组成的汉字叫全角字符,1~127的叫半角字符 [0xA1,0xF7][0xA1,0xFE]。

中国人民  ->GBK:      只要第一个字节大于127 ,这个字节和随后的字节表示一个汉字 [0xA1,0xF7][0x00,0xFE],GBK包含了gb2312的全部字符。

ISO      ->UNICODE: 所有字符都用2字节编码, Windows 的核心使用的就是UNICODE
             ->UTF-8:动态编码,字母和数字一般用1个字节表示,汉字和其他字符用2~3个字节表示规则如下表。
ISO 和UTF-8的转换规则: 
Unicode
UTF-8 
0000 - 007F
0xxxxxxx
0080 - 07FF
110xxxxx 10xxxxxx
0800 - FFFF
1110xxxx 10xxxxxx 10xxxxxx
 
查看字符的2进制代码: 
把文件后缀改为bin 然后用VS 打开 



本文转自 xhinkerx 51CTO博客,原文链接:http://blog.51cto.com/xhinker/214502,如需转载请自行联系原作者
目录
相关文章
|
20天前
|
存储 自然语言处理 数据可视化
字符集编码(三):Unicode
中国的 GB 编码和日本的 JIS 编码在兼容 ASCII 的同时,又给 ASCII 中的可见字符做了个“全角”编码(原 ASCII 中的字符被称为“半角”字符)。所谓全角和半角字符,在字形和字意上都完全相同,只是全角字符占用宽度(注意不是字形本身的宽度)是半角字符的两倍(据说是为了中英文混排时的美观效果),按照 Unicode 的设计原则,这种问题应该交由文字渲染程序去处理,
12 1
|
存储 编解码 算法
字符编码的前世今生
字符编码的前世今生
139 0
|
存储 XML SQL
字符编码与使用中的问题
作为中文环境下开发的Java程序员,UTF-8编码是我们经常使用的编码方式。 字符编码是怎么来的?为什么使用UTF-8编码?使用字符编码的时候回遇到什么坑? 这些问题你遇到过或者思考过吗。
131 0
|
存储 Java 关系型数据库
【技术干货】理解Unicode字符编码
本文对字符编码Unicode以及UTF8和UTF16的编码原理进行了详细说明
561 1
|
存储 编解码 Windows
理解字符编码
理解字符编码
理解字符编码
|
存储 自然语言处理 JavaScript
【字符编码】彻底理解字符编码
在解决昨天的问题时,又引出了很多新的问题,如为什么要进行编码,这些编码的关系如何,如ASCII,IOS-8859-1,GB2312,GBK,Unicode之间的关系,笔者想要彻底理解字符编码背后的故事,遂进行了探索,具体笔记如下。如园友能读完本篇文章,我相信会解开很多疑惑
261 0
【字符编码】彻底理解字符编码
|
存储 自然语言处理 JavaScript
【字符编码】彻底理解字符编码
 在解决昨天的问题时,又引出了很多新的问题,如为什么要进行编码,这些编码的关系如何,如ASCII,IOS-8859-1,GB2312,GBK,Unicode之间的关系,笔者想要彻底理解字符编码背后的故事,遂进行了探索,具体笔记如下。如园友能读完本篇文章,我相信会解开很多疑惑。
276 0
【字符编码】彻底理解字符编码
|
存储 小程序 Windows
字符编码
字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?
154 0
|
存储 自然语言处理
字符编码unicode,utf-8和ascii
Ascii编码 由于计算机是美国人发明的,因此,最早只有127个字符被编码到计算机里,也就是大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母A的编码是65,小写字母z的编码是122。
1085 0
|
JavaScript 前端开发 .NET