编码及字符集探讨

简介:
我们用到的工具UltraEdit
 
1.文件编码
新建一个文本文件,我们知道我们输入一篇文章,可能需要保存到存储设备中,既然存储,那么我们怎么存呢,我们知道计算机只认识0和1,对于语言文字中的各种符号标记我们怎么存储到计算机中,这就有个编码的问题了。
我们知道如果识别一个学生,我们可以通过给学生编号的方式来管理,这就是学号,而对于各种字符我们类似,进行编码的方式来识别,
了解ASCII码的知道,它用0-255定义这么256个英文及标点等符号。只需要一个字节也就是8个比特位就够了。
对于像我们中文这样的亚洲文字怎么办呢,于是出现了各种编码,比如GB2312,GBK等等。
他们使用2个字节存储汉字。
 
另存我们的文件,存储格式我们用ANSI方式,
这样英文占1个字节,而汉字占2个字节。
 
我们输入几个字符:
 
InBlock.gifABCDE中文
这样是5个英文字母和2个汉字共占9个字节,你可以查看下文件属性验证下。
 
我们在ultraEdit里面Ctrl+H用16进制方式查看下
 
 
我们看到41是A的ASCII码,依次42,43,44,45是BCDE
 
而 D6 D0是 中
CEC4是 文
 
 




 本文转自 xcf007 51CTO博客,原文链接:http://blog.51cto.com/xcf007/149549 ,如需转载请自行联系原作者

相关文章
|
5月前
|
存储 自然语言处理 C++
Unicode编码
Unicode编码
110 4
|
16天前
|
自然语言处理
字符编码
字符编码。
53 15
|
5月前
|
存储 JavaScript Java
[字符编码] 理论篇:常见字符集与编码方式
[字符编码] 理论篇:常见字符集与编码方式
129 0
|
存储 Java 关系型数据库
【精炼易懂】字符集、编码、乱码问题、ASCII、GBK、Unicode、UTF-8详解+实例说明
【精炼易懂】字符集、编码、乱码问题、ASCII、GBK、Unicode、UTF-8详解+实例说明
5638 4
|
存储 编解码 算法
字符编码的前世今生
字符编码的前世今生
163 0
|
存储 XML SQL
字符编码与使用中的问题
作为中文环境下开发的Java程序员,UTF-8编码是我们经常使用的编码方式。 字符编码是怎么来的?为什么使用UTF-8编码?使用字符编码的时候回遇到什么坑? 这些问题你遇到过或者思考过吗。
144 0
|
Web App开发 存储 Windows
字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?
转自:  http://apps.hi.baidu.com/share/detail/17798660 字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得字符编码的知识。不注意的人可能对这个不在意,但这些名词有时候实在让人迷惑,对想学习计算机知识的人来说,搞懂它也十分重要,我也是在学习中慢慢了解了一些这方面的知识。
1870 0
|
存储 编解码 Windows
理解字符编码
理解字符编码
理解字符编码
|
存储 自然语言处理 JavaScript
【字符编码】彻底理解字符编码
在解决昨天的问题时,又引出了很多新的问题,如为什么要进行编码,这些编码的关系如何,如ASCII,IOS-8859-1,GB2312,GBK,Unicode之间的关系,笔者想要彻底理解字符编码背后的故事,遂进行了探索,具体笔记如下。如园友能读完本篇文章,我相信会解开很多疑惑
281 0
【字符编码】彻底理解字符编码
|
存储 自然语言处理 JavaScript
【字符编码】彻底理解字符编码
 在解决昨天的问题时,又引出了很多新的问题,如为什么要进行编码,这些编码的关系如何,如ASCII,IOS-8859-1,GB2312,GBK,Unicode之间的关系,笔者想要彻底理解字符编码背后的故事,遂进行了探索,具体笔记如下。如园友能读完本篇文章,我相信会解开很多疑惑。
306 0
【字符编码】彻底理解字符编码