前言:
本篇文章只是为了科普 计算机中数据的存储规则
1.计算机中的数据
计算机的数据大致分为三类:文本数据,图片和音频
注:视频是图片和音频的结合
计算机中任意的数据都是以二进制的形式进行存储的
2.二进制的介绍
我们平时生活中使用的是十进制,一位可以表示的数据范围是0~9,逢十进一.二进制也是差不多,一位可以表示的数据范围是0和1,逢二进一
二进制的运算规则
先举个例子:
思考: 二进制下的101和十进制下的101 表示的结果一样吗? 答案肯定是不一样的对吧,那么二进制下的101是十进制下的几呢?
十进制下的101,其实就是101对吧,这个如果要用十进制要如何算呢?
看下图:
那么二进制的计算也是如此:
常见的进制
常见的进制有:二进制 十进制 八进制和十六进制
二进制:由0和1组成,代码中以0b开头
十进制:由0~9组成,代码中不加任何前缀
八进制:由0~7组成,代码中以0开头
十六进制:由0~9和a到f组成,代码中以0x开头
十六进制的a到f:
进制之间的转换也和上面的二进制转十进制的方法一样
有一点需要注意:十进制转其它进制时还不太一样
十进制转其它进制需要使用:除基取余法
不断除以基数(转成几进制,就除几)得到余数,直到商为0,在讲余数倒着拼回来即可
3.字符的存储
计算机中数据都是以二进制的方式进行存储的,那么字符是如何存储的呢?这就要用到ASCII码表了
如果想知道ASCII码表,可以看看➡ASCII码一览表,ASCII码对照表
每个字符都有属于自己的ASCII码值,这些值就是数字,就可以使用二进制进行存储
4.汉字的存储
因为ASCII是外国人搞出来的,当时并没有考虑到汉字
这就要说到字符集编码:
GB2312编码:1981年5月1日发布的简体中文汉字编码国家标准。收录7445个图形字符,其中包括6763个汉字。
BIG5编码:台湾地区繁体中文标准字符集,共收录13053个中文字,1984年实施。
GBK编码:2000年3月17日发布,收录21003个汉字,包含国家标准GB13000-1中的全部中日韩汉字,和BIG5编
码中的所有汉字。
Unicode编码:国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文
本信息转换。
5.图片的存储
图片的存储就要涉及到像素了,每个像素都有颜色,所以才构成了我们看到的图片
三原色:红绿蓝(也就是我们俗称的RGB) 这三种颜色互相搭配就组成了五彩缤纷的颜色
红绿蓝就三个颜色是有取值范围的:每个颜色的取值都在0~255之间 也可以用十六进制来表示,取值范围是0~FF
6.音频的存储
声音都是由波形图的,声音的波形图上的每一个点都有对应的数字
总结:
计算机中任意的数据都是以二进制的形式进行存储的
文本数据:
数字:二进制
字母:对应二进制的ASCII码值
汉字:查询字符集编码,然后转成二进制进行存储
图片:每个像素的RGB三原色进行存储
音频:对声波图进行采样再存储