三、整型在内存中的存储
之前讲过 一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。
那接下来我们谈谈数据在所开辟内存中到底是如何存储的?
1. 如何储存
看下面这个例子:
#include<stdio.h> int main() { int a = 3; int b = -1; return 0; }
为了查看a, b在内存中的存储形式,我们在编译器里面按F10进入调试,变量a,b创建后,打开内存监视器,输入& a,& b查看a,b对应的地址及其内容。
& a:
&b:
数据在内存中存储时是按二进制的补码存储的
展示内存的时候,为了方便展示,显示的是16进制数据。
什么意思呢? 我们定义一个变量c,以16进制形式对其赋值,然后& c,可以看到:
c输入的16进制形式是 11223344 ,存储的时候是 44332211 接下来下面讲:
2. 原码、反码、补码
下面先来了解几个概念︰原码、反码、补码
计算机中的有符号数有三种表示方法,即原码、反码和补码。
三种表示方法均有符号位和数值位两部分,符号位都是用0表示′正”,用1表示"负”,而数值位三种表示方法各不相同。
原码:直接将二进制按照正负数的形式翻译成二进制就可以。
反码:将原码的符号位不变,其他位依次按位取反就可以得到了。
补码:反码 + 1就得到补码。
正数 原码反码补码 三码合一,负数的原反补 按照上面的规则进行转换
整数有两种,有符号数和无符号数
有符号数-- - 符号位 + 数值位
正数 0 + 数值位
负数 1 + 数值位
int b = -1; //10000000 00000000 00000000 00000001 - 原码 //11111111 11111111 11111111 11111110 - 反码 //11111111 11111111 11111111 11111111 - 补码 //ff ff ff ff - 十六进制显示形式 int a = 3; //00000000 00000000 00000000 00000011 - 原码、反码、补码 //0000 0000 0000 0000 0000 0000 0000 0000 0000 0011 //00 00 00 03 - 十六进制显示形式
无符号数 unsigned --- 正整数是一样的!(只能表示正整数!) 无符号数 --- 原反补按规则计算
数据存放内存中其实存放的是补码。
3. 为什么内存中要存储补码?
我们首先来看一下 1 - 1 这个例子:
①先按照原码的方式去计算。
②接下来用补码来进行计算:
在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理; 同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
怎么理解补码与原码相互转换,其运算过程是相同的?(以下运算,符号位均不变)
原码->取反 + 1->补码
补码->取反 + 1->原码
当然补码到原码也可以是:补码 -> - 1 取反->原码
例如 - 1:
11111111 11111111 11111111 11111111 - 补码
补码->取反 + 1->原码
10000000 00000000 00000000 00000000 - 取反
10000000 00000000 00000000 00000001 - +1
补码 -> - 1 取反->原码
11111111 11111111 11111111 11111110 - -1
10000000 00000000 00000000 00000001 - 取反
最终得到的结果均是:10000000 00000000 00000000 00000001
四、大小端介绍
1.什么大端小端
大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中。
小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地址中。
#include <stdio.h> #include <windows.h> int main() { unsigned int a = -10; printf("%d\n", a);//%d有符号数打印 printf("%u\n", a);//%u无符号数打印 system("pause"); return 0; }
对上述代码能运行的解释
存: 1000 0000 0000 0000 0000 0000 0000 1010 ->原码 1111 1111 1111 1111 1111 1111 1111 0101 ->反码 1111 1111 1111 1111 1111 1111 1111 0110 ->补码 //因为是int类型,所以在内存存储32位 即 0xfffffff6
那么如何存呢?
可以看出是小端存储。
解析:
无符号数 unsigned --- 正整数是一样的!(只能表示正整数!)
无符号数 --- 原反补按规则计算
数据存取过程图解:
2.为什么有大端和小端
为什么会有大小端模式之分呢 ?
这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。
但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的long型(要看具体的编译器)。
另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如果将多个字节安排的问题。
因此就导致了大端存储模式和小端存储模式。
例如一个16bit的short型x,在内存中的地址为ox0010),x的值为0×1122,那么0x11为高字节,0x22为低字节。对于大端模式,就将0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,刚好相反
我们常用的x86结构是小端模式,而KEIL c51则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。
笔试题:用小程序判断当前机器的字节序(大小端)
百度2015年系统工程师笔试题:
请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序
如何判断大端、小端(字节序)呢?
思路:
int a = 1;
将a的第一个字节内容拿出来,判断其是1还是0,1为小端,0为大端。
char* 储存一个字节
#include <stdio.h> int check_sys() { int i = 1; //对指针i解引用,可以找存储的第一个字节 //如果得到01,说明存储的顺序是01 00 00 00,则为小端, //如果得到00,说明存储的顺序是00 00 00 01,则为大端, return (*(char *)&i); } int main() { int ret = check_sys(); if(ret == 1)//0x00 00 00 01 { printf("小端\n"); } else { printf("大端\n"); } return 0; }
当然,这里我们也可以将其封装成一个函数,根据其返回值确定是大端还是小端字节序。
int check_sys() { int a = 1; char* p = (char*)&a; if (*p == 1) return 1;//小端 else return 0;//大端 }
当然这个函数我们也可以进行简化:
int check_sys() { int a=1; char*p=(char*)&a; //返回1,小端 //返回0,大端 return *p; }
也可以再简化:
int check_sys() { int a = 1; return *(char*)&a; }