【C/C++】内存对齐-阿里云开发者社区

开发者社区> tengweitw> 正文

【C/C++】内存对齐

简介:          在了解内存对齐方式前,先介绍计算机的存储方式:Big Endian与Little Endian:  Big Endian   即数据的高位在低地址,地位在高地址,并且把最高字节的地址作为变量的首地址  Little Endian 即数据的高位在高地址,数据的低位在低地址,并且把最低字节的地址作为变量首地址。
+关注继续查看

         在了解内存对齐方式前,先介绍计算机的存储方式:Big Endian与Little Endian:

  •  Big Endian   即数据的高位在低地址,地位在高地址,并且把最高字节的地址作为变量的首地址
  •  Little Endian 即数据的高位在高地址,数据的低位在低地址,并且把最低字节的地址作为变量首地址。
        现实中,某些基于RISC(精简指令集)的cpu比如SPARC、PowerPC等,采用Big Endian,而Intel系列cpu采用Little Endian。如果想要知道自己的电脑是什么存储格式只需要输入以下代码: 

#include<iostream>

using namespace std;

void main()
{
	 char ch[]={0x12,0x34,0x56,0x78};
	 int* p=(int*)ch;
	 cout<<hex<<*p<<endl;//如果是78563412,说明是 Little Endian,如果是12345678,则是Big Endian
}
         自然对齐:如果一个变量的内存地址正好位于它字节长度的整数倍,它就被称做自然对齐

       对于标准数据类型,它的地址只要是它的长度的整数倍,而非标准数据类型按下面的原则对齐:
  数组 :按照基本数据类型对齐,只要第一个对齐后面的自然也就对齐。 
  联合 :按其包含的长度最大的数据类型对齐。 
  结构体: 结构体中每个数据类型都要对齐。        

字节对齐的好处:
   字节对齐的根本原因在于CPU访问数据的效率问题。学过微机原理的都知道规则字和非规则字,8086cpu访问规则字只要一个周期,而访问非规则字需要两个周期。在这里原理也是一样的,只不过这里是32位的操作系统,最多一次访问4字节,而8086是16位的,一次最多访问2字节。假设上面整型变量的地址是自然对齐,比如为0x00000000,则CPU如果取它的值的话需要访问一次内存,一次直接取从0x00000000-0x00000003的一个int型,如果变量在0x00000001,则第一次访问0x00000001的char型,第二次取从0x00000002-0x00000003的short型,第三次是0x00000004的char型,然后组合得到所要的数据,如果变量在0x00000002地址上的话则要访问两次内存,第一次为short,第二次为short,然后组合得到整型数据。如果变量在0x00000003地址上的话,则与在
 0x00000001类似。
 


  我们通过下面的例子来说明自然对齐:

#include<iostream>

using namespace std;

void main()
{
	int a=0x0abcde11;//a b c 的地址依次减小
	int b=0x012345678;
	double c=0x0f23456789abcdef1;
    char d=0x0fa;

   	char *ptr=(char*)&a;
    printf("a b每个字节的内容:\n");
	printf("  地址  :内容\n");
	for(int i=0;i<8;i++)
		printf("%x  :%x\n",ptr+3-i,*(ptr+3-i));//说明整数是按 little-endian存储的


    printf("\na b c d的首地址和地址与字节长度的余值:\n");
	printf("a: %x :%d\n",&a,long(&a)%sizeof(a));//从这里可以看成变量的内存地址按变量顺序递减的 
	printf("b: %x :%d\n",&b,long(&b)%sizeof(b));//各个变量并不一定存放在连续的内存单元
	printf("c: %x :%d\n",&c,long(&c)%sizeof(c));
	printf("d: %x :%d\n",&d,long(&d)%sizeof(d));
}
上面程序在我电脑的运行结果为:


由上面的结果可以知道:

  • 地址随变量顺序而减小(你可以通过改变变量定义顺序来测试);
  • 我的电脑采用的是Little Endian;
  • 各个变量并不一定存放在连续的内存单元(由c d的地址可知)

对于数组,无论是静态数组还是动态数组都是连续存储的,可以用下面程序来查看:

#include<iostream>

using namespace std;

void main()
{
    int array[5]={0};
	for(int i=0;i<5;i++)
	cout<<&array[i]<<endl;//输出静态数组的每个元素的地址
    cout<<endl;

	int *pt=new int[5];
	for( i=0;i<5;i++)
	cout<<hex<<(pt+i)<<endl;//输出动态数组的每个元素的地址
    cout<<endl;

	delete []pt;//注意要释放内存
    
}

        上面我们讨论了基本数据类型的内存存储,下面我们来看看类的存储结构:

首先我们看看下面这个类:

class person1
	{
		bool m_isMan;
		float m_height;
		bool m_isFat;
		double m_weight;
		unsigned char m_books;
	};
	cout<<sizeof(person1)<<endl;//32=4+4+8+8+8

这里person类的长度为32,其内存单元示意图如下:

在这里是按8字节边界来对齐的

上述变量已经都自然对齐了,为什么person对象最后还要填充7字节?

因为当你定义person类型的数组时,如果不填充7字节,则除了第一个元素外其它的元素就可能不是自然对齐了。


下面通过使用编译指令来定义对齐方式:

#pragma pack(push,4)// 按4字节边界对齐
	class person2
	{
		bool m_isMan;
		float m_height;
		bool m_isFat;
		double m_weight;
		unsigned char m_books;
	};
	cout<<sizeof(person2)<<endl;//24=4+4+4+8+4
#pragma pack(pop)	
这里person类的长度为24,其内存单元示意图如下:

显然,在这里m_weight的地址不一定能被8整除,即不一定是自然对齐的。

从上面可以知道,内存的大小和存取的效率随编译方式和变量定义有关,最好的方法是:按照字节大小从大到小依次定义变量成员,并尽可能采用小的成员对齐方式。

  • 从小到大定义变量:
    //按照从小到大字节长度来定义变量
    	class person4
    	{
    		bool m_isMan;
    		bool m_isFat;
    		unsigned char m_books;
    		float m_height;
    		double m_weight;
    	};
    	cout<<sizeof(person4)<<endl;//16=1+1+1+1字节的填充+4+8
    这里person类的长度为16,其内存单元示意图如下:


  • 从大到小定义变量:
    //按照从大到小字节长度来定义变量
    	class person3
    	{
    		double m_weight;
    		float m_height;
    		unsigned char m_books;
    		bool m_isMan;
    		bool m_isFat;
    	};
    	cout<<sizeof(person3)<<endl;//16=8+4+1+1+1+1字节的填充
    这里person类的长度为16,其内存单元示意图如下:

          从上面可以看出两者所占内存一样,但是稳定度不同,从小到大的方式的对齐方式而发生有的成员变量不会自然对齐。如下所示

         

 #pragma pack(push,1)// 按4字节边界对齐
	class person5
	{
		bool m_isMan;
		bool m_isFat;
		unsigned char m_books;
 		float m_height;
  		double m_weight;
	};
	cout<<sizeof(person5)<<endl;//15=1+1+1+4+8
#pragma pack(pop)

这里person类的长度为15,其内存单元示意图如下:          

    

在上面的程序中,double的偏移量为1+1+1+4=7,很有可能不会自然对齐,所以最好采用从大到小的方式来定义成员变量。



                




版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
c++程序的内存格局
c++程序的内存格局通常分为四个区: 全局数据区; 代码区; 栈区; 堆区(即自由存储区)。       全局变量、静态数据、常量存放在全局数据区,所有类成员函数和非成员函数代码存放在代码区,为运行函数而分配的局部变量、函数参数、返回地址等存放在栈区,余下的空间都被称为堆区。
643 0
C/C++内存存储的几个问题
转来转去,点击链接已经无法找到当时写这文章的人了,因此,标题也被我修改了(邪恶了),内容也做了一些的修改。 一个由C/C++编译的程序占用的内存分为以下几个部分 1、栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。 2、堆区(heap) — 一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收 。 3、全局区(静态区)(static)—,
672 0
C#内存操作
原文:[转]C#内存操作 最近闲来无事发现周围的朋友都在玩《植物大战僵尸》的游戏!于是动了制作这游戏工具的念头!虽然在网上同类工具很多 但是用C#写的我几乎看不到!所以我想用C#写一个!  首先用CE或者OD或者其他反汇编工具找出游戏的内存基址!  游戏内存基址:base = 0x006A9EC0 ...
957 0
C++内存管理学习堆和栈
  来源:http://c.chinaitlab.com/basic/936306_2.html  一 C++内存管理 1.内存分配方式    在讲解内存分配之前,首先,要了解程序在内存中都有什么区域,然后再详细分析各种分配方式。
1081 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
10468 0
C++类对应的内存结构
评注:子类的虚函数接在第一个基类的虚函数表的后面,所以B接在A后面,Complex接在B后面。基类依次出现,子类成员接在最后面,所以m_iComplex位于最后面。
891 0
C++ 对象的内存布局
来源:http://blog.csdn.net/haoel/article/details/3081328 前言 07年12月,我写了一篇《C++虚函数表解析》的文章,引起了大家的兴趣。有很多朋友对我的文章留了言,有鼓励我的,有批评我的,还有很多问问题的。我在这里一并对大家的留言表示感谢。这也是我为什么再写一篇续言的原因。因为,在上一篇文章中,我用了的示例都是非常简单的,主
919 0
+关注
tengweitw
所在学校:西电 兴趣爱好:编程、英语,象棋,乒乓球 email:771257840@qq.com
159
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载