C++内存分区以及堆内存和栈内存

简介:

一、文章来由

做项目用了很多堆内存指针,我一直苦苦思考的问题就是这些堆内存是否可以完全由栈空间分配的方式解决,这个问题纠结了好久,于是下决心解决它。

二、程序内存分配

栈区(stack)— 由编译器自动分配释放

存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈

在函数完成执行,系统自行释放栈区内存,不需要用户管理。整个程序的栈区的大小可以在编译器中由用户自行设定,VS中默认的栈区大小为1M,可通过VS手动更改栈的大小。64bits的Linux默认栈大小为10MB,可通过ulimit -s临时修改。

堆区(heap)— 一般由程序员分配释放

若程序员不释放,程序结束时可能由OS回收。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表,通常是malloc或者new进行堆的申请,堆的总大小为机器的虚拟内存的大小;

注意:
new操作符本质上是使用了malloc进行内存的申请,new和malloc的区别如下:
(1)malloc是C语言中的函数,而new是C++中的操作符。
(2)malloc申请之后返回的类型是void*,而new返回的指针带有类型。
(3)malloc只负责内存的分配而不会调用类的构造函数,而new不仅会分配内存,而且会自动调用类的构造函数。

全局区(静态区)(static)

全局变量和静态变量的存储是放在一块的。初始化的全局变量和静态变量在一块区域,未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。静态存储区内的变量在程序编译阶段已经对运行时的内存进行分配并初始化。这块内存在程序的整个运行期间都存在,程序结束后有系统释放;

常量区

常量字符串就是放在这里的,程序结束后由系统释放。

程序代码区

存放函数体的二进制代码。所有代码,编译成二进制后存放于代码区,文字常量存放于代码区,是不可寻址的。

但是为什么这么分区呢?

//main.cpp
int a = 0; //全局初始化区
char *p1; //全局未初始化区
main()
{
   int b; //栈
   char s[] = "abc"; //栈,注意此处是数组
   char *p2; //栈
   char *p3 = "123456"; // "123456\0" 放在常量区,p3在栈上
   static int c =0//全局(静态)初始化区

   p1 = (char *)malloc(10);  //分配得来的10和20字节的区域就在堆区, 但是注意p1、p2本身是在栈中的
   p2 = (char*)malloc(20);  

   //"123456" 在代码区(不可寻址),"123456\0" 放在常量区
   //编译器可能会将它与p3所指向的"123456"优化成一个地方
   strcpy(p1,"123456");
} 

看到这里,大家可能有个疑问,”123456”到底在代码区还是在常量区,我个人的理解是,”123456”本身肯定是在代码区,是不可寻址的,但是运行时指针指向他们的常量区地址(比如上述的字符串 “123456” 运行时在内存中是 “123456\0”)。

但是分区方案跟编译器本身关系很大,不同编译器分配内存可能不尽相同,但是也不会有太大的不同。

对分区的归纳

数据区:堆,栈,静态存储区,常量区。
静态存储区:全局区(全局变量区)和静态变量区(静态区)。
代码区:存放程序编译后的二进制代码,不可寻址区。

关于const可修改和常量区的思考

#include <iostream>
using namespace std;

//const int j=5; //运行时报错

void ShowValue(const int &i) {
    cout<<i<<endl;
}

int main() 
{
    const int j=5;
    void *p=(void *)&j;
    int *ptr=(int *)p;
    (*ptr)++;
    //cout<<j<<endl; //还是会显示5,因为编译器优化的时候将j替换为文字常量5
    //但如果是int i=5; const int j=i; 则无法替换,直接输出j为6
    ShowValue(j); //显示6

    return 0; 
}

如上栈上申请const变量可修改,但是全局的const会运行时报错,全局变量const,让数字存放在常量区。字符串会放在常量区,有复用的可能。

字符串也是可以修改的,只要在栈上就可以:

#include <iostream>
using namespace std;

//const int j=5;

void ShowValue(const char* i) {
    cout<<i<<endl;
}

int main() 
{
    const char j[]="123"; //如果是 char *j 就会出现问题(虽然没有报错)
    void *p=(void *)&j;
    char *ptr=(char *)p;
    ptr[1]='d';
    ShowValue(j);

    return 0; 
}

const在C语言的意思并不是常量,而是只读变量。只读的全局变量会放在只读页面,同时编译时做类型检查。而只读的局部变量只会做类型检查,语法上不可修改而已,通过把地址强制转换一下还是可以修改的,比如 (int )&j = 12; 所以在汇编语言里还是有只读全局变量的概念,但是只读的局部变量却是实现不了了。

三、堆 VS 栈

1、申请后系统响应

栈:只要栈的剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢出。

堆:首先应该知道操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,会遍历该链表,寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲结点链表中删除,并将该结点的空间分配给程序,另外,对于大多数系统,会在这块内存空间中的首地址处记录本次分配的大小,这样,代码中的delete语句才能正确的释放本内存空间。另外,由于找到的堆结点的大小不一定正好等于申请的大小,系统会自动的将多余的那部分重新放入空闲链表中。
注意这里,malloc分配失败会返回空指针,但new分配失败只会抛出异常,需要

catch( const bad_alloc& e ) {
    return-1;
}

2、申请大小限制

栈:在Windows下,栈是向低地址扩展的数据结构,是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的,在WINDOWS下,由编译器决定栈的大小(一般1M/2M),如果申请的空间超过栈的剩余空间时,将提示overflow。因此,能从栈获得的空间较小。

堆:堆是向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见,堆获得的空间比较灵活,也比较大。

3、申请效率比较

栈: 由系统自动分配,速度较快。但程序员是无法控制的。

堆: 由new分配的内存,一般速度比较慢,而且容易产生内存碎片,不过用起来最方便.另外,在WINDOWS下,最好的方式是用VirtualAlloc分配内存,他不是在堆,也不是在栈是直接在进程的地址空间中保留一快内存,虽然用起来最不方便。但是速度快,也最灵活。

4、堆和栈中的存储内容

栈: 在函数调用时,第一个进栈的是主函数中后的下一条指令(函数调用语句的下一条可执行语句)的地址,然后是函数的各个参数,在大多数的C编译器中,参数是由右往左入栈的,然后是函数中的局部变量。注意静态变量是不入栈的。当本次函数调用结束后,局部变量先出栈,然后是参数,最后栈顶指针指向最开始存的地址,也就是主函数中的下一条指令,程序由该点继续运行。

堆:一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容由程序员安排。

5、存取效率

chars[] = "abc"; //栈 
char*p3 = "123456"; //123456\0 在常量区,p3在栈上。

abc是在运行时刻赋值的,而123456是在编译时就确定的,但是,在以后的存取中,在栈上的数组比指针所指向的字符串(例如堆)快。

6、小心内存泄露

在堆上分配内存很容易造成内存泄漏,这是C/C++的最大的“克星”,如果你的程序要稳定,那么就不要出现MemoryLeak。所以,在使用malloc系统函数(包括calloc,realloc)时千万要小心。

记得有一个UNIX上的服务应用程序,大约有几百的C文件编译而成,运行测试良好,等使用时,每隔三个月系统就是down一次,搞得许多人焦头烂额,查不出问题所在。只好,每隔两个月人工手动重启系统一次。出现这种问题就是MemeryLeak在做怪了,在C/C++中这种问题总是会发生,所以一定要小心。

对于malloc和free的操作有以下规则:
1)配对使用,有一个malloc,就应该有一个free。(C++中对应为new和delete)
2) 尽量在同一层上使用,不要malloc在函数中,而free在函数外。最好在同一调用层上使用这两个函数。
3) malloc分配的内存一定要初始化。free后的指针一定要设置为NULL。
注:虽然现在的操作系统(如:UNIX和Win2k/NT)都有进程内存跟踪机制,也就是如果你有没有释放的内存,操作系统会帮你释放。但操作系统依然不会释放你程序中所有产生了MemoryLeak的内存,所以,最好还是你自己来做这个工作。(有的时候不知不觉就出现MemoryLeak了,而且在几百万行的代码中找无异于海底捞针,Rational有一个工具叫Purify,可能很好的帮你检查程序中的MemoryLeak)


参考资料

[1] http://blog.csdn.net/abcjennifer/article/details/39780819
[2] http://blog.csdn.net/k346k346/article/details/45592329
[3] http://bbs.csdn.net/topics/320193402/

相关文章
|
11月前
|
安全 C语言 C++
比较C++的内存分配与管理方式new/delete与C语言中的malloc/realloc/calloc/free。
在实用性方面,C++的内存管理方式提供了面向对象的特性,它是处理构造和析构、需要类型安全和异常处理的首选方案。而C语言的内存管理函数适用于简单的内存分配,例如分配原始内存块或复杂性较低的数据结构,没有构造和析构的要求。当从C迁移到C++,或在C++中使用C代码时,了解两种内存管理方式的差异非常重要。
392 26
|
C语言 C++
c与c++的内存管理
再比如还有这样的分组: 这种分组是最正确的给出内存四个分区名字:栈区、堆区、全局区(俗话也叫静态变量区)、代码区(也叫代码段)(代码段又分很多种,比如常量区)当然也会看到别的定义如:两者都正确,记那个都选,我选择的是第一个。再比如还有这样的分组: 这种分组是最正确的答案分别是 C C C A A A A A D A B。
216 1
|
存储 Linux C语言
C++/C的内存管理
本文主要讲解C++/C中的程序区域划分与内存管理方式。首先介绍程序区域,包括栈(存储局部变量等,向下增长)、堆(动态内存分配,向上分配)、数据段(存储静态和全局变量)及代码段(存放可执行代码)。接着探讨C++内存管理,new/delete操作符相比C语言的malloc/free更强大,支持对象构造与析构。还深入解析了new/delete的实现原理、定位new表达式以及二者与malloc/free的区别。最后附上一句鸡汤激励大家行动缓解焦虑。
|
安全 C语言 C++
彻底摘明白 C++ 的动态内存分配原理
大家好,我是V哥。C++的动态内存分配允许程序在运行时请求和释放内存,主要通过`new`/`delete`(用于对象)及`malloc`/`calloc`/`realloc`/`free`(继承自C语言)实现。`new`分配并初始化对象内存,`delete`释放并调用析构函数;而`malloc`等函数仅处理裸内存,不涉及构造与析构。掌握这些可有效管理内存,避免泄漏和悬空指针问题。智能指针如`std::unique_ptr`和`std::shared_ptr`能自动管理内存,确保异常安全。关注威哥爱编程,了解更多全栈开发技巧。 先赞再看后评论,腰缠万贯财进门。
682 0
|
11月前
|
存储
阿里云轻量应用服务器收费标准价格表:200Mbps带宽、CPU内存及存储配置详解
阿里云香港轻量应用服务器,200Mbps带宽,免备案,支持多IP及国际线路,月租25元起,年付享8.5折优惠,适用于网站、应用等多种场景。
3308 0
|
11月前
|
存储 缓存 NoSQL
内存管理基础:数据结构的存储方式
数据结构在内存中的存储方式主要包括连续存储、链式存储、索引存储和散列存储。连续存储如数组,数据元素按顺序连续存放,访问速度快但扩展性差;链式存储如链表,通过指针连接分散的节点,便于插入删除但访问效率低;索引存储通过索引表提高查找效率,常用于数据库系统;散列存储如哈希表,通过哈希函数实现快速存取,但需处理冲突。不同场景下应根据访问模式、数据规模和操作频率选择合适的存储结构,甚至结合多种方式以达到最优性能。掌握这些存储机制是构建高效程序和理解高级数据结构的基础。
1087 1
|
11月前
|
存储 弹性计算 固态存储
阿里云服务器配置费用整理,支持一万人CPU内存、公网带宽和存储IO性能全解析
要支撑1万人在线流量,需选择阿里云企业级ECS服务器,如通用型g系列、高主频型hf系列或通用算力型u1实例,配置如16核64G及以上,搭配高带宽与SSD/ESSD云盘,费用约数千元每月。
1471 0
|
存储 编译器 C语言
【C语言篇】数据在内存中的存储(超详细)
浮点数就采⽤下⾯的规则表⽰,即指数E的真实值加上127(或1023),再将有效数字M去掉整数部分的1。
1119 0
|
存储
共用体在内存中如何存储数据
共用体(Union)在内存中为所有成员分配同一段内存空间,大小等于最大成员所需的空间。这意味着所有成员共享同一块内存,但同一时间只能存储其中一个成员的数据,无法同时保存多个成员的值。