堆(heap)和栈(stack)的区别

简介: 堆(heap)和栈(stack)的区别

在学习C语言时,就对二者有过一面之交,当时并没有认真的去寻其根源,只知道简单的内存分配,须知现今学习Java的虚拟机这两个名词多次出现在眼前,不如就此机会彻底搞懂。

——答案摘自Google和Stack Overflow


1,首先来一句先入为主的总结:


栈是用于静态内存分配,堆用于动态内存分配,二者都存储在计算机的RAM中。


2,栈的概念


  • 分配在栈上的变量在编译期直接分配在内存中,对该内存的访问非常快。当一个函数或方法调用另一个函数,这个函数又调用了第三个函数,以此类推。所有的函数保持暂停状态直到最后一个函数快速地返回值;
  • 堆栈始终以后进先出(LIFO)顺序保留,最近保留的块始终是要释放的下一个块。 这使得跟踪堆栈非常简单,从堆栈中释放块只不过是调整一个指针。


3,堆的概念


  • 分配在堆上的变量是在运行时分配了内存,对该内存的访问有点慢,但堆大小仅受虚拟内存大小的限制。堆的元素彼此之间没有依赖关系,并且可以随时随机访问。
  • 可以随时分配一个块并随时释放它。因为无序,使得在任何给定时间跟踪堆的哪些部分被分配或释放变得更加复杂。


4,二者使用的区别


  • 如果确切地知道在编译之前需要分配多少数据并且数据量不是太大,则可以使用栈。如果不确切知道运行时需要多少数据,或者需要分配数据量较大,则可以使用堆。
  • 在多线程情况下,每个线程都有自己完全独立的栈,但它们将共享堆。栈是特定于线程,而堆是特定于应用程序。在异常处理和线程执行中,栈很重要。
  • 来一张显然意见的图来区分二者的不同:

1665663293908.jpg

堆和栈的鲜明的特征


栈:

  • 像堆一样存储在计算机RAM中
  • 在堆栈上创建的变量超出范围会自动取消分配
  • 与堆上的变量相比,分配要快得多
  • 使用实际的栈数据结构实现
  • 存储本地数据,返回地址,用于参数传递
  • 当使用过多的堆栈时(主要来自无限或太深的递归,非常大的分配),可能会出现栈溢出
  • 可在无指针的情况下使用在栈上创建的数据
  • 能够确切地知道在编译时需要分配多少数据并且它不是太大
  • 通常在程序启动时已确定分配内存的最大值


堆:

  • 像栈一样存储在计算机RAM中
  • 在C++中,必须手动销毁堆上的变量,并且永远不会超出范围。使用delete,delete []或free释放数据
  • 与栈上的变量相比,分配更慢
  • 按需分配程序使用的数据块
  • 当存在大量分配和解除分配时,可能会出现碎片
  • 在C++或C中,在堆上创建的数据将由指针指向,并分别用new或malloc分配
  • 如果请求分配的缓冲区太大,可能会出现分配失败
  • 如果不确切知道运行时需要多少数据,或者需要分配大量数据,则可以使用堆
  • 负责内存泄漏


代码示例:


int foo()
{
  char *pBuffer; //<--nothing allocated yet (excluding the pointer itself, which is allocated here on the stack).
  bool b = true; // Allocated on the stack.
  if(b)
  {
    //Create 500 bytes on the stack
    char buffer[500];
    //Create 500 bytes on the heap
    pBuffer = new char[500];
   }//<-- buffer is deallocated here, pBuffer is not
}//<--- oops there's a memory leak, I should have called delete[] pBuffer;

底层堆和栈的实现原理


1,栈:


  • 栈通常与CPU上的特殊寄存器紧密串联,命名为栈指针。初始化时,栈指针指向栈的顶部(栈中的最高地址)。
  • CPU具有将值压入栈并从栈中弹出的特殊指令。每次push操作都将值存储在栈指针的当前位置,并减少栈指针的值。 pop操作会回收栈指针指向的值,然后增加栈指针的值。存储和回收的值是CPU寄存器的值。
  • 当调用函数时,CPU使用特殊指令来推送当前指令指针,即在栈上执行代码的地址。然后CPU通过将指令指针设置为被调用函数的地址来跳转到该函数。稍后,当函数返回时,从栈中弹出旧的指令指针,并在调用函数后立即执行代码。
  • 输入函数时,栈指针值会减少,以便在栈上为本地(自动)变量分配更多空间。如果函数有一个本地32-bit变量,则在栈上留出四个字节。当函数返回时,栈指针被移回以释放分配的区域。
  • 如果是带参函数,则在调用函数之前将这些参数压入栈。然后,函数中的代码能够从当前栈指针向上追踪栈来找到这些值。
  • 嵌套函数调用很优雅。每次调用都将分配函数参数,为局部变量返回地址和空间,这些追踪记录可以堆叠用于嵌套调用,并在函数返回时以正确的方式展开。
  • 由于栈是有限的内存块,因此可以调用太多的嵌套函数或为局部变量分配太多空间会导致栈溢出。通常,栈的存储区域的设置方式是在栈底部(最低地址)写入能够触发CPU中的陷阱或异常。然后,运行时可以捕获此异常并将其转换为某种栈溢出异常。

image.png

2,堆


  • 堆包含已使用和可用块的链状列表。通过从其中一个空闲块创建合适的块来满足堆上的新分配(new或malloc),这需要更新堆上的块列表。有关堆上块的元信息存储在堆中,位于每个块的前面。
  • 随着堆增长,块的地址从较低地址增加到较高地址。因此,可以将堆视为一堆内存块,这些内存块在分配内存时会增大。如果堆对于分配而言太小,可以从底层操作系统获取更多内存来增加大小。
  • 分配和回收许多小块可能使堆处于这样的状态:在所使用的块之间散布有许多小的空闲块。分配大块的请求可能失败,因为即使空闲块的组合大小足够大,也没有任何空闲块足够大以满足分配请求,这称为堆碎片。可以参考一下垃圾收集算法中最基本的“标记-清除”算法。
  • 当释放与空闲块相邻的使用块时,可以将新的空闲块与相邻的空闲块合并以创建更大的空闲块,从而有效地减少堆碎片。

image.png


Q&A


1,为什么栈的速度快?

栈速度快的原因有三点:其一是当进程启动时由操作系统分配栈(假设存在操作系统),它由程序保持内联。 这是栈速度更快的另一个原因 - 推送和弹出操作通常是一个机器指令,而现代机器可以在一个周期中至少完成3个,而分配或释放堆涉及调用OS(操作系统)代码;其二是访问模式使得从中分配和释放内存变得微不足道(指针/整数简单地递增或递减),而堆在分配或释放中涉及更复杂的簿记。 第三点是栈中的每个字节都经常被频繁地重用,这意味着它往往被映射到处理器的缓存,使其非常快。 堆的另一个性能损失是堆(主要是全局资源)通常必须是多线程安全的,即每个分配和释放通常需要与程序中的“所有”其他堆访问同步。


下图是堆和栈的示意图:

image.png

2,什么决定二者的大小?

创建线程时设置堆栈的大小。堆的大小在应用程序启动时设置,但可以在需要空间时增长(分配器从操作系统请求更多内存)。


3,二者的作用域?

栈附加到一个线程,因此当线程退出时栈将被回收。 堆通常在应用程序启动时由运行时分配,并在应用程序(技术过程)退出时回收。


4,二者在多大程度上受操作系统或语言运行时控制?

操作系统在创建线程时为每个系统级线程分配栈。通常,语言运行时调用操作系统来为应用程序分配堆。


相关文章
|
14天前
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
90 9
|
11天前
|
存储 算法 Java
散列表的数据结构以及对象在JVM堆中的存储过程
本文介绍了散列表的基本概念及其在JVM中的应用,详细讲解了散列表的结构、对象存储过程、Hashtable的扩容机制及与HashMap的区别。通过实例和图解,帮助读者理解散列表的工作原理和优化策略。
26 1
散列表的数据结构以及对象在JVM堆中的存储过程
|
5天前
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
15 1
|
8天前
|
存储 算法 Java
数据结构的栈
栈作为一种简单而高效的数据结构,在计算机科学和软件开发中有着广泛的应用。通过合理地使用栈,可以有效地解决许多与数据存储和操作相关的问题。
|
13天前
|
存储 搜索推荐 算法
【数据结构】树型结构详解 + 堆的实现(c语言)(附源码)
本文介绍了树和二叉树的基本概念及结构,重点讲解了堆这一重要的数据结构。堆是一种特殊的完全二叉树,常用于实现优先队列和高效的排序算法(如堆排序)。文章详细描述了堆的性质、存储方式及其实现方法,包括插入、删除和取堆顶数据等操作的具体实现。通过这些内容,读者可以全面了解堆的原理和应用。
57 16
|
11天前
|
存储 JavaScript 前端开发
执行上下文和执行栈
执行上下文是JavaScript运行代码时的环境,每个执行上下文都有自己的变量对象、作用域链和this值。执行栈用于管理函数调用,每当调用一个函数,就会在栈中添加一个新的执行上下文。
|
13天前
|
存储
系统调用处理程序在内核栈中保存了哪些上下文信息?
【10月更文挑战第29天】系统调用处理程序在内核栈中保存的这些上下文信息对于保证系统调用的正确执行和用户程序的正常恢复至关重要。通过准确地保存和恢复这些信息,操作系统能够实现用户模式和内核模式之间的无缝切换,为用户程序提供稳定、可靠的系统服务。
41 4
|
17天前
|
算法 安全 NoSQL
2024重生之回溯数据结构与算法系列学习之栈和队列精题汇总(10)【无论是王道考研人还是IKUN都能包会的;不然别给我家鸽鸽丢脸好嘛?】
数据结构王道第3章之IKUN和I原达人之数据结构与算法系列学习栈与队列精题详解、数据结构、C++、排序算法、java、动态规划你个小黑子;这都学不会;能不能不要给我家鸽鸽丢脸啊~除了会黑我家鸽鸽还会干嘛?!!!
|
30天前
数据结构(栈与列队)
数据结构(栈与列队)
17 1
|
1月前
|
算法 程序员 索引
数据结构与算法学习七:栈、数组模拟栈、单链表模拟栈、栈应用实例 实现 综合计算器
栈的基本概念、应用场景以及如何使用数组和单链表模拟栈,并展示了如何利用栈和中缀表达式实现一个综合计算器。
30 1
数据结构与算法学习七:栈、数组模拟栈、单链表模拟栈、栈应用实例 实现 综合计算器

热门文章

最新文章