开发者社区> 李牙刷儿> 正文

Linux下进程内存管理之malloc和sbrk

简介: 之前自己突发兴趣想写一下malloc函数,顺便了解一下进程的内存管理。在写的过程中发现其实malloc只不过是通过调用Linux下的sbrk函数来实现内存的分配,只是在sbrk之上加了一层对所分配的内存的管理罢了,而sbrk以及brk是实现从虚拟内存到内存的映射的。在实际动手写之前先来了解一下Linux下一个进程的内存空间分配。 进程内存空间分配 Linux下每个进程所分配的虚拟内
+关注继续查看

之前自己突发兴趣想写一下malloc函数,顺便了解一下进程的内存管理。在写的过程中发现其实malloc只不过是通过调用Linux下的sbrk函数来实现内存的分配,只是在sbrk之上加了一层对所分配的内存的管理罢了,而sbrk以及brk是实现从虚拟内存到内存的映射的。在实际动手写之前先来了解一下Linux下一个进程的内存空间分配。


进程内存空间分配

Linux下每个进程所分配的虚拟内存空间是3G,但实际使用过程中不可能也没有必要为一个进程分配如此大的空间,毕竟内存是很宝贵的资源。当一个进程执行的时候系统为其分配的内存空间主要包括数据段,代码段,栈,堆等等。而malloc所申请的空间就是从堆中分配的。先来看下面这张图:

这就是一个进程的内存空间,其中的Data Segment出要是存放已经初始化的静态数据,而BSS segment则存放为初始化的静态数据,在此之上的堆,然后是栈。值得注意的是,堆和栈的增长方向正好是相反的。现在先通过一段简单的代码来看一下data segment 和BSS segment的分配。

  8 #include <stdio.h>
  9 #include <stdlib.h>
 10 
 11 int bssvar;
 18 int dataSegmentVar = 1;
 19 
 20 int main()
 21 {
 22     printf("bssvar:%p, dataSegmentVar:%p,gap:%d", &bssvar, &dataSegmentVar,     ((int)&bssvar - (int)&dataSegmentVar));
 23     return 0;
 24 }  
程序运行的结果是:

bssvar:0x6008c0, dataSegmentVar:0x6008ac,gap:20

可以看到dataSegment在BSS segment之下,他们之间的有20个字节的空间也即data segment的分配空间大小是20字节。但是这个大小并不是固定的,如果程序中的静态未初始化变量大于20个字节,那么data segment的空间会相应地增长。


  8 #include <stdio.h>
  9 #include <stdlib.h>                                                                                                                                                              
 10 
 11 int bssvar, bssvar1, bssvar2, bssvar3, bssvar4, bssvar5;
 12 char c;
 13 int dataSegmentVar = 1;
 14 
 15 int main()
 16 {
 17     printf("bssvar:%p, dataSegmentVar:%p,gap:%d", &bssvar, &dataSegmentVar, ((int)&bssvar - (int)&dataSegmentVar));
 18     return 0;
 19 }
程序运行的结果是:

bssvar:0x6008c4, dataSegmentVar:0x6008ac,gap:24


这个时候dataSegment的变量是5个int和一个char,总共的大小是21个字节,而此时dataSegment的大小是24个字节,空间超过20,但是为了对齐,所以不是21而是24。


另外在上图中还有一个值得注意的地方就是program break,这是进程堆的末尾地址。当用户通过malloc函数申请空间的时候,实际就是利用sbrk函数移动program break,使其向上增长,以获得更大的堆空间。所以看起来很神秘的内存申请只不过是移动一个指针而已,哈哈。

不过这只是对简单的原理,里面还有很多细节需要考虑,接下来还是用一段程序来说。

  8 #include <stdio.h>
  9 #include <stdlib.h>
 10 
 11 int main()
 12 {
 13     void* ptr, *ptr1;
 14     ptr = sbrk(0);
 15     printf("sbrk:%p\n", ptr);
 16     ptr1 = malloc(100);
 17     ptr = sbrk(0);
 18     printf("sbrk:%p, ptr1:%p\n", ptr, ptr1);
 19     free(ptr1);
 20     ptr = sbrk(0);
 21     printf("sbrk:%p\n",ptr);
 22 }
~     

程序中首先用sbrk(0)得到堆部分的末尾地址,然后利用malloc申请了一个100字节长度的空间,这个时候再来看堆空间的末尾地址以及所申请的空间的地址。最后,再释放所申请的空间然后再来看堆空间地址。

程序的运行结果:

sbrk:0x2439000

sbrk:0x245a000, ptr1:0x2439010

sbrk:0x245a000

一开始堆区的末尾地址是0x2439000,但是当利用malloc申请完100字节的空间之后,堆区的末尾地址变为了0x245a000,一下子变大了0x21000。另外还值得注意的就是malloc所申请的空间的起始地址是0x2439010,比一开始的堆末尾地址向后移动了16个字节。这个不难理解,每一段内存空间都需要有一些元数据去管理该空间,所以我猜想这16个字节就是用来记录malloc所分配这100个字节空间的信息,包括大小,状态等等。

那么为什么明明只申请了100个字节的空间,program break却向后移动了这么多?这个也不难理解,总不能每次用户申请一段小的空间都去调用一次sbrk吧,这样的开销太大。所以干脆一次性分配一段大空间出来,除了用户所申请的空间之外,剩下的空间可以用于之后的malloc空间申请。来看下一段程序:

  8 #include <stdio.h>
  9 #include <stdlib.h>
 10 
 11 int main()
 12 {
 13     void* ptr, *ptr1;
 14     ptr = sbrk(0);
 15     printf("sbrk:%p\n", ptr);
 16     ptr1 = malloc(100);
 17     ptr = sbrk(0);
 18     printf("sbrk:%p, ptr1:%p\n", ptr, ptr1);
 19     ptr1 = malloc(100);
 20     ptr = sbrk(0);
 21     printf("sbrk:%p, ptr1:%p\n",ptr, ptr1);                                                                                                                                      
 22     free(ptr1);
 23     ptr = sbrk(0);
 24     printf("sbrk:%p\n",ptr);
 25 }

运行结果:

sbrk:0x933000

sbrk:0x954000, ptr1:0x933010

sbrk:0x954000, ptr1:0x933080

sbrk:0x954000

可以看到,尽管通过malloc函数申请了两块100字节的空间,但是program break并未因此而移动两次。另外,第一块空间和第二块空间的地址相差的不是100个字节而是112个字节,究其原因估计还是因为对齐的问题吧。

通过上文的讲解,我们发现,其实malloc也没有这么神秘了,它只不过就是利用sbrk来申请了一段空间罢了。不过除了申请空间之外,还需要管理这些空间才是malloc真正核心的地方。这些问题将在下一篇博文《自己动手写malloc》中详细讲解。

关于sbrk还有brk的用法网上有一大堆,这里就不细讲了,推荐一篇文章吧:点击打开链接


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
嵌入式,linux内存管理
所有段的基地址均为0,由此可以得出,每个段的逻辑地址空间范围为0-4GB。因为每个段的基地址为0,因此,逻辑地址与线性地址保持一致 linux页式管理有四级: 1. 页全局目录 (Page Global Directory):即pgd,是多级页表的抽象最高层。
532 0
Linux 基于IPC机制实现进程间的共享内存处理
今天学习了相关于IPC(InterProcess Communication ,进程间通信)的相关知识。就做个笔记,一来让大家检查一下我的理解方面是不是有错误,二来也为了能让更多的博友们了解到相关的知识吧。
939 0
Linux内存管理-高端内存(二)
在支持MMU的32位处理器平台上,Linux系统中的物理存储空间和虚拟存储空间的地址范围分别都是从0x00000000到0xFFFFFFFF,共4GB,但物理存储空间与虚拟存储空间布局完全不同。Linux运行在虚拟存储空间,并负责把系统中实际存在的远小于4GB的物理内存根据不同需求映射到整个4GB的虚拟存储空间中。
1109 0
linux内存管理--用户空间和内核空间
关于虚拟内存有三点需要注意: 4G的进程地址空间被人为的分为两个部分--用户空间与内核空间。用户空间从0到3G(0xc0000000),内核空间占据3G到4G。用户进程通常情况下只能访问用户空间的虚拟地址,不能访问内核空间的虚拟地址。
728 0
+关注
李牙刷儿
Android开发者&amp;前端菜鸟,专注于跨平台、热修复领域
87
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
OceanBase 入门到实战教程
立即下载
阿里云图数据库GDB,加速开启“图智”未来.ppt
立即下载
实时数仓Hologres技术实战一本通2.0版(下)
立即下载