gdb反汇编详解C函数底层实现笔记(程序堆栈、内存分配)

简介: 以下是在读《深入理解计算机系统》前面的章节“程序的机器级表示”时,自己动手在linux上使用了gdb对一个简单的C程序进行反汇编,通过不懈的努力终于查清楚弄明白了绝大多数的语句。
以下是在读《深入理解计算机系统》前面的章节“程序的机器级表示”时,自己动手在linux上使用了gdb对一个简单的C程序进行反汇编,通过不懈的努力终于查清楚弄明白了绝大多数的语句。且均以注释的形式列在汇编语句后面。

      所有这些注释大概花了整整一天时间,不过还好,感觉对于C程序的机器级实现终于算是有了一个比较透彻的理解,对于以前编译出现的有些bug的原因有了一种原来如此的感慨。感觉这段代码及注释对自己或者大家都可能有用,所以稍作整理放于此:

 

说明:
反汇编指令使用的是:gdb disas [function-name]。另外也可以使用:objdump -d/-D obj-name对整个程序进行反汇编(通过这个反汇编,你可以发现main函数并非一个程序的入口而是__start函数!)。

 

程序很简单,就两个函数:sum和main,源码如下:
#include<stdio.h>

int sum(int x, int y)
{
 int accum = 0; 
 int t;
 t = x + y;
 accum += t;
 return accum;
}

int main( int argc, char **argv)
{
   int x = 1, y = 2;
   int result = sum( x, y );
   printf("\n\n     result = %d \n\n", result);
   return 0;
}

编译源程序,不使用优化选项并反汇编分析:

gcc -o test test.c得到test
gdb test
(gdb) disas sum
(gdb) disas main
查看反汇编后的代码
Dump of assembler code for function sum:
0x08048354 <sum+0>:     push   %ebp  //esp <- esp-4
0x08048355 <sum+1>:     mov    %esp,%ebp
0x08048357 <sum+3>:     sub    $0x10,%esp
0x0804835a <sum+6>:     movl   $0x0,0xfffffff8(%ebp)   //accum = 0
0x08048361 <sum+13>:    mov    0xc(%ebp),%eax    //gotcha! ^_^
0x08048364 <sum+16>:    add    0x8(%ebp),%eax    // x + y
0x08048367 <sum+19>:    mov    %eax,0xfffffffc(%ebp)  // t = x + y
0x0804836a <sum+22>:    mov    0xfffffffc(%ebp),%eax 
0x0804836d <sum+25>:    add    %eax,0xfffffff8(%ebp)  // accum = accum + t
0x08048370 <sum+28>:    mov    0xfffffff8(%ebp),%eax // 返回值是放在eax中的
0x08048373 <sum+31>:    leave  //恢复父函数的堆栈框指针:esp<-ebp, pop ebp,在地址上的表现就是堆栈顶底均回到之前的地方!
0x08048374 <sum+32>:    ret     //函数返回,回到上级调用:pop eip?

main函数反汇编结果:
0x08048375 <main+0>:    lea    0x4(%esp),%ecx
0x08048379 <main+4>:    and    $0xfffffff0,%esp //使栈地址16字节对齐!这里也说明了栈向下(低地址)生长的优点了:地址对齐操作总是是esp指向当前位置的下方!(lihux自己悟出的^_^)
0x0804837c <main+7>:    pushl  0xfffffffc(%ecx)
0x0804837f <main+10>:   push   %ebp   //保存main之前函数的栈基址
//pushl push都使用了的原因:当要压栈的对象已经确定(也就是说已经知道是字节、字或者双字),那么使用push就不会产生歧义,也就是说汇编器可以自己判断自己要操作的是什么长度的操作对象;但是当汇编器不能自己判断操作对象长度时,就需要使用pushl之类的指令来指明操作对象长度(类似的还有mov,movl;lea,leal等);
上面的%ebp指的是esp寄存器吧,这是一个32位的寄存器,汇编器是知道这个寄存器存放的是dworld,不需要显式的指明也没有歧义;而 0xfffffffc(%ecx)是使用基址寻址方式指向的一个内存空间,内存是连续的,汇编器不能仅仅根据一个内存地址就判断出那里存放的数据的长度,所以直接这样写就会产生歧义,所以要使用pushl之类的指令来指明要操作的数据的长度;
0x08048380 <main+11>:   mov    %esp,%ebp  //在main之前函数的栈下方建main的栈,基址给ebp
0x08048382 <main+13>:   push   %ecx
0x08048383 <main+14>:   sub    $0x24,%esp  //栈顶指针下移24,以留作main函数用?是的!^_^。关于栈对齐问题:可以看到,在<main+4>执行时完毕之后栈顶指针esp已经16字节对齐,而在执行到当前<main+14>指令前,又进行了三次压栈操作,每次四字节,共12字节,所以这里用0x24,这样,又重新使esp16字节对齐了(同时还必须保证分配的空间不小于main函数需要存放局部变量的空间^_^)。
0x08048386 <main+17>:   movl   $0x1,0xfffffff0(%ebp)  //主函数实参存放于内存的最高处,x = 1
0x0804838d <main+24>:   movl   $0x2,0xfffffff4(%ebp) //y = 2
0x08048394 <main+31>:   mov    0xfffffff4(%ebp),%eax
0x08048397 <main+34>:   mov    %eax,0x4(%esp)           //x的形参存入Mem本地空间,供子函数调用
0x0804839b <main+38>:   mov    0xfffffff0(%ebp),%eax
0x0804839e <main+41>:   mov    %eax,(%esp)           //由此可以看出:调用函数sum之前,需先将形参放到栈顶!
0x080483a1 <main+44>:   call   0x8048354 <sum>  //call调用,先将下一条命令的地址压入堆栈,所以esp<- esp-4
0x080483a6 <main+49>:   mov    %eax,0xfffffff8(%ebp) //result = sum(x,y),返回值在eax中
0x080483a9 <main+52>:   mov    0xfffffff8(%ebp),%eax
0x080483ac <main+55>:   mov    %eax,0x4(%esp)
0x080483b0 <main+59>:   movl   $0x80484a0,(%esp)  //字符串地址
0x080483b7 <main+66>:   call   0x8048298 <>
0x080483bc <main+71>:   mov    $0x0,%eax
0x080483c1 <main+76>:   add    $0x24,%esp   //?何为
0x080483c4 <main+79>:   pop    %ecx
0x080483c5 <main+80>:   pop    %ebp
0x080483c6 <main+81>:   lea    0xfffffffc(%ecx),%esp
0x080483c9 <main+84>:   ret   
0x080483ca <main+85>:   nop   
0x080483cb <main+86>:   nop   
0x080483cc <main+87>:   nop   
0x080483cd <main+88>:   nop   
0x080483ce <main+89>:   nop   
0x080483cf <main+90>:   nop  

 

编译源程序,使用 -O1 优化选项并反汇编分析:

使用 -O1优化后的程序反汇编后的结果:可见优化主要在减少了存取内存的次数,节省了内存空间
Dump of assembler code for function sum:
0x08048354 <sum+0>:     push   %ebp
0x08048355 <sum+1>:     mov    %esp,%ebp
0x08048357 <sum+3>:     mov    0xc(%ebp),%eax
0x0804835a <sum+6>:     add    0x8(%ebp),%eax
0x0804835d <sum+9>:     pop    %ebp
0x0804835e <sum+10>:    ret   
End of assembler dump.

Dump of assembler code for function main:
0x0804835f <main+0>:    lea    0x4(%esp),%ecx
0x08048363 <main+4>:    and    $0xfffffff0,%esp
0x08048366 <main+7>:    pushl  0xfffffffc(%ecx)
0x08048369 <main+10>:   push   %ebp
0x0804836a <main+11>:   mov    %esp,%ebp
0x0804836c <main+13>:   push   %ecx
0x0804836d <main+14>:   sub    $0x14,%esp   //可见优化后的程序自身预留空间也减少了。
0x08048370 <main+17>:   movl   $0x2,0x4(%esp)
0x08048378 <main+25>:   movl   $0x1,(%esp)
0x0804837f <main+32>:   call   0x8048354 <sum>
0x08048384 <main+37>:   mov    %eax,0x4(%esp)
0x08048388 <main+41>:   movl   $0x8048480,(%esp)
0x0804838f <main+48>:   call   0x8048298 <>
0x08048394 <main+53>:   mov    $0x0,%eax
0x08048399 <main+58>:   add    $0x14,%esp
0x0804839c <main+61>:   pop    %ecx
0x0804839d <main+62>:   pop    %ebp
0x0804839e <main+63>:   lea    0xfffffffc(%ecx),%esp
0x080483a1 <main+66>:   ret   
0x080483a2 <main+67>:   nop   
0x080483a3 <main+68>:   nop   
0x080483a4 <main+69>:   nop

 

编译源程序,使用优化选项 -O2并反汇编分析:

使用 -O2优化后的程序反汇编后的结果:可见较-O1级优化又有大幅的缩短(代码长度)
Dump of assembler code for function sum:
   0x08048410 <+0>: push   %ebp
   0x08048411 <+1>: mov    %esp,%ebp
   0x08048413 <+3>: mov    0xc(%ebp),%eax
   0x08048416 <+6>: add    0x8(%ebp),%eax
   0x08048419 <+9>: pop    %ebp
   0x0804841a <+10>: ret   
End of assembler dump.

Dump of assembler code for function main:
   0x08048420 <+0>: push   %ebp
   0x08048421 <+1>: mov    %esp,%ebp
   0x08048423 <+3>: and    $0xfffffff0,%esp
   0x08048426 <+6>: sub    $0x10,%esp
   0x08048429 <+9>: movl   $0x3,0x8(%esp)   //我晕:这优化的也太厉害了吧:直接计算出了1+2=3!
   0x08048431 <+17>: movl   $0x8048510,0x4(%esp)
   0x08048439 <+25>: movl   $0x1,(%esp)
   0x08048440 <+32>: call   0x804832c <>
   0x08048445 <+37>: xor    %eax,%eax   //因为IA32中xor 比 mov 速度快!
   0x08048447 <+39>: leave 
   0x08048448 <+40>: ret   

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
10天前
10分钟让你学会内存函数:memcpy,memmove,memset,memcmp的用法及模拟实现。
10分钟让你学会内存函数:memcpy,memmove,memset,memcmp的用法及模拟实现。
12 2
|
7天前
|
C语言
【C语言】:动态内存管理函数malloc,calloc,realloc和free的介绍的介绍
【C语言】:动态内存管理函数malloc,calloc,realloc和free的介绍的介绍
18 0
|
7天前
|
存储 Java C++
Java虚拟机(JVM)在执行Java程序时,会将其管理的内存划分为几个不同的区域
【6月更文挑战第24天】Java JVM管理内存分7区:程序计数器记录线程执行位置;虚拟机栈处理方法调用,每个线程有独立栈;本地方法栈服务native方法;Java堆存储所有对象实例,垃圾回收管理;方法区(在Java 8后变为元空间)存储类信息;运行时常量池存储常量;直接内存不属于JVM规范,通过`java.nio`手动管理,不受GC直接影响。
18 5
|
7天前
|
算法 Java
垃圾回收机制(Garbage Collection,GC)是Java语言的一个重要特性,它自动管理程序运行过程中不再使用的内存空间。
【6月更文挑战第24天】Java的GC自动回收不再使用的内存,关注堆中的对象。通过标记-清除、复制、压缩和分代等算法识别无用对象。GC分为Minor、Major和Full类型,针对年轻代、老年代或整个堆进行回收。性能优化涉及算法选择和参数调整。
19 3
|
11天前
|
C语言
字符串和内存函数(1)
字符串和内存函数(1)
25 7
|
7天前
|
C语言
【C语言】:4大内存函数
【C语言】:4大内存函数
11 2
|
7天前
|
存储 Java C++
Java虚拟机(JVM)管理内存划分为多个区域:程序计数器记录线程执行位置;虚拟机栈存储线程私有数据
Java虚拟机(JVM)管理内存划分为多个区域:程序计数器记录线程执行位置;虚拟机栈存储线程私有数据,如局部变量和操作数;本地方法栈支持native方法;堆存放所有线程的对象实例,由垃圾回收管理;方法区(在Java 8后变为元空间)存储类信息和常量;运行时常量池是方法区一部分,保存符号引用和常量;直接内存非JVM规范定义,手动管理,通过Buffer类使用。Java 8后,永久代被元空间取代,G1成为默认GC。
19 2
|
11天前
字符串和内存函数(2)
字符串和内存函数(2)
23 5
|
11天前
|
监控 算法 Java
Java虚拟机(JVM)使用多种垃圾回收算法来管理内存,以确保程序运行时不会因为内存不足而崩溃。
【6月更文挑战第20天】Java JVM运用多种GC算法,如标记-清除、复制、标记-压缩、分代收集、增量收集、并行收集和并发标记,以自动化内存管理,防止因内存耗尽导致的程序崩溃。这些算法各有优劣,适应不同的性能和资源需求。垃圾回收旨在避免手动内存管理,简化编程。当遇到内存泄漏,可以借助VisualVM、JConsole或MAT等工具监测内存、生成堆转储,分析引用链并定位泄漏源,从而解决问题。
24 4
|
12天前
|
编译器
程序的内存模型\栈区
程序的内存模型\栈区
19 4