【精通内核】计算机程序的执行原理深度解析

本文涉及的产品
云解析 DNS,旗舰版 1个月
云解析DNS,个人版 1个月
全局流量管理 GTM,标准版 1个月
简介: 深度解析ELF文件中将内存布局地址,CPU是如何执行指令的,C语言中方法的执行过程的内核调用。

前言

📫作者简介小明java问道之路,专注于研究计算机底层/Java/Liunx 内核,就职于大型金融公司后端高级工程师,擅长交易领域的高安全/可用/并发/性能的架构设计📫

🏆CSDN 专家博主/Java 领域优质创作者、阿里云专家博主、华为云享专家、51CTO 专家博主🏆

🔥如果此文还不错的话,还请👍关注、点赞、收藏三连支持👍一下博主~

本文导读

了解过ELF文件内容,我们知道程序由各种段组成,仅仅了解程序的组成还不够,本讲深入计算机程序(包含C/C++、Java、Python等等)所有语言的执行原理,同时了解在ELF文件中将内存布局地址,CPU是如何执行指令的,C语言中方法的执行过程的内核调用。

一、程序虚拟地址空间布局

在介绍ELF文件内容时,我们知道程由各种段组成,同时在LF件中将内存布地址都已经描述完成。程序读取到内存中后,根据 ELF的描述,决定是否执行动态链接。最后生成的程序布局图如图所示。

网络异常,图片无法展示
|

寻址空间为4GB的内存模型图,这里的地址空间是虚拟地址空间,底层的线性地址分段和物理地址分页,上层是无感知的。可以看到,每个程序的虚拟地址空间最高 1GB 处都是操作系统的内核映射,这是因为不管程序如何映射,都需要一段虚拟地址空间用于映射内核,这样我们才能通过系统调用访问内核。

整个程序包含如下部分

1、text segment 程序代码段

2、data segment 数据段

3、BSS segment 未初始化的数据段

4、 heap 堆区。由低地址往高地址扩张

5、memory mapping region 其实也属于堆区,只不过这一部分可以通过 mmap 来产生映射

6、stack程序运行时需要的栈内存,由高地址往低地址扩张

由于内部数据和函数,均在两个连接库中使用绝对地址所以我们将关注点放在全局数据和函数上。由于代码段 .text ,加载到内存中,OS不允许修改代码段的内容,他只读(保护程序)而对于数据段而言,非 .rodata,其他数据是可读可写的,所以维护表,来存储自己的程序的虚拟地址值。

网络异常,图片无法展示
|

二、CPU执行指令原理

我们了解到一个程序通过gcc编译,经过预处理里、编译、链接等步骤,最终生成了 ELF类型的二进制文件。通过反汇编,我们了解到这些文件其实就是之前学过的汇编语言 mov、sub 等,然后结合操作一系列的寄存器完成了整个执行过程。

本节我们就来探究以下两个问题:

CPU是如何执行指令的?C语言中方法的执行过程?

这里我们通过gdb来调试,并观察整个执行过程。读者需要寄存器。首先通过 gcc -g demo.c 编译源文件,生成 a.out ELF可执行文件。然后通过gdb的断点机制,对main函数打上断点,gdb a.out 。

程序成功地停止在断点处,观察此时的寄存器状态

#include<stdio.h> 
int sum(int a, int b) {
  int c = a + b; 
  return c;
}
int main() {
  int i = sum(3,3); 
  printf("%d",i); 
  return 1;
}

网络异常,图片无法展示
|

重点观察 RIP 和 CS 寄存器,此时的 RIP为0x40054f,CS为0x33。注意,OS 位数为64位,所以这里以R开头。前面介绍的16位为IP,32位为EIP,其他寄存器也是如此。

RIP为0x400537,CS为0x33,RSI和RDI为3,即我们传入的参数。接下来继续执行,此时,RIP为 0x400542,CS为0x33,RSI和RII为3,rax保存了返回值6,EFLAGS变为了 0x206。其实,就是增加了一个PF(奇偶校验位)。可以看到,RIP 的计数和编译后的 ELF 文件地址一样。这就意味着,编译时就确定了虚拟地址的信息,这也正是虚拟地址→线性地址→物理地址映射的魅力。每个程序都认为自己占有整个内存地址,事实上底层由 OS结合硬件来进行段表、页表映射。

从上面的分析过程,我们可以得出以下几点信息。

1、CPU 通过 RIP 来获取指令的地址。

2、C语言程序通过寄存器来传递参数。当然也可以通过栈,如参数太多、寄存器放不下等情况。

3、虚拟地址在 ELF 文件中就已经确定。

4、调用方法的过程中,CS 代表代码段寄存器。启动保护模式后,CS 为段选择子 0x33,可以确定main 函数和sum函数处于同一个段,且变为二进制为110011。段选择子后面的两位代表着4个特权级--0、3。其中,0 代表 OS 特权级,3 用于用户程序,这里正好 11(二进制)为3。同时,第3位表明段信息是 LDT 和 GDT,这里为 0,表明在 GDT 中。其余高13位用于在段描述符表中,作为索引查询段基址。

5、执行方法后,发生了改变,从原来的IF 增加到了 PF、IF。

通过这些观察和结论,我们可以总结CPU如何执行程序的:

首先通过 CS 和 IP 寄存器定位到需要执行的指令,然后执行指令,接着根据执行的结果设置 EFLAGS 寄存器,最后在调用方法时通过寄存器或者栈来传递参数,并且在ELF文件生成时就已经确定了程序的虚拟地址。

三、C语言中方法的执行原理

接下来我们研究C语言方法的执行过程,我们继续用上面的代码,文字解释过于隐晦,我们用一组图,来描述从 main 函数到 sum 函数的调用过程。

#include<stdio.h> 
int sum(int a, int b) {
  int c = a + b; 
  return c;
}
int main() {
  int i = sum(3,3); 
  printf("%d",i); 
  return 1;
}

1、下图,为进入 main 函数、开辟空间并调用月call sum 指令后的状态,因为 call 指令会自动将 call指令的下一条指令压入栈中,所以才通过 rsp 开辟空间。这里一定要注意,push 指令和 pop 指令都是显示操作栈指针rsp的。esi 和 edi 分别是从C函数的右到左开始保存参数,edi为第1个参数3,esi为第2参数3。

网络异常,图片无法展示
|

2、下图,为sum 函数通过操作 rsp 和 rbp 开辟了 sum 函数栈帧的状态。我们可以看到通过将 rsp 和 rbp  设置相等,就得到了一个新的栈,其中 rbp 指向栈底,rsp 指向栈顶。

网络异常,图片无法展示
|

3、下图,为 sum 函数执行完成但没有返回的状态。可以看到,操作栈时并没有通过 rsp 栈指针,而是直接通过 rbp 来执行存取运算的。这是可行的,因为我们不需要开辟栈帧,直接操作rbp即可,通过rbp 将局部变量 3和运算结果放入 sum 函数的栈帧中。其实根本没必要将这些局部变量压栈、出栈,因为我们只是加两个数然后直接返回,但编译器为何这么不聪明呢?答案是没有开启优化。通过gcc-O开启优化后,会发现这些都没了。编译器并不是不聪明,而是太听话,完全按照程序写的逻辑来生成对应代码。例如,看到代码“int c=a+b;”,c是个局部变量量,编译器一定会保存 a+b 的结果。同时,我们看到 eax寄存器 中保存了返回值6

网络异常,图片无法展示
|

4、下图,为sum 函数执行完成后的状态,可以看到,之前 sum 函数栈帧的数据还存在,但这并不响结果。读者可能会想到一个问题,就是野指针。如果我们其他程序用一个未初始化的指针读取值,就有可能读到这些脏值。需要注意的是,函数返回后,我们需要恢复 main 函数的栈帧,该怎么做呢?必然是将之前保存的rbp 地址恢复到 rbp 寄存器中,这时 main 函数栈帧的栈底就设置了。然后将 call指令保存的指令弹出到 rip 寄存中,执行流程就顺利地进入了 call 指令的下一个指令中,即返回 main函数中。

网络异常,图片无法展示
|

5、为main 函数执行后的状态。因为 printf 函数也是 call 指令调用的,所以可以看到之前为什么开辟了 16byte 空间,分别用于保存两个call 指令的下一条指令地址,并且我们复用了 8byte的地址用于临时保存变量6。从汇编代码中可以发现,编译器做了很多我们认为没必要的动作,如返回值入栈、出栈、给 esi 等。再次强调,这不是因为编译器不聪明,而是因为它太听话。读者可以推理,main 函数执行完毕后,通过保存的 rbp 和返回地址,也可以退出 main 的栈帧。

网络异常,图片无法展示
|

小结:这个过程很烦琐,读者只需要知道以下几点即可

一、C语言的方法调用,就是保存返回地址,通过操作 rsp 和 rbp开辟栈帧。

二、参数可以通过 esi和edi 寄存器传递。

三、返回值放在 eax寄存器中。

四、Call指令会自动地将下一条指令压入程序栈中。

五、Ret指令自动将 call 压入的返回地址弹出放入 rip 寄存器中,从而达到函数的 return。

总结

我们知道程序由各种段组成,了解在ELF文件中将内存布局地址,CPU通过寄存器执行指令的,C语言中方法的执行过程,就是CPU操作寄存器的过程。同时我们还需要理解C语言的方法调用,就是保存返回地址,通过操作 rsp 和 rbp开辟栈帧。 参数可以通过 esi和edi 寄存器传递。返回值放在 eax寄存器中。 Call指令会自动地将下一条指令压入程序栈中。 Ret指令自动将 call 压入的返回地址弹出放入 rip 寄存器中,从而达到函数的 return。

相关文章
|
7天前
|
Java 应用服务中间件 Spring
解析Spring Boot自动装配的原理与机制
解析Spring Boot自动装配的原理与机制
17 4
|
1天前
|
存储 缓存 JavaScript
【前端 - Vue】之 Keep-Alive缓存组件使用语法及原理解析,超详细!
【前端 - Vue】之 Keep-Alive缓存组件使用语法及原理解析,超详细!
|
2天前
|
分布式计算 DataWorks 大数据
MaxCompute操作报错合集之pyodps3的报错信息里,报了程序的解析错误,是什么导致的
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
5天前
|
算法
[白话解析] 深入浅出一致性Hash原理
[白话解析] 深入浅出一致性Hash原理
|
6天前
|
Java Spring
我是如何做到springboot自动配置原理解析
我是如何做到springboot自动配置原理解析
|
6天前
|
缓存 安全 Java
【权限管理系统】Spring security(三)---认证过程(原理解析,demo)
【权限管理系统】Spring security(三)---认证过程(原理解析,demo)
|
6天前
|
机器学习/深度学习 算法 数据可视化
决策树算法:从原理到实践的深度解析
决策树算法:从原理到实践的深度解析
12 0
|
7天前
|
Java Spring
深入解析Spring源码,揭示JDK动态代理的工作原理。
深入解析Spring源码,揭示JDK动态代理的工作原理。
10 0
|
5天前
|
机器学习/深度学习 缓存 算法
netty源码解解析(4.0)-25 ByteBuf内存池:PoolArena-PoolChunk
netty源码解解析(4.0)-25 ByteBuf内存池:PoolArena-PoolChunk
|
7天前
|
XML Java 数据格式
深度解析 Spring 源码:从 BeanDefinition 源码探索 Bean 的本质
深度解析 Spring 源码:从 BeanDefinition 源码探索 Bean 的本质
17 3

推荐镜像

更多