【精通内核】计算机程序的执行原理深度解析

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
简介: 深度解析ELF文件中将内存布局地址,CPU是如何执行指令的,C语言中方法的执行过程的内核调用。

前言

📫作者简介小明java问道之路,专注于研究计算机底层/Java/Liunx 内核,就职于大型金融公司后端高级工程师,擅长交易领域的高安全/可用/并发/性能的架构设计📫

🏆CSDN 专家博主/Java 领域优质创作者、阿里云专家博主、华为云享专家、51CTO 专家博主🏆

🔥如果此文还不错的话,还请👍关注、点赞、收藏三连支持👍一下博主~

本文导读

了解过ELF文件内容,我们知道程序由各种段组成,仅仅了解程序的组成还不够,本讲深入计算机程序(包含C/C++、Java、Python等等)所有语言的执行原理,同时了解在ELF文件中将内存布局地址,CPU是如何执行指令的,C语言中方法的执行过程的内核调用。

一、程序虚拟地址空间布局

在介绍ELF文件内容时,我们知道程由各种段组成,同时在LF件中将内存布地址都已经描述完成。程序读取到内存中后,根据 ELF的描述,决定是否执行动态链接。最后生成的程序布局图如图所示。

网络异常,图片无法展示
|

寻址空间为4GB的内存模型图,这里的地址空间是虚拟地址空间,底层的线性地址分段和物理地址分页,上层是无感知的。可以看到,每个程序的虚拟地址空间最高 1GB 处都是操作系统的内核映射,这是因为不管程序如何映射,都需要一段虚拟地址空间用于映射内核,这样我们才能通过系统调用访问内核。

整个程序包含如下部分

1、text segment 程序代码段

2、data segment 数据段

3、BSS segment 未初始化的数据段

4、 heap 堆区。由低地址往高地址扩张

5、memory mapping region 其实也属于堆区,只不过这一部分可以通过 mmap 来产生映射

6、stack程序运行时需要的栈内存,由高地址往低地址扩张

由于内部数据和函数,均在两个连接库中使用绝对地址所以我们将关注点放在全局数据和函数上。由于代码段 .text ,加载到内存中,OS不允许修改代码段的内容,他只读(保护程序)而对于数据段而言,非 .rodata,其他数据是可读可写的,所以维护表,来存储自己的程序的虚拟地址值。

网络异常,图片无法展示
|

二、CPU执行指令原理

我们了解到一个程序通过gcc编译,经过预处理里、编译、链接等步骤,最终生成了 ELF类型的二进制文件。通过反汇编,我们了解到这些文件其实就是之前学过的汇编语言 mov、sub 等,然后结合操作一系列的寄存器完成了整个执行过程。

本节我们就来探究以下两个问题:

CPU是如何执行指令的?C语言中方法的执行过程?

这里我们通过gdb来调试,并观察整个执行过程。读者需要寄存器。首先通过 gcc -g demo.c 编译源文件,生成 a.out ELF可执行文件。然后通过gdb的断点机制,对main函数打上断点,gdb a.out 。

程序成功地停止在断点处,观察此时的寄存器状态

#include<stdio.h> 
int sum(int a, int b) {
  int c = a + b; 
  return c;
}
int main() {
  int i = sum(3,3); 
  printf("%d",i); 
  return 1;
}

网络异常,图片无法展示
|

重点观察 RIP 和 CS 寄存器,此时的 RIP为0x40054f,CS为0x33。注意,OS 位数为64位,所以这里以R开头。前面介绍的16位为IP,32位为EIP,其他寄存器也是如此。

RIP为0x400537,CS为0x33,RSI和RDI为3,即我们传入的参数。接下来继续执行,此时,RIP为 0x400542,CS为0x33,RSI和RII为3,rax保存了返回值6,EFLAGS变为了 0x206。其实,就是增加了一个PF(奇偶校验位)。可以看到,RIP 的计数和编译后的 ELF 文件地址一样。这就意味着,编译时就确定了虚拟地址的信息,这也正是虚拟地址→线性地址→物理地址映射的魅力。每个程序都认为自己占有整个内存地址,事实上底层由 OS结合硬件来进行段表、页表映射。

从上面的分析过程,我们可以得出以下几点信息。

1、CPU 通过 RIP 来获取指令的地址。

2、C语言程序通过寄存器来传递参数。当然也可以通过栈,如参数太多、寄存器放不下等情况。

3、虚拟地址在 ELF 文件中就已经确定。

4、调用方法的过程中,CS 代表代码段寄存器。启动保护模式后,CS 为段选择子 0x33,可以确定main 函数和sum函数处于同一个段,且变为二进制为110011。段选择子后面的两位代表着4个特权级--0、3。其中,0 代表 OS 特权级,3 用于用户程序,这里正好 11(二进制)为3。同时,第3位表明段信息是 LDT 和 GDT,这里为 0,表明在 GDT 中。其余高13位用于在段描述符表中,作为索引查询段基址。

5、执行方法后,发生了改变,从原来的IF 增加到了 PF、IF。

通过这些观察和结论,我们可以总结CPU如何执行程序的:

首先通过 CS 和 IP 寄存器定位到需要执行的指令,然后执行指令,接着根据执行的结果设置 EFLAGS 寄存器,最后在调用方法时通过寄存器或者栈来传递参数,并且在ELF文件生成时就已经确定了程序的虚拟地址。

三、C语言中方法的执行原理

接下来我们研究C语言方法的执行过程,我们继续用上面的代码,文字解释过于隐晦,我们用一组图,来描述从 main 函数到 sum 函数的调用过程。

#include<stdio.h> 
int sum(int a, int b) {
  int c = a + b; 
  return c;
}
int main() {
  int i = sum(3,3); 
  printf("%d",i); 
  return 1;
}

1、下图,为进入 main 函数、开辟空间并调用月call sum 指令后的状态,因为 call 指令会自动将 call指令的下一条指令压入栈中,所以才通过 rsp 开辟空间。这里一定要注意,push 指令和 pop 指令都是显示操作栈指针rsp的。esi 和 edi 分别是从C函数的右到左开始保存参数,edi为第1个参数3,esi为第2参数3。

网络异常,图片无法展示
|

2、下图,为sum 函数通过操作 rsp 和 rbp 开辟了 sum 函数栈帧的状态。我们可以看到通过将 rsp 和 rbp  设置相等,就得到了一个新的栈,其中 rbp 指向栈底,rsp 指向栈顶。

网络异常,图片无法展示
|

3、下图,为 sum 函数执行完成但没有返回的状态。可以看到,操作栈时并没有通过 rsp 栈指针,而是直接通过 rbp 来执行存取运算的。这是可行的,因为我们不需要开辟栈帧,直接操作rbp即可,通过rbp 将局部变量 3和运算结果放入 sum 函数的栈帧中。其实根本没必要将这些局部变量压栈、出栈,因为我们只是加两个数然后直接返回,但编译器为何这么不聪明呢?答案是没有开启优化。通过gcc-O开启优化后,会发现这些都没了。编译器并不是不聪明,而是太听话,完全按照程序写的逻辑来生成对应代码。例如,看到代码“int c=a+b;”,c是个局部变量量,编译器一定会保存 a+b 的结果。同时,我们看到 eax寄存器 中保存了返回值6

网络异常,图片无法展示
|

4、下图,为sum 函数执行完成后的状态,可以看到,之前 sum 函数栈帧的数据还存在,但这并不响结果。读者可能会想到一个问题,就是野指针。如果我们其他程序用一个未初始化的指针读取值,就有可能读到这些脏值。需要注意的是,函数返回后,我们需要恢复 main 函数的栈帧,该怎么做呢?必然是将之前保存的rbp 地址恢复到 rbp 寄存器中,这时 main 函数栈帧的栈底就设置了。然后将 call指令保存的指令弹出到 rip 寄存中,执行流程就顺利地进入了 call 指令的下一个指令中,即返回 main函数中。

网络异常,图片无法展示
|

5、为main 函数执行后的状态。因为 printf 函数也是 call 指令调用的,所以可以看到之前为什么开辟了 16byte 空间,分别用于保存两个call 指令的下一条指令地址,并且我们复用了 8byte的地址用于临时保存变量6。从汇编代码中可以发现,编译器做了很多我们认为没必要的动作,如返回值入栈、出栈、给 esi 等。再次强调,这不是因为编译器不聪明,而是因为它太听话。读者可以推理,main 函数执行完毕后,通过保存的 rbp 和返回地址,也可以退出 main 的栈帧。

网络异常,图片无法展示
|

小结:这个过程很烦琐,读者只需要知道以下几点即可

一、C语言的方法调用,就是保存返回地址,通过操作 rsp 和 rbp开辟栈帧。

二、参数可以通过 esi和edi 寄存器传递。

三、返回值放在 eax寄存器中。

四、Call指令会自动地将下一条指令压入程序栈中。

五、Ret指令自动将 call 压入的返回地址弹出放入 rip 寄存器中,从而达到函数的 return。

总结

我们知道程序由各种段组成,了解在ELF文件中将内存布局地址,CPU通过寄存器执行指令的,C语言中方法的执行过程,就是CPU操作寄存器的过程。同时我们还需要理解C语言的方法调用,就是保存返回地址,通过操作 rsp 和 rbp开辟栈帧。 参数可以通过 esi和edi 寄存器传递。返回值放在 eax寄存器中。 Call指令会自动地将下一条指令压入程序栈中。 Ret指令自动将 call 压入的返回地址弹出放入 rip 寄存器中,从而达到函数的 return。

相关文章
|
6天前
|
存储 资源调度 算法
操作系统的心脏:内核深入解析
本文将带你走进操作系统的核心—内核,通过浅显易懂的语言解释什么是内核、它如何工作以及为什么它对整个系统至关重要。我们将从内核的定义和功能出发,逐步深入到它的结构和设计哲学,最后探讨内核在现代计算环境中面临的挑战和未来发展方向。无论你是计算机新手还是有一定基础的学习者,这篇文章都会为你揭开操作系统内核的神秘面纱。
|
9天前
|
域名解析 网络协议
DNS服务工作原理
文章详细介绍了DNS服务的工作原理,包括FQDN的概念、名称解析过程、DNS域名分级策略、根服务器的作用、DNS解析流程中的递归查询和迭代查询,以及为何有时基于IP能访问而基于域名不能访问的原因。
21 2
|
4天前
|
人工智能 并行计算 安全
探索操作系统的心脏:内核深度解析
在数字世界的每一次跳动中,都能感受到一个强大而隐形的力量在默默支撑着一切——这就是操作系统的内核。本文将带你走进这个神秘而又强大的核心世界,从内核的设计哲学到它的架构布局,再到它如何与硬件、软件协同工作,以及面对现代挑战时的应对策略。我们将一起探索那些让操作系统能够高效、安全运行的秘密,解锁内核的奥秘,理解它对整个计算生态的重要性。准备好跟随我们的脚步,深入操作系统的核心,一窥究竟吧!
18 0
|
5天前
|
负载均衡 网络协议 安全
DNS解析中的Anycast技术:原理与优势
【9月更文挑战第7天】在互联网体系中,域名系统(DNS)将域名转换为IP地址,但网络规模的扩张使DNS解析面临高效、稳定与安全挑战。Anycast技术应运而生,通过将同一IP地址分配给多个地理分布的服务器,并依据网络状况自动选择最近且负载低的服务器响应查询请求,提升了DNS解析速度与效率,实现负载均衡,缓解DDoS攻击,增强系统高可用性。此技术利用动态路由协议如BGP实现,未来在网络发展中将扮演重要角色。
25 0
|
11天前
|
前端开发 Java UED
瞬间变身高手!JSF 与 Ajax 强强联手,打造极致用户体验的富客户端应用,让你的应用焕然一新!
【8月更文挑战第31天】JavaServer Faces (JSF) 是 Java EE 标准的一部分,常用于构建企业级 Web 应用。传统 JSF 应用采用全页面刷新方式,可能影响用户体验。通过集成 Ajax 技术,可以显著提升应用的响应速度和交互性。本文详细介绍如何在 JSF 应用中使用 Ajax 构建富客户端应用,并通过具体示例展示 Ajax 在 JSF 中的应用。首先,确保安装 JDK 和支持 Java EE 的应用服务器(如 Apache Tomcat 或 WildFly)。
23 0
|
11天前
|
Java Spring
🔥JSF 与 Spring 强强联手:打造高效、灵活的 Web 应用新标杆!💪 你还不知道吗?
【8月更文挑战第31天】JavaServer Faces(JSF)与 Spring 框架是常用的 Java Web 技术。本文介绍如何整合两者,发挥各自优势,构建高效灵活的 Web 应用。首先通过 `web.xml` 和 `ContextLoaderListener` 配置 Spring 上下文,在 `applicationContext.xml` 定义 Bean。接着使用 `@Autowired` 将 Spring 管理的 Bean 注入到 JSF 管理的 Bean 中。
25 0
|
13天前
|
监控 网络协议 Java
Tomcat源码解析】整体架构组成及核心组件
Tomcat,原名Catalina,是一款优雅轻盈的Web服务器,自4.x版本起扩展了JSP、EL等功能,超越了单纯的Servlet容器范畴。Servlet是Sun公司为Java编程Web应用制定的规范,Tomcat作为Servlet容器,负责构建Request与Response对象,并执行业务逻辑。
Tomcat源码解析】整体架构组成及核心组件
|
1月前
|
存储 NoSQL Redis
redis 6源码解析之 object
redis 6源码解析之 object
52 6
|
2天前
|
开发工具
Flutter-AnimatedWidget组件源码解析
Flutter-AnimatedWidget组件源码解析
|
20天前
|
测试技术 Python
python自动化测试中装饰器@ddt与@data源码深入解析
综上所述,使用 `@ddt`和 `@data`可以大大简化写作测试用例的过程,让我们能专注于测试逻辑的本身,而无需编写重复的测试方法。通过讲解了 `@ddt`和 `@data`源码的关键部分,我们可以更深入地理解其背后的工作原理。
18 1

热门文章

最新文章

推荐镜像

更多