在Linux系统中,一个应用程序从开始执行到main
函数被调用之间经历了多个复杂的步骤。以下是一个详细的流程概述:
1. 加载器(Loader)
当用户在终端或脚本中启动一个程序时,shell调用系统调用execve
。这个系统调用将负责启动程序的执行。
2. 内核态操作
内核处理execve
系统调用并执行以下操作:
- 可执行文件查找:内核找到并验证要执行的可执行文件。
- 文件读取:读取ELF(Executable and Linkable Format)可执行文件头,以获取程序入口点、程序头表等。
3. 创建进程环境
- 创建新进程:内核为新进程分配资源,如进程控制块(PCB)、内存空间等。
- 加载程序段:根据ELF文件的程序头表,内核将可执行文件的各个段(如代码段、数据段)加载到新进程的地址空间。
- 设置堆栈:为进程分配用户栈,并将命令行参数和环境变量拷贝到用户栈上。
- 动态链接器:如果程序是动态链接的,内核会加载动态链接器(ld-linux.so),并将控制权移交给它。
4. 动态链接器(Dynamic Linker/Loader)
如果程序是动态链接的,动态链接器将执行以下步骤:
- 解析符号:解析并加载所需的共享库,满足所有未定义的符号。
- 重定位:修改程序中的地址引用,使其指向正确的内存地址。
- 初始化函数:执行共享库中的初始化代码(如
.init
段中的代码),通常通过调用构造函数(constructor)。
5. 用户态准备
在动态链接器完成工作后,程序的控制权会传递给程序的入口点(通常是 _start
函数)。
6. C运行时(C Runtime, CRT)初始化
程序的入口点 _start
通常是由C运行时库提供的启动代码。它完成以下操作:
- 堆栈和全局数据初始化:设置堆栈指针,初始化全局变量和静态变量。
- 调用程序初始化函数:执行编译器生成的初始化函数(如
.init_array
数组中的函数)。 - 准备参数:将命令行参数和环境变量传递给
main
函数。
7. 调用 main
完成所有初始化步骤后,CRT代码调用 main
函数,开始执行用户定义的程序逻辑。
具体步骤的示例代码
下面是一些伪代码,描述了从 _start
到 main
的执行过程:
.section .text
.globl _start
_start:
# 设置栈指针
# 初始化堆栈、全局变量等
call __libc_start_main
__libc_start_main:
# 初始化C运行时环境
# 调用全局和静态构造函数
call init_functions
# 调用用户定义的main函数
call main
# main函数返回后调用退出处理函数
call exit
小结
综上所述,从Linux系统下启动一个应用程序到调用main
函数,需要经过以下主要步骤:
- 加载器处理
execve
系统调用,加载程序到内存。 - 内核创建进程环境,加载程序段和动态链接器。
- 动态链接器解析符号,加载共享库,执行初始化代码。
- C运行时库初始化,设置堆栈和全局数据,准备
main
函数的参数。 - 最后调用
main
函数,开始执行用户程序逻辑。
每个步骤都涉及复杂的底层操作,确保程序能够正确加载并运行。