前言
本篇文章来讲解一个.c文件生成一个可执行文件的完整过程,我们学习了那么久,只知道在编译器中按下编译运行就可以将一个.c文件运行起来了,但是我们并不了解其中的具体步骤,那么下面我将会在Linux环境下给大家演示一下具体的操作。
生成一个可执行文件一共包括下面4个步骤:
1.预处理
2.编译
3.汇编
4.链接
这里首先准备一个程序:
#include <stdio.h> #define PI 3.14 int main(void) { printf("PI :%d\n", PI); return 0; }
一、预处理
预处理是程序编译的第一个阶段。在这个阶段,预处理器会执行一系列的预处理指令,例如宏展开、头文件包含等操作,将源代码转换为被编译器处理的形式。预处理器根据以#为前缀的指令对源代码进行处理,然后生成一个被修改过的临时文件。
在Linux下使用 gcc -E -o test1.i test1.c这个命令来生成一个预处理后的.i文件:
test.i内容:
这里大家可以看到有非常多的各种函数,而且我们的PI也被直接替换成了3.14。这就印证了我们上面说的:预处理器会进行宏展开和头文件包含的这些操作了。
二、编译
编译是程序编译的第二个阶段,也是最核心的阶段。在这个阶段,编译器会将预处理后的源代码转换为汇编语言(Assembly Language)或者直接转换为机器代码。编译器会进行语法和语义分析,生成中间表示(Intermediate Representation)以及对应的目标文件(Object File)。
在Linux下使用gcc -S -o test1.s test1.i命令生成对应的.s文件:
test1.s文件内容:
可以看到这里生成了对应的汇编语言:
.file "test1.c" .text .section .rodata .LC1: .string "PI :%d\n" .text .globl main .type main, @function main: .LFB0: .cfi_startproc pushq %rbp .cfi_def_cfa_offset 16 .cfi_offset 6, -16 movq %rsp, %rbp .cfi_def_cfa_register 6 subq $16, %rsp movq .LC0(%rip), %rax movq %rax, -8(%rbp) movsd -8(%rbp), %xmm0 leaq .LC1(%rip), %rdi movl $1, %eax call printf@PLT movl $0, %eax leave .cfi_def_cfa 7, 8 ret .cfi_endproc .LFE0: .size main, .-main .section .rodata .align 8 .LC0: .long 1374389535 .long 1074339512 .ident "GCC: (Ubuntu 7.5.0-3ubuntu1~18.04) 7.5.0" .section .note.GNU-stack,"",@progbits
三、汇编
汇编是程序编译的第三个阶段。在这个阶段,汇编器会将上一步生成的目标文件转化为机器代码指令。它利用汇编语言来描述指令的操作和操作数,并将其转化为可以由计算机直接执行的二进制形式。
在Linux下使用gcc -c -o test1.o test1.s 命令来生成对应的.o文件:
这里可以看到生成的文件是二进制的文件,所以这里我们无法查看:
四、链接
链接是程序编译的最后一个阶段。在这个阶段,链接器将多个目标文件、库文件以及系统提供的运行时支持代码(Runtime Support Code)合并在一起,生成最终的可执行文件。链接器解决了符号引用和符号定义之间的关联问题。它会检查目标文件中的符号表,并确保所有的符号被正确引用和定义,以及解决函数和变量的地址关联。
在Linux下使用gcc -o test1 test1.c命令来生成最后的可执行文件:
总结
预处理阶段通过宏展开和头文件包含等操作修改源代码。编译阶段将源代码转换为汇编语言或机器代码。汇编阶段将汇编语言转换为机器代码指令。链接阶段将目标文件和运行时支持代码合并生成最终的可执行文件。通过这一系列的处理过程,源代码最终被转换为计算机可以执行的机器代码。