前言
程序环境是什么?我们都 "经历" 过,但不曾感知到 "他" 的存在。我们其实在不知不觉中早就已经接触到了程序环境…… 第一次创建了一个文件(test.c),敲下那句 "hello world" 随后保存后点击运行后编译出可执行文件(test.exe)时,其实就已经接触到了 "他" 了。
我们只是按下了运行,然后好像所有东西都像变魔术一样直接就产生了,这一切都似乎是理所当然的事。但是你是否思考过他是如何变成 "可执行程序" 的呢?在这一章,我们将简单地探讨一个 "源程序"是如何变成 "可执行程序" 的,作一个大概了解。
一、翻译环境和执行环境
0x00 ANSI C 标准
ANSI C是由美国国家标准协会(ANSI)及国际化标准组织(ISO)推出的关于C语言的标准。ANSI C 主要标准化了现存的实现, 同时增加了一些来自 C++ 的内容 (主要是函数原型) 并支持多国字符集 (包括备受争议的三字符序列)。
📚 ANSI C 几乎被所有广泛使用的编译器所支持,且多数C代码是在ANSI C基础上写的。
🔍 【百度百科】ANCI C 标准
0x01 程序的翻译环境和执行环境
📚 ANSI C 的任何一种实现中,存在两种不同的环境:
① 翻译环境:在该环境中,源代码被转换为可执行的机器指令。
② 执行环境:用于实际执行代码。
二、详解编译和链接
0x00 翻译环境
📚 组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)
每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
连接器同时也会引入标准C库函数中任何被该程序所用到的函数,且可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。
💬 举个例子:test.c、add.c、minu.c
0x01 编译本身的几个阶段
💬 举个例子:
① sum.c
int global_val = 2021; void print(const char* string) { printf("%s\n", string); }
② test.c
#include <stdio.h> int main(void) { extern void print(char* string); extern int global_val; printf("%d\n", global_val); printf("Hello,World!\n"); return 0; }
test.c sum.c |
预编译截断(*.i) 预处理指令 …… |
编译(*.s) 语法分析 词法分析 语义分析 符号汇总 |
汇编(生成可重定位目标文件 *.O) 形成符号表 汇编指令 → 二进制指令 ----→ test.o |
链接 1. 合并段表 2. 符号表的合并和符号表的重定位 |
隔离编译,一起链接。 |
1. 合并段表
2. 符号表的合并和符号表的重定位
隔离编译,一起链接。
📚 main.c
extern int sum(int, int); int main(void) { sum(1, 2); return 0; }
📚 sum.c
int sum(int num1, int num2) { return( num1 + num2); }
🔑 解析图(VS2019):
0x02 运行环境
📚 程序执行过程:
① 程序必须载入内存中。在有操作系统的环境中:程序的载入一般由操作系统完成。在独立环境中:程序的载入必须手工安排,也可能是通过可执行代码置入只读内存来完成。
② 程序的执行便开始。接着便调用 main 函数。
③ 开始执行程序代码,这个时候程序将使用一个运行时堆栈(stack),内存函数的局部变量和返回地址。程序同时也可以使用静态(staic)内存,存储与静态内存中的变量在整个执行过程中一直保留他们的值。
④ 终止程序。正常终止 main 函数(也有可能是意外终止)。
💬 举个例子:这段代码的执行过程
int Add(int x, int y) { return( x + y); } int main(void) { int a = 10; int b = 20; int ret = Add(a, b); return 0; }
📚 这里还有一个概念:函数栈帧 (目前做简单了解,后续我将专门写一篇函数栈帧的讲解)
【百度百科】C语言中,每个栈帧对应着一个未运行完的函数。栈帧中保存了该函数的返回地址和局部变量。