详解编译和链接!

简介: 详解编译和链接!

1. 翻译环境和运行环境


在ANSI C的任何一种实现中,存在两个不同的环境~

其一:翻译环境

在这个环境中源代码被翻译(转化)成可执行的机器指令(即二进制指令)

其二:执行环境

用于实际执行代码


2. 翻译环境


那么翻译环境是怎么将源代码转化成可执行的机器指令呢~


其实翻译环境是由编译和链接两个大的过程组成的,而编译过程又可以分为由三个过程:预处理(有些书也叫预编译)、编译和汇编。

一个C语言项目可能有多个.c文件一起构成,那多个.c文件是如何生成可执行程序的呢?


1.多个.c文件单独经过编译器,编译处理生成对应的目标文件

2.注:在Windows环境下目标文件的后缀是.obj,而在Linux环境下目标文件的后缀是.o

3.多个目标文件和链接库一起经过链接器处理最终生成可执行的程序~

4.链接库是指运行时库(它是支持程序运行的基本函数集合)或者第三方库~


如果再把编译器分成三个过程,那就变成了下面的过程~


2.1 预处理


在预处理阶段,源文件和头文件会被处理为.i为后缀的文件

在gcc环境下想观察一下,对test.c预处理后的.i文件,命令如下~

gcc -E test.c -o test.i


预处理阶段主要处理那些源文件中#开始的预编译指令,比如:#include,#define,处理的规则如下:


•将所有的#define删除,并展开所有的宏定义。

•处理所有的条件编译指令,如:#if、#ifdef、#elif、#else、#endif

• 处理#include预编译指令,将包含的头文件的内容插入到该预编译指令的位置。这个过程是递归进行的,也就是说被包含的头文件也可能包含其他文件。

• 删除所有的注释

• 添加行号和文件名标识,方便后续编译器生成调试信息等。

• 或保留所有的#pragma的编译器指令,编译器后续会使用。


经过预处理后的.i文件中不再包含宏定义,因为宏已经被展开。并且包含的头文件都被插如到.i文件

中。所以当我们无法知道宏定义或者头文件是否包含正确的时候,可以查看预处理后的.i文件来确认。

 

2.2 编译


编译过程就是将预处理后的.i文件进行一系列的:词法分析、语法分析、语义分析及优化,生成相应的汇编代码文件。


编译过程的命令如下:

gcc -S test.i -o test.s


词法分析:


将源代码程序被输⼊扫描器,扫描器的任务就是简单的进行词法分析,把代码中的字符分割成⼀系列的记号(关键字、标识符、字⾯量、特殊字符等)。


上面程序进行词法分析后得到了16个记号:


语法分析 :


接下来语法分析器,将对扫描产生的记号进行语法分析,从而产生语法树。这些语法树是以表达式为节点的树


语义分析:


由语义分析器来完成语义分析,即对表达式的语法层面分析。编译器所能做的分析是语义的静态分
析。静态语义分析通常包括声明和类型的匹配,类型的转换等。这个阶段会报告错误的语法信息


2.3 汇编


汇编器是将汇编代码转转变成机器可执行的指令,每⼀个汇编语句几乎都对应⼀条机器指令。就是根据汇编指令和机器指令的对照表⼀⼀的进行翻译,也不做指令优化。


汇编的命令如下:

gcc -c test.s -o test.o


2.4 链接


链接是⼀个复杂的过程,链接的时候需要把⼀堆文件链接在⼀起才生成可执行程序。

链接过程主要包括:地址和空间分配,符号决议和重定位等这些步骤。

链接解决的是⼀个项目中多文件、多模块之间互相调用的问题


比如:

在⼀个C的项目中有2个.c文件( test.c 和 add.c ),代码如下:


test.c

#include <stdio.h>
//test.c
//声明外部函数
extern int Add(int x, int y);
//声明外部的全局变量
extern int g_val;
int main()
{
int a = 10;
int b = 20;
int sum = Add(a, b);
printf("%d\n", sum);
return 0;
}


add.c

int g_val = 2022;
int Add(int x, int y)
{
return x+y;
}


我们已经知道,每个源文件都是单独经过编译器处理生成对应的目标文件。


test.c 经过编译器处理生成 test.o

add.c 经过编译器处理生成 add.o


我们在 test.c 的文件中使用了 add.c ⽂件中的 Add 函数和 g_val 变量。

我们在 test.c 文件中每⼀次使用Add 函数和 g_val 的时候必须确切的知道 Add 和 g_val 的地

址,但是由于每个⽂件是单独编译的,在编译器编译 test.c 的时候并不知道 Add 函数和 g_val

变量的地址,所以暂时把调用 Add 的指令的目标地址和 g_val 的地址搁置。等待最后链接的时候由链接器根据引用的符号 Add 在其他模块中查找 Add 函数的地址,然后将 test.c 中所有引用到

Add 的指令重新修正,让他们的目标地址为真正的 Add 函数的地址,对于全局变量 g_val 也是类

似的方法来修正地址。这个地址修正的过程也被叫做:重定位。


3. 运行环境


1. 程序必须载⼊内存中。在有操作系统的环境中:⼀般这个由操作系统完成。在独⽴的环境中,程序的载⼊必须由⼿⼯安排,也可能是通过可执⾏代码置⼊只读内存来完成。

2. 程序的执⾏便开始。接着便调⽤main函数。

3. 开始执⾏程序代码。这个时候程序将使⽤⼀个运⾏时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使⽤静态(static)内存,存储于静态内存中的变量在程序的整个执⾏过程⼀直保留他们的值。

4. 终⽌程序。正常终⽌main函数;也有可能是意外终⽌。

相关文章
|
存储 分布式计算 安全
Hbase集群搭建超详细教程
分享一下HBase 集群搭建的详细过程
1903 0
|
机器学习/深度学习 人工智能 自然语言处理
命名实体识别的一点经验与技巧(上)
命名实体识别的一点经验与技巧(上)
595 0
|
Arthas 监控 Java
Arthas 实践——生产环境排查 CPU 飚高问题
13:40 收到我们的生产环境服务器绿版 CUP 超负载告警通知。此时心里只有一个想法,重启大法好,马上登录服务器,执行 top 发现进程 30247 和 28337 占用 CPU 为 200 多和100 多基本占用了 4 核的 3 核,整个过程大概用时 30 秒,维护群依然很平静,运营的电话也没打过来,这时候我断定,这次问题应该影响面很小,用户可能也暂时没有发现,好吧,还有时间做排查。
Arthas 实践——生产环境排查 CPU 飚高问题
|
Android开发 芯片 异构计算
Android图形显示系统——下层显示4:图层合成下(硬件合成器)
硬件合成器-HwComposer 使用3D合成,需要大面积的像素混合计算和大量的内存传输(GPU读写GraphicBuffer所需),对GPU和DDR来说是一个巨大的负担。在GPU/DDR重度使用的场景(比如玩游戏),会造成发热、卡顿等。 为了提升性能,减少功耗,可以将合成这个过程交由另一个芯片完成,减轻GPU负担。进一步,直接让这个芯片连LCD,在LCD需要显示某一行时
7380 0
|
5月前
|
安全 小程序 Java
微信支付全流程实战指南
本文从底层逻辑到实战代码,完整覆盖了微信支付Native/JSAPI支付、异步回调、退款、对账等核心能力。在实际项目中,需结合业务场景补充异常监控、资金告警、日志审计等能力,进一步保障支付系统的稳定性和资金安全。
694 6
|
传感器 人工智能 安全
蔚来汽车智能座舱接入通义大模型,并使用通义灵码全面提效
为加速AI应用在企业市场落地,4月9日,阿里云在北京召开AI势能大会。阿里云智能集团资深副总裁、公共云事业部总裁刘伟光发表主题演讲,大模型的社会价值正在企业市场释放,阿里云将坚定投入,打造全栈领先的技术,持续开源开放,为AI应用提速。
|
JSON 缓存 监控
go语言后端开发学习(五)——如何在项目中使用Viper来配置环境
Viper 是一个强大的 Go 语言配置管理库,适用于各类应用,包括 Twelve-Factor Apps。相比仅支持 `.ini` 格式的 `go-ini`,Viper 支持更多配置格式如 JSON、TOML、YAML
759 0
go语言后端开发学习(五)——如何在项目中使用Viper来配置环境
|
存储 弹性计算 固态存储
阿里云服务器按月租用价格是多少,月付收费标准与活动价格参考
阿里云服务器月付租用价格是多少?阿里云服务器既可以月租也可以按年租用,按月可选的时长有1个月到10个月,通常选择较多的是1个月、3个月、6个月时长,目前按月租用价格有经济型e实例4核16G配置10M带宽100G ESSD Entry云盘,月租优惠价70元1个月、210元3个月,如果选择8核32G配置的月付优惠价是160元1个月、480元3个月。本文将详细介绍阿里云服务器的月付收费标准及当前活动价格,帮助您更好地了解在阿里云服务器月付租用价格情况。
|
程序员 编译器
C 标准库 - <float.h>详解
`&lt;float.h&gt;` 是 C 标准库中的头文件,用于定义浮点数的属性和限制,包括有效数字位数(如 `FLT_DIG`)、最小最大值(如 `FLT_MIN` 和 `FLT_MAX`),以及特殊值(如 `FLT_INFINITY`)。它通过提供一系列常量和宏帮助程序员处理浮点运算的范围和精度问题。
|
编解码
笔记本的常见分辨率
笔记本的常见分辨率