1.编译与链接
1.1 程序的翻译环境与执行环境:
在研究程序的编译与链接细节之前,我们首先要了解我们程序的翻译以及执行环境,我们要知道,在 ANSI C
的任何一种实现中,都存在着两种环境:
翻译
环境:在该环境中,我们所写下的 .c 等源代码将被转化成可执行的机器指令。
执行
环境:在该环境下,将会真正执行经过转化后生成的 .exe 可执行文件。
1.2 翻译环境:
在翻译环境中执行的操作,简单来说可以分为三个步骤:
一:组成一个程序的每个源文件通过编译过程分别转换成目标代码(.obj)。
二:每个目标文件由链接器捆绑在一起,形成一个单一而完整的可执行程序。
三:链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人 的程序库,将其需要的函数也链接到程序中。
链接库
指的是链接我们的工程中所引用的库函数所依赖的函数库以及各种第三方函数库。
1.3 翻译阶段:
如果我们再细分下来,翻译阶段又可以分为两个阶段,即编译与链接:
①.编译:
编译阶段又可以细分为三个阶段:
1.预编译(预处理):头文件的包含、#define 定义符号的替换、注释的删除,均为文本操作。
2.编译:将 C 语言的代码翻译成汇编代码,其具体动作包含了语法分析、词法分析、语义分析、符号汇总等。
3. 汇编:将汇编指令翻译为二进制指令,具体动作包含了形成符号表等。
②.链接:
连接阶段负责各个文件的链接相关操作,其具体动作包括了:
1.合并段表
2.合并符号表
3. 重定位符号表
1.4 运行环境:
在这个环境下,我们的程序就真正进入了运行阶段。我们程序的执行过程可以简述为
下面四个步骤:
①. 程序载入内存中:在有操作系统的环境中该步骤通常由操作系统完成;而在独立环境中则必须由我们自己手动完成;独立环境中的程序也有可能通过执行可执行代码置入只读内存来完成。
②. 调用 main 函数:程序正式开始执行。
③. 顺序执行程序代码 :在这个阶段中,我们的程序会使用一个运行时堆栈来存储函数的局部变量和返回地址。同时程序也可以使用静态内存来存储变量,并且这些存储于静态变量中的变量在整个程序的执行过程中将始终保留它们的值。
④. 终止程序:一般情况下会正常终止 main 函数,但我们的程序也有可能会意外终止。
2. 预处理详解:
2.1 预定义符号:
在 C 语言中有一些内置的预处理符号:
__FILE__:进行编译的源文件 __LINE__:文件当前的行号 __DATE__:文件被编译的日期 __TIME__:文件被编译的时间 __STDC__:如果编译器遵循ANSI C标准,其值为1,否则未定义
这些符号都是语言内置的,可以直接使用:
#include<stdio.h> int main() { printf("进行编译的源文件:\n"); printf("%s\n", __FILE__); printf("文件当前的行号:\n"); printf("%d\n", __LINE__); printf("文件编译的日期:\n"); printf("%s\n", __DATE__); printf("文件编译的时间:\n"); printf("%s\n", __TIME__); return 0; }
2.2 #define:
#define 的用处非常多,就比如我们常用的定义标识符常量、定义宏等等,而在这个过程中,也有一些细节值得我们去注意。
2.2.1 #define 定义标识符:
我们常常会使用 #define 去定义一些标识符来方便我们的代码书写。它很常用,使用格式也很简单:
#define name stuff • 1
例如:
#define MAX 1000 #define reg register //为 register这个关键字,创建一个简短的名字 #define do_forever for(;;) //用更形象的符号来替换一种实现 #define CASE break;case //在写case语句的时候自动把 break写上。 // 如果定义的 stuff过长,可以分成几行写,除了最后一行外,每行的后面都加一个反斜杠(续行符)。 #define DEBUG_PRINT printf("file:%s\tline:%d\t \ date:%s\ttime:%s\n",\ __FILE__,__LINE__,\ __DATE__,__TIME__)
同时可以思考一下,在 #define 的最后,要不要加分号 “ ; ” ?
最好不要添加,这是因为有可能会导致语法错误:
#define MAX 1000; #include<stdio.h> int main() { int a = 1; int max = 0; if (a) { max = MAX; } printf("max = %d\n", max); return 0; }
例如这个例子,在预编译(预处理)阶段,会进行 #define 定义标识符的替换,于是 if 语句中的代码将会被替换为:
将被替换为:max = (MAX;); 即:max = MAX;;
此时我们发现,经过符号替换后,出现了语法错误。
2.2.2 #define 定义宏:
在#define 的机制中,包括了一个规定,这个规定允许把参数替换到文本中,这种实现通常称为定义宏(或简称为宏)
宏的申明方式为:
#define name( parament-list ) stuff
其中的 parament-list 是一个由逗号隔开的符号列表,且可能出现在 stuff 中。
注意
:参数列表的左括号必须与 name 紧邻。如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分。
例如我们定义一个宏 sqr 用来计算平方:
#define sqr(x) x*x • 1
这个宏将会在执行时接受一个参数 x,如果在上述声明之后,将下面的代码置于程序中:
sqr( 5 ); • 1
则预处理器就会将上面的表达式替换为:
5 * 5;
警告
:这个宏的书写仍是不严谨的,随时可能导致错误的产生。
例如下面这样情况:
#define sqr(x) x*x #include<stdio.h> int main() { int a = 5; printf("%d\n", sqr(a + 1)); return 0; }
看起来好像并没有什么问题,但事实上,这段代码在经过预编译的符号替换后将会变成:
#define sqr(x) x*x #include<stdio.h> int main() { int a = 5; printf("%d\n", a + 1 * a + 1); return 0; }
原本想要计算 6 * 6,却在预编译的符号替换后出现了错误,打印了 5 + 1 * 5 +1。
解决方法很简单,只需要对宏定义进行简单修改即可:
#define sqr(x) (x)*(x) #include<stdio.h> int main() { int a = 5; printf("%d\n", sqr(a + 1)); return 0; }
通过小括号的使用,在预编译阶段,这段代码将被替换为:
printf("%d\n",(a+1)*(a+1)); • 1
但是其实这样写还有可能出现下面这样的错误:
#define sqr(x) (x)+(x) #include<stdio.h> int main() { int a = 5; printf("%d\n", 10 * sqr(a)); return 0; }
经过了与编译后又将会被替换为:
printf("%d\n", 10 * (a)+(a)); • 1
由于操作符中 * 的优先级高于 +,计算结果又将出现差错。
解决方案是再使用一对小括号对宏定义进行简单修改即可:
#define sqr(x) ((x)+(x)) #include<stdio.h> int main() { int a = 5; printf("%d\n", 10 * sqr(a)); return 0; }
这时的代码在经过预编译后将会被替换为:
printf("%d\n", 10 * ((a)+(a)));
总结
在用于对数值表达式进行求值的宏定义中,都应该用这种方式加上括号以避免在使用宏时由于参数中操作符或邻近操作符之间不可预料的相互作用,从而导致在经过预编译阶段的符号替换后出现错误。
2.2.3 #define 替换规则:
#define 在进行符号替换时,遵循以下规则:
调用宏时首先对参数进行检查,检查是否包含任何由 #define 定义的符号。如果有,它们将首先被替换。
替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值所替换。
最后,再次对结果文件进行扫描,看看它是否包含任何由 #define 定义的符号。如果有,就重复上述处理过程。
注意
:
1.宏参数和 #define 定义中可以出现其它 #define 定义的符号。但是对于宏,绝对不能出现递归。
2. 当预处理器搜索 #define 定义的符号的时候,字符串常量的内容并不会被搜索。
2.2.4 带副作用的宏参数:
这里所说的副作用是指表达式求值的时候出现的永久性效果:
x + 1;//不带副作用 x++;//带有副作用
而这样的代码会通过下面这样的方式对结果造成影响:
#define MAX(a,b) ((a)>(b)?(a):(b)) #include<stdio.h> int main() { int x = 5; int y = 8; int z = MAX(x++, y++); printf("x = %d y = %d z = %d\n", x, y, z); return 0; }
这段代码的实际结果为:
由这个例子我们可以得知,当宏参数在宏的定义中出现超过一次的时候,如果参数带有副作用,那么在使用这个宏的时候就有可能导致不可预测的后果。
3. 宏与函数:
3.1 宏与函数对比:
宏 #define 常用于定义一些全局的宏常量等。宏还常常被应用于执行简单的运算,例如比较两数的大小可以这样用:
#define MAX(a,b) ((a)>(b)?(a):(b)) #include<stdio.h> int main() { int a = 5; int b = 10; printf("MAX = %d\n", MAX(a, b)); return 0; }
为什么我们不使用函数来完成这个过程呢?
在这里使用宏而不用函数的主要原因有两个:
①. 相比于函数宏在程序规模与速度方面更胜一筹:由于函数在调用时牵扯到函数栈帧的创建与销毁等操作,所以用于调用函数以及从函数返回的耗时可能比实际执行这个小型计算工作的耗时更多。
②. 宏是类型无关的:在声明、定义和使用函数时,函数的参数必须是特定的类型,所以函数只能在类型合适的特定表达式上使用。反观宏,无论是整形、长整型还是浮点型,都可以进行比较。
宏与函数相比也有劣势
:
①. 宏只能处理简单运算:我们知道在预处理阶段宏将会进行符号替换,这就意味着每次在使用宏的时候,一份宏定义的代码将插入到程序中。这样一来,如果宏比较长,就将会大幅度增加程序代码的长度。
②. 宏是没有办法进行调试的。
③. 由于宏具有类型无关的特点,因此也不够严谨。
④. 宏可能会带来运算符优先级的问题,导致程序容易出错。
宏也可以做到函数做不到的事,比如:
#define MALLOC(num,type) (type*)malloc(num*sizeof(type)) #include<stdio.h> #include<string.h> int main() { MALLOC(10, int); //预处理器替换后:(int*)malloc(10 * sizeof(int)); return 0; }