本章重点:
- 程序的翻译环境
- 程序的执行环境
- 详解:C语言程序的编译+链接
- 预定义符号介绍
- 预处理指令 #define
- 宏和函数的对比
- 预处理操作符#和##的介绍
- 命令定义
- 预处理指令 #include
- 预处理指令 #undef
- 条件编译
1. 程序的翻译环境和执行环境
在ANSI C的任何一种实现中,存在两个不同的环境。
- 第1种是翻译环境,在这个环境中源代码经过编译和链接被转换为可执行的机器指令。
- 第2种是执行环境,它用于实际执行代码。
为什么有这两种环境呢?
因为我们所书写的代码都是文本信息,计算机只能识别二进制,计算机不能直接理解文本信息,就需要将文本信息转为二级制指令,然后再去执行这些指令。
- 翻译环境:文本信息 - 二级制指令(存放在可执行程序里面)
- 执行环境:执行可执行程序
2. 详解编译+链接
2.1 翻译环境
- 组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。
- 每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
- 链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。
2.2 编译本身也分为几个阶段:预编译(预处理)+ 编译 + 汇编
注:由于vs已经将编译和链接集成开发环境,不方便看到这些过程,咱们在gcc编译器测试。
1. 预处理(Preprocessing):预处理器(Preprocessor)根据程序中包含的预编译指令,如#include等,将源代码中的宏定义、注释、条件编译等转换为实际的C代码。预处理的输出结果通常是一个扩展名为.i的文件。
2. 编译(Compilation):编译器(Compiler)将扩展名为.i的预处理后的文件编译成汇编语言(Assembly Language)代码,这个汇编代码是计算机可以理解的中间语言。编译的输出结果通常是一个扩展名为.s的汇编语言代码文件。
3. 汇编(Assembly):汇编器(Assembler)将扩展名为.s的汇编语言代码文件转换成计算机可执行的机器码(Machine Code)。汇编的输出结果通常是一个扩展名为.o的目标文件。
4. 链接(Linking):链接器(Linker)将程序中使用到的各个目标文件和库文件(Library)链接成一个完整的可执行文件(Executable File)。器链接的输出结果通常是扩展名为.exe的可执行文件。
- 预处理 选项 gcc -E test.c -o test.i 预处理完成之后就停下来,预处理之后产生的结果都放在test.i文件中。
- 编译 选项 gcc -S test.c 编译完成之后就停下来,结果保存在test.s中。
- 汇编 gcc -c test.c 汇编完成之后就停下来,结果保存在test.o中。
- 链接 gcc test.o -o test 链接之后就停下来,结果保存在test.o中。
- test.ot和test.exe都是按照 ELF 这种文件的格式来存储的,可通过Linux下的readelf阅读该文件,例如:readelf test.o -a(显示所有)
符号表:全局变量和函数会形成,局部变量不会形成
2.3 运行环境
程序执行的过程:
- 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
- 程序的执行便开始。接着便调用main函数。
- 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
- 终止程序。正常终止main函数;也有可能是意外终止。
3. 预处理详解
3.1 预定义符号
__FILE__ //进行编译的源文件 __LINE__ //文件当前的行号 __DATE__ //文件被编译的日期 __TIME__ //文件被编译的时间 __STDC__ //如果编译器遵循ANSI C,其值为1,否则未定义
举个栗子:
#include<stdio.h> int main() { printf("%s\n", __FILE__); printf("%d\n", __LINE__); printf("%s\n", __DATE__); printf("%s\n", __TIME__); //printf("%s\n", __STDC__); vs不支持ANSI C return 0; }
运行结果:
3.2 #define
3.2.1 #define 定义标识符
语法: #define name stuff
#define MAX 1000 #define reg register //为 register这个关键字,创建一个简短的名字 #define do_forever for(;;) //用更形象的符号来替换一种实现 #define CASE break;case //在写case语句的时候自动把 break写上。 // 如果定义的 stuff过长,可以分成几行写,除了最后一行外,\ 每行的后面都加一个反斜杠(续行符),后面不能有空格。 #define DEBUG_PRINT printf("file:%s\tline:%d\t \ date:%s\ttime:%s\n" ,\ __FILE__,__LINE__ ,\ __DATE__,__TIME__ ) int main() { int d = 1; switch (d) { case 1: CASE 2 : CASE 3 : CASE 4 : CASE 5 : ;//最后一个case语句的分号 //最后一个case语句可以不用写break } return 0; }
在define定义标识符的时候,要不要在最后加上 ; ?
#define MAX 1000; #define MAX 1000
建议不要加上 ; ,这样容易导致问题。
if(condition) max = MAX; else max = 0;
由于宏定义是直接替换的,所以代码会变成下面情况,会出现语法错误。
if(condition) max = 100; ; else max = 0;
3.2.2 #define 定义宏
- #define 机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义宏(define macro)。
- 宏的申明方式:
- #define name( parament-list ) stuff
- 其中的 parament-list 是一个由逗号隔开的符号表,它们可能出现在stuff中。
- 注意: 参数列表的左括号必须与name紧邻。 如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分。
#include<stdio.h> #define SQUARE(x) x * x //参数列表的左括号必须与SQUARE紧邻 int main() { printf("%d\n",SQUARE(5));//替换为SQUARE(5) 5 * 5 - 直接替换 //printf("%d\n", 5 * 5); return 0; }
运行结果:
我们再测试一个:
#include<stdio.h> #define SQUARE(x) x * x //参数列表的左括号必须与SQUARE紧邻 int main() { int a = 5; printf("%d\n", SQUARE(a + 1)); return 0; }
运行结果:
- 乍一看,你可能觉得这段代码将打印36这个值。 事实上,它将打印11. 为什么?
- 替换文本时,参数 x 被替换成 a + 1
- 所以这条语句实际上变成了:
printf ("%d\n",a + 1 * a + 1 );
- 这样就比较清晰了,由替换产生的表达式并没有按照预想的次序进行求值。
- 在宏定义上加上两个括号,这个问题便轻松的解决了:
【程序环境与预处理玩转指南】(中):https://developer.aliyun.com/article/1424849