前言:学了这么就的C语言,让我们真正的来了解一下它的编译吧!再送大家一句话:穷且益坚,不坠青云之志!
一. 程序的翻译环境和执行环境
在ANSI C的任何一种实现中,存在两个不同的环境。
第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。
第2种是执行环境,它用于实际执行代码。
二. 程序的编译与链接
2.1 翻译环境
- 组成一个程序的每个源文件通过编译过程分别转换成目标代码(objectcode)。
- 每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
- 链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中
2.2 编译的多个阶段
- 预处理 选项 gcc -E test.c -o test.i
预处理完成之后就停下来,预处理之后产生的结果都放在test.i文件中。- 编译 选项 gcc -S test.c
编译完成之后就停下来,结果保存在test.s中。- 汇编 gcc -c test.c
汇编完成之后就停下来,结果保存在test.o中。
这些现象我们可以在vs code中很清楚的查看
在vs code 中我们创建两个代码,来进行加法的计算
test.c
#include<stdio.h> //声明一个外部函数 extern int Add(int x,int y); int main() { int a = 10; int b = 20; int sum = Add(a,b); printf("%d\n", sum); return 0; }
add.c
int Add(int x,int y) { return x+y; }
预处理
此时我们发现test.i文件已经生成好了,然后打开文件
编译
此时就生成了一个 test.s 的文件,我们再来观察一下 test.s
在观察 test.s 时我们发现很难读取 而其实在这个编译阶段是将C语言代码翻译成了汇编代码
- 语法分析
- 词法分析
- 语义分析
- 符号汇总
汇编
汇编就是把汇编代码转化成二进制的指令 -> 再形成符号表,所以我们无法直接读取
2.3 链接
链接的过程
- 合并段表
- 符号表的合并和重定位
2.4 运行环境
程序执行的过程:
- 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
- 程序的执行便开始。接着便调用main函数。
- 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
- 终止程序。正常终止main函数;也有可能是意外终止。
三. 预处理详解
3.1 预定义符号
_FILE_ ------- //进行编译的源文件
_LINE_ ------- //文件当前的行号
_DATE_ -------- //文件被编译的日期
_TIME_ --------- //文件被编译的时间
_STDC_ --------- //如果编译器遵循ANSI C,其值为1,否则未定义
因为vs不是严格遵守C标准 ,所以我们使用vscode来实现_STDC_
3.2 #define
3.2.1 #define 定义标识符
语法:
#define name stuff
比如:
#define MAX 1000
#define reg register //为 register这个关键字,创建一个简短的名字
#define do_forever for(; ; ) //用更形象的符号来替换一种实现
#define CASE break;case //在写case语句的时候自动把 break写上。
// 如果定义的 stuff过长,可以分成几行写,除了最后一行外,每行的后面都加一个反斜杠(续行符)。
#define DEBUG_PRINT printf(“file:%s\tline:%d\t \
date:%s\ttime:%s\n” ,\
FILE,LINE , \
DATE,TIME )
在define定义标识符的时候,不要在最后加上 ;
因为在执行程序时分号也会被一起替换,容易出现语法问题
3.2.2 #define 定义宏
#define 机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)
或定义宏(define macro)。
宏的申明方式:
#define name( parament-list ) stuff
其中的 parament-list 是一个由逗号隔开的符号表,它们可能出现在stuff中。
注意:
参数列表的左括号必须与name紧邻。
如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分
比如:
#define SQUARE( x ) x * x
SQUARE( 5 )
这个宏接收一个参数 x .如果在上述声明之后,你把SQUARE( 5 )置于程序中,预处理器就会用下面这个表达式替换上面的表达式:
5 * 5
注意:在宏的使用中,千万记得不要吝啬打括号,少了括号结果可能差距很大
下面我们来看个例子
int a = 5;
printf(“%d\n” ,SQUARE( a + 1) );
可能大家在读这个代码后觉得是输出 36 但结果确是 11
5+1*5+1
这才是正确的代码读取,若想输出 36 则需要重新定义宏
#define SQUARE( x ) (x) * (x)
所以在宏的定义时:
用于对数值表达式进行求值的宏定义都应该用这种方式加上括号,避免在使用宏时由于参数中
的操作符或邻近操作符之间不可预料的相互作用。
3.2.3 #define 替换规则
在程序中扩展#define定义符号和宏时,需要涉及几个步骤:
- 在调用宏时,首先对参数进行检查,看看是否包含任何由#define定义的符号。如果是,它们首先被替换。
- 替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值所替换。
- 最后,再次对结果文件进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上述处理过程。
注意:
- 宏参数和 #define 定义中 可以出现其他#define定义的符号 。但是对于宏, 不能出现递归 。
- 当预处理器搜索 #define 定义的符号的时候,字符串常量的内容并不被搜索。
————————————
3.2.4 #和##
#
这样看字符串是有自动连接的特点
#define print_format(format, num) \ printf("the value of num is "format, num) int main() { int i = 10; print_format("%d", i+3 ); return 0; }
这样如果我们想要将 num 换成 对应的字符,这时我们就要用到 #
这样就能让两个字符串连接起来
the value of num is 13 —> the value of i+3 is 13
##
##可以把位于它两边的符号合成一个符号。
它允许宏定义从分离的文本片段创建标识符。
注意:但是这样的连接必须可以产生一个合法的标识符,否则它的结果就是未定义的
3.2.5 带副作用的宏参数
x+1;//不带副作用
x++;//带有副作用
#define MAX(a, b) ( (a) > (b) ? (a) : (b) )
…
x = 5;
y = 8;
z = MAX(x++, y++);
printf(“x=%d y=%d z=%d\n”, x, y, z);
代码结果应该为:x=6,y=10,z=9;
3.2.6 宏和函数对比
宏的优点:
- 用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。所以宏比函数在程序的规模和速度方面更胜一筹。
- 更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之这个宏怎可以适用于整形、长整型、浮点型等可以用于>来比较的类型。宏是类型无关的。
宏的缺点:
- 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度。
- 宏是没法调试的。
- 宏由于类型无关,也就不够严谨。
- 宏可能会带来运算符优先级的问题,导致程容易出现错。
3.2.7 命名约定
把宏名全部大写
函数名不要全部大写
3.3 #undef
3.4 命令行定义
3.5 条件编译
在编译一个程序的时候我们如果要将一条语句(一组语句)编译或者放弃是很方便的。因为我们有条件编译指令。
这就是条件编译,只有满足条件才会编译
常见的条件编译指令:
1.直接条件判断
2. 多个分支的条件编译
3. 判断是否被定义
4.嵌套指令
#if defined(OS_UNIX) #ifdef OPTION1 unix_version_option1(); #endif #ifdef OPTION2 unix_version_option2(); #endif #elif defined(OS_MSDOS) #ifdef OPTION2 msdos_version_option2(); #endif #endif
3.6 文件包含
#include 指令可以使另外一个文件被编译。就像它实际出现于 #include 指令的地方
一样。
3.6.1 头文件被包含的方式
查找策略:先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标准位置查找头文件。
如果找不到就提示编译错误。
查找头文件直接去标准路径下去查找,如果找不到就提示编译错误。
对于库函数也可以使用 “ ” 的包含方式只不过效率不高
3.6.2 嵌套文件包含
如果出现这样的场景,可能就造成头文件的重复
comm.h和comm.c是公共模块。
test1.h和test1.c使用了公共模块。
test2.h和test2.c使用了公共模块。
test.h和test.c使用了test1模块和test2模块。
这样最终程序中就会出现两份comm.h的内容。这样就造成了文件内容的重复
解决方法:
- 使用条件编译,如果定义过,则无法再进行编译
#ifndef __TEST_H__ #define __TEST_H__ //头文件的内容 #endif
- 或者使用我们之前碰到过的代码
#pragma once
四.感谢大家观看
好了,C语言的程序环境和预处理就讲到这里,感谢大家观看