程序的翻译环境和执行环境
在ANSI C的任何一种实现中,存在两个不同的环境。
第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。
第2种是执行环境,它用于实际执行代码
详解编译+链接
源文件:.c文件
这个是目标文件 ,链接器link.exe,可执行程序.exe
编译可分为三步:预编译/预处理,编译,汇编
在gcc地下要看预编译结果,应输入test.c-E,输入之后会出现一大堆东西
预处理/预编译
在gcc地下要看预编译结果,应输入test.c-E,输入之后会出现一大堆东西
输入gcc test.c-E-o test.i会生成test.i文件
我们打开test.i文件,能看到好多东西
打开stdio.h文件
我们可以看到stdio.h有这三个文件
而刚才编译生成的test.i文件里面也有这三个文件
我们可以确定:test.i文件的内容来自stdio.h,也就是说预处理阶段stdio.h的文件会被全部包含到test.i文件中
我们给程序增加一行注释,和宏,接下来我们进行编译
预处理之后,我们发现没有了注释和宏,并把define定义的符号进行了替换
总结
预处理阶段所做的事情均为文本操作
预处理会进行以下操作:1.头文件的包含
2.define定义符号的替换,删除定义的符号
3.注释删除
编译
选项 gcc test.i -S对刚才预处理的文件进行编译
gcc test.c-S先预处理然后再编译
编译完成之后就停下来,结果保存在test.s中
输入test.i-S之后会出现一个test.s文件,打开.s文件之后,我们会看到好多汇编代码
这是因为编译截断,C语言把代码转换成了汇编代码
如何转换呢?
转换要经过语法分析、词法分析、符号汇总、语义分析
符号汇总
符号汇总会把全局变量(全局变量名,全局函数名等)汇总出来,不会汇总局部的
总结
编译阶段会把程序转化为汇编代码,会经过以下操作:语法分析、词法分析、符号汇总、语义分析
汇编
对刚才的.s文件进行-c处理,输入gcc test.s -c,我们可以看到会生成test.o文件
test.o文件
打开之后是这个样子
汇编阶段会把汇编代码转换为二进制指令,还会形成符号表
形成符号表
经过编译后add.c会生成add.s文件,test.c会生成test.s文件,汇编后会生成add.o和test.o文件,add.o和test.o会形成符号表,符号表就是会给这些全局变量一个地址
test.c里面的Add只是在声明Add,通过test.cAdd的地址找不到真实的Add ,也就是说test.c里面Add的地址是无效地址
总结
经过汇编之后,会把.s文件变为.o文件,并生成符号表
链接
上面生成的add.o和test.o文件在Linux环境下的格式为elf格式,linux下的可执行程序格式也是elf格式
elf格式将.o文件分为好几段,然后生成可执行程序的时候会按相同的段进行合并
合并完之后,进行符号表合并和重定位
在和并的时候由于刚才的Add有俩个符号表,但合并的时候只能合并其中一个,因此和并的时候会选择正确的地址
合并后变为
可执行程序用合并后的符号表
当没有该函数时,链接时会发生错误,这是因为没有Add的符号表
总结
链接时会进行:1.合并段表
2.符号表的合并和重定位
编译+链接总结
运行环境
程序执行的过程:
1. 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
2. 程序的执行便开始。接着便调用main函数。
3. 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
4. 终止程序。正常终止main函数;也有可能是意外终止。
预处理详解
预定义符号
这些预定义符号都是语言内置的。
此时我们可以看到打印的文件路径
查看是第几行
查看时间
可用来写文件
VS未定义__STDC__
但linux可以使用
#define
语法:
#define name stuff
在define定义标识符的时候,要不要在最后加上 ; ?
#define MAX 1000;
#define MAX 1000
如果给#define加;,这里的pf=1000;;
#define MAX 1000 #define reg register //为 register这个关键字,创建一个简短的名字 #define do_forever for(;;) //用更形象的符号来替换一种实现 #define CASE break;case //在写case语句的时候自动把 break写上。 // 如果定义的 stuff过长,可以分成几行写,除了最后一行外,每行的后面都加一个反斜杠(续行符)。 #define DEBUG_PRINT printf("file:%s\tline:%d\t \ date:%s\ttime:%s\n" ,\ __FILE__,__LINE__ , \ __DATE__,__TIME__ )
#define 定义宏
#define 机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义宏(define macro)。
下面是宏的申明方式:
#define name( parament-list ) stuff
其中的 parament-list 是一个由逗号隔开的符号表,它们可能出现在stuff中。
注意:
参数列表的左括号必须与name紧邻。
如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分
在计算时,宏的参数会被直接替换,请看下面例子
#define 替换规则
在程序中扩展#define定义符号和宏时,需要涉及几个步骤。
1. 在调用宏时,首先对参数进行检查,看看是否包含任何由#define定义的符号。如果是,它们首先被替换。
2. 替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值所替换。
3. 最后,再次对结果文件进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上
述处理过程。
注意:
1. 宏参数和#define 定义中可以出现其他#define定义的符号。但是对于宏,不能出现递归。
2. 当预处理器搜索#define定义的符号的时候,字符串常量的内容并不被搜索。
#和##
#的作用
C语言中可以这样打印字符串
我们希望当输入一个变量并给变量初始化之后,可以打印出the value of X is x,X和x随变量和变量的值变化而变化,但在C语言中函数是不能实现这个功能的,我们可以这样做
在N前面加#,N不会被替换成10,N会被替换成所对应的字符串
使用 # ,可以把一个宏参数变成对应的字符串
对上面的程序进行优化