【C语言】程序环境和预处理(上)

简介: 【C语言】程序环境和预处理(上)

👉程序的翻译环境和执行环境👈


在ANSI C标准的任何一种实现中,存在两个不同的环境。


第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。

第2种是执行环境,它用于实际执行代码。


1990ebe2f8014a8fb4c92a7c11f441e6.png

👉详解编译和链接👈


翻译环境

fd57d972a1c04798a3490a41a40a65da.png

组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。

每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。

链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。


一、编译的几个阶段


编译分为三个阶段,分别为预编译(预处理)、编译和汇编。如下图所示:


db94043e24174391bfce2c5c28de427c.png


那在这三个阶段里,编译器究竟会做什么处理呢?接下来,我们来学习一下。


1.预处理


  • 完成头文件的包含(#include)
  • #define 定义的符号和宏的替换
  • 注释的删除


因为在 VS2022 上无法看到预编译、编译和汇编的过程,所以我们就在 Linux 环境下测试我们的代码。


我们在 Linux 系统下创建一个 test.c 的代码(相关的指令,大家可以自行搜索学习),然后输入指令gcc test.c编译test.c代码(gcc 是一个编译器),编译完成结束会在该目录下生存一个可执行程序 a.out(相当于 Windows 系统下的.exe文件)。通过指令ls可以查看该目录下的全部文件,可以看到确实是生成了一个a.out文件。再然后输入指令./a.out就可以看到程序运行的结果了。

2823e3b97ce9477897f68a2d73314b6f.png


有小伙伴就说了,这也没有看到所谓的预处理过程啊。不要着急,这只是在给大家介绍一下如何在 Linux 环境下编译和执行我们写的代码。接下来,我们就来学习一下预编译的过程。


  • 完成头文件的包含(#include)


刚才我们已经写了一个代码test.c,现在我们就对这个代码进行预编译。首先我们输入指令gcc test.c -E,这条指令的意思是预编译完成后就停止,不在执行往后的编译和汇编,也不会生成可执行程序a.out。输入完gcc test.c -E指令后,在命令行里会出现很多的信息,其实这就是头文件的包含。


28574526ddf14672969c66ebc69755bd.png

如果想要不在命令行出现这些信息,我们可以将指令gcc test.c -E换成指令gcc test.c -E >test.i(输出重定向),它就会生成一个test.i的文件,文件中保存着预处理后产生的信息。我们也可以通过ls指令看是否真的生成test.i文件,也可以打开该文件看到预处理后产生的信息。

d897ec650b0148bc83135fc08a69e9fd.png

如果我们想要看到stdio.h头文件的内容,首先我们先进入到stdio.h头文件所在的路径(输入指令cd /usr/include/),然后通过指令nano stdio.h就可以查看头文件的内容了。

6c4081b38c7c4e71b2a1092645bee3fa.png

fb13ce695aa448a48b25f02164b611b7.png


通过这样一对比,我们就可以知道,头文件的包含其实就是将头文件里的内容拷贝到代码中去。


#define 定义的符号和宏的替换


为了看到 #define 定义的符号和宏的替换的效果,我们就打开我们的代码,修改一下我们的代码。


f3a72d6324c14e33aff115358c9da89b.png

我们现在输入指令gcc test.c -E >test.i进行预处理,然后打开生成的test.i文件查看预处理后产生的信息。见下图:

b5184ba2118446b8adf0a12654b92809.png

通过对比test.c代码和预处理之后的信息,我们可以清晰地看到预处理完成了 #define 定义的符号和宏的替换。因为在预编译的过程已经完成了 #define 定义的符号和宏的替换,所以在往后的编译、汇编和调试的时候,我们都无法看到 #define 定义的符号和宏了。


注释的删除


为了看到注释的删除的效果,我们在原来的代码上加上一段注释,对比一下代码和预处理后产生的信息,就可以明显地看到注释的删除。

b4972df19f74491085ac20b4c71f4a79.png

以上就是预处理的主要过程,预处理中的这些操作都是一些文本操作。接下来我们学习一下编译,看一下编译过程究竟是如何的。


2.编译


预处理完后生成了一个 test.i 的文件,接下来我们就要对该文件进行编译处理。在编译处理的过程中,会文件做语法分析、词法分析、语义分析和符号汇总的操作。


知道了这些,我们就输入指令gcc test.i -S对test.i文件进行编译处理,并且输入该指令后会生成一个test.s的文件。当然,我们同样可以输入指令ls查看是否真的生成了test.s文件。

4d4ba64a034847a6946b64abc9af9d7d.png

那test.s文件中都有什么内容呢?现在我们通过指令nano test.i来查看一下test.s文件的内容。

4db9e31a8c1a4090a6b693867aede18f.png


我们发现,test.s文件里面的内容我们好像也看不懂诶。其实test.s里面放的就是我们写的代码所对应的汇编代码。其实,编译的过程就是将C语言代码转化成汇编代码。在这个过程中,编译器就会对代码进行语法分析、词法分析、语义分析和符号汇总。如果大家对这些编译过程感兴趣的话,可以看一下《编译原理》这本书或者自行搜索。在《编译原理》这本书里,主要将的是如何实现一个编译器和编译器的工作原理。对于符号汇总,我们将会在下面的内容里讲解一下。


3.汇编


汇编过程就是将汇编指令转换成机器指令(二进制指令)的过程。与此相反的是反汇编,反汇编是将机器指令(二进制指令)转换成汇编指令的过程。关于汇编语言,对于一个程序员来说,也是非常地重要的。如果大家感兴趣的话,也可以自行学习一下,增加自己的内功,让自己深入了解计算机究竟是如何工作的。那么,接下来我们就来学习一下汇编过程。


在汇编过程里,我们所要使用的指令是gcc test.s -c。输入指令gcc test.s -c后,会生成一个test.o的文件(Linux 系统的目标文件,Windows 系统的目标文件是.obj后缀)。

4082a2b2b0e842a49fa56dfea2f8b451.png


那现在,我们也打开test.o文件,看一下他里面的内容。

20c3914c910d4e32b6607e9f9da043a9.png

因为test.o文件里的内容都是一些机器指令(二进制指令),所以我们就更加看不懂了。虽然我们看不懂,但是有一个工具readelf可以看懂,因为test.o文件是elf格式的。elf格式将test.o文件划成了一个一个的段,不同的段里存储的数据是不一样的。

699ecc694f274f96b386c6ce74e99900.png

接下来,我们可以输入指令readelf test.o -s来看一下test.o文件的内容。

56f678e9e66f4d33806f0d539bcacd67.png


在汇编过程中,除了将汇编指令转换成机器指令(二进制指令)外,还生成了符号表。上图红色框框框住的就是汇编过程中生成的符号表。


为了更好地理解上面的全过程,博主再给出一个例子。

7f9188d672bf475f9b984aaa0e9f4ebf.png

c2bc24e0b06f4c3a8e3d12e481d9a1e7.png

d60c4884331248e4b7050895f73e6a61.png

cd16ad3c55fb49aab7771131f137101d.png

那生成的符号表有什么用呢?学习了接下来的链接,你就会知道了。


二、链接


链接过程主要做的是把多个目标文件(.o文件)和链接库进行链接,然后生成可执行程序a.out。那链接过程具体又做了什么呢?链接过程中主要做了两件事:1.合并段表;2.符号表的合并和重定位。


1.合并段表


在编译过程中,生成了多个目标文件,也就有了多个段表。那么在链接的时候,我们就需要把相同段的数据合并,然后生成可执行程序a.out。

bac6378a870141029346caba21eb22b5.png

2.符号表的合并和重定位


c02176dce7a7400196b699081b809fbc.png

4e21d31d3b4e404db1cd73825856cda4.png

在汇编的时候,会生成多个符号表。那么在链接的时候,我们就需要对符号表进行合并和重定位,将无效的符号地址去除,有效的符号地址保留下来。那么通过有效的符号地址就可以找到相关的函数。


如果你将add.c文件里的Add函数的定义给注释掉了,那么在链接的时候就会出错。

3d335ee5d5e34fcba230b789e6cead60.png


以上就是翻译环境所需要做的全部事情,接下来我们来学习一下运行环境。


运行环境


程序执行的过程:

程序必须载入内存中。在有操作系统的环境中,一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。


程序的执行便开始。接着便调用main函数。


开始执行程序代码。这个时候程序将使用一个运行时堆栈(函数栈帧)(stack),存储函数的局部变量和返回 地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程 一直保留他们的值。


终止程序。正常终止main函数;也有可能是意外终止。


72172c67a9ac43c5a7beb9371db818a0.png


对函数栈帧的创建与销毁感兴趣的话,可以看一下博主之前写的文章:【C语言】函数栈帧的创建和销毁详解。这一块内容也是非常重要,相信大家看了之后,一定会有不少的收获。在此就不赘述这一块内容了。


详解编译和链接全过程图片

8f8ef4c0bd6c410ba7ea6657d81328e8.png


👉预处理详解👈


预定义符号


  • __FILE__ //进行编译的源文件
  • __LINE__ //文件当前的行号
  • __DATE__ //文件被编译的日期
  • __TIME__ //文件被编译的时间
  • __FUNCTION__ //文件当前所在的函数
  • __STDC__ //如果编译器遵循ANSI C标准,其值为1,否则未定义


这些预定义符号都是语言内置的,那有什么呢?通过下面的程序我们来看一下。


#include <stdio.h>
int main()
{
  printf("%s\n", __FILE__);
  printf("%d\n", __LINE__);
  printf("%s\n", __DATE__);
  printf("%s\n", __TIME__);
  printf("%s\n", __FUNCTION__);
  return 0;
}

8132572d9afd4dc18db8e272fd0650c4.png


还有一个内置的预定义符号,需要编译器遵循ANSI C标准才能执行的,那现在就来看一下 VS2022 是否遵循ANSI C标准。

f77fb197bd7f4094b421f70f1d2a3383.png

可以看到 VS2022 是不遵循 ANSI C 标准的,但是 gcc 编译器是遵循 ANSI C 标准的,我们将该代码在 Linux 环境下运行一下。


c150630848be48eb857f6a6b8ff79fdf.png

我想有小伙伴就会说了,好像这个东西也没有什么用啊。其实这个还是有点用的,可以帮我们生成一个日志,方便查看代码什么时间、什么地方出现了问题。


#include <stdio.h>
int main()
{
  int i = 0;
  FILE* pf = fopen("log.txt", "a+");
  if (pf == NULL)
  {
    perror("fopen");
    return 1;
  }
  for (i = 0; i < 10; i++)
  {
    fprintf(pf, "%s %d %s %s %d\n", __FILE__, __LINE__, __DATE__, __TIME__, i);
  }
  fclose(pf);
  pf = NULL;
  return 0;
}

7a8a4d646c6c4224a3b15277bb717af9.png


相关文章
|
13天前
|
存储 缓存 算法
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式,强调了合理选择数据结构的重要性,并通过案例分析展示了其在实际项目中的应用,旨在帮助读者提升编程能力。
32 5
|
13天前
|
C语言
C语言编程中,错误处理至关重要,能提升程序的健壮性和可靠性
C语言编程中,错误处理至关重要,能提升程序的健壮性和可靠性。本文探讨了C语言中的错误类型(如语法错误、运行时错误)、基本处理方法(如返回值、全局变量、自定义异常处理)、常见策略(如检查返回值、设置标志位、记录错误信息)及错误处理函数(如perror、strerror)。强调了不忽略错误、保持处理一致性及避免过度处理的重要性,并通过文件操作和网络编程实例展示了错误处理的应用。
45 4
|
12天前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
36 1
|
13天前
|
网络协议 物联网 数据处理
C语言在网络通信程序实现中的应用,介绍了网络通信的基本概念、C语言的特点及其在网络通信中的优势
本文探讨了C语言在网络通信程序实现中的应用,介绍了网络通信的基本概念、C语言的特点及其在网络通信中的优势。文章详细讲解了使用C语言实现网络通信程序的基本步骤,包括TCP和UDP通信程序的实现,并讨论了关键技术、优化方法及未来发展趋势,旨在帮助读者掌握C语言在网络通信中的应用技巧。
23 2
|
13天前
|
程序员 C语言
C语言中的指针既强大又具挑战性,它像一把钥匙,开启程序世界的隐秘之门
C语言中的指针既强大又具挑战性,它像一把钥匙,开启程序世界的隐秘之门。本文深入探讨了指针的基本概念、声明方式、动态内存分配、函数参数传递、指针运算及与数组和函数的关系,强调了正确使用指针的重要性,并鼓励读者通过实践掌握这一关键技能。
29 1
|
1月前
|
C语言
【c语言】你绝对没见过的预处理技巧
本文介绍了C语言中预处理(预编译)的相关知识和指令,包括预定义符号、`#define`定义常量和宏、宏与函数的对比、`#`和`##`操作符、`#undef`撤销宏定义、条件编译以及头文件的包含方式。通过具体示例详细解释了各指令的使用方法和注意事项,帮助读者更好地理解和应用预处理技术。
26 2
|
2月前
|
存储 文件存储 C语言
深入C语言:文件操作实现局外影响程序
深入C语言:文件操作实现局外影响程序
|
9天前
|
存储 C语言 开发者
【C语言】字符串操作函数详解
这些字符串操作函数在C语言中提供了强大的功能,帮助开发者有效地处理字符串数据。通过对每个函数的详细讲解、示例代码和表格说明,可以更好地理解如何使用这些函数进行各种字符串操作。如果在实际编程中遇到特定的字符串处理需求,可以参考这些函数和示例,灵活运用。
29 10
|
9天前
|
存储 程序员 C语言
【C语言】文件操作函数详解
C语言提供了一组标准库函数来处理文件操作,这些函数定义在 `<stdio.h>` 头文件中。文件操作包括文件的打开、读写、关闭以及文件属性的查询等。以下是常用文件操作函数的详细讲解,包括函数原型、参数说明、返回值说明、示例代码和表格汇总。
28 9
|
9天前
|
存储 Unix Serverless
【C语言】常用函数汇总表
本文总结了C语言中常用的函数,涵盖输入/输出、字符串操作、内存管理、数学运算、时间处理、文件操作及布尔类型等多个方面。每类函数均以表格形式列出其功能和使用示例,便于快速查阅和学习。通过综合示例代码,展示了这些函数的实际应用,帮助读者更好地理解和掌握C语言的基本功能和标准库函数的使用方法。感谢阅读,希望对你有所帮助!
27 8