【Linux】Linux编译器 gcc/g++的使用&&初识动静态链接库

简介: 【Linux】Linux编译器 gcc/g++的使用&&初识动静态链接库

前言

在上一篇 Linux 博客中,我们讲解了 vim 编辑器的使用,可以在 Linux 上写代码了。但是写的代码如何编译?

在 Linux 中,C 语言用 gcc 编译;C++ 用 g++ 编译。

gcc 演示翻译环境

对于一个 C 程序,从源文件到形成可执行程序一共要进行四步:预处理、编译、汇编、链接 。这四步过程被称为 翻译环境 。

接下来,我们用 gcc 分别演示这四个过程。

1、预处理

在预处理中,需要完成头文件的展开、宏替换、去注释、条件编译等工作。

经过预处理后,当前文件还是 C 语言,只不过变得更加精简。

预处理指令 :

gcc -E file.c -o file.i

-E 选项:让 gcc 进行程序的预处理,预处理之后就停下来。

-o 选项:-o 选项紧跟目标生成文件的名称。gcc -o file.i file.c 或者上方的指令都是可以的。

样例程序 :

#include <stdio.h>
#define FOO // #define 后定义内容可为空
#define MAX 100
int main()
{
    int max = MAX;
    printf("%d\n", max);
    printf("hello vim!\n");
    printf("hello vim!\n");
    //printf("hello vim!\n");
   //printf("hello vim!\n");
    printf("hello vim!\n");
    printf("hello vim!\n");
    #ifdef FOO 
    printf("yes");
    #else
    printf("no");
    #endif
    return 0;
}

进行预处理 :22f9f8799a40441988c8a91b274cdef4.png

预处理之后生成 file.i 文件,分别打开 .c 和 .i 文件进行对比 :c939d68c5ad049b7bd64fc15c37bad18.png

我们发现代码变为八百多行,这是因为头文件 #include <stdio.h> 被展开,同时预处理的其他过程也都进行了。

2、编译

当程序在编译时,gcc 会检查代码是否有语法错误,了解代码基本内容,检查无误就会把代码翻译为汇编语言

汇编语言中包含源文件的部分内容,所以也可以说该文件为 C 语言汇编代码 。

编译指令 :

gcc -S file.i -o file.s

-o 选项的位置可以改变,但是一定要记住 -o 选项的规则。

.s :生成汇编代码的后缀

通过源文件 .c 也可以形成编译后的文件,指令为 gcc -s file.c -o file.s,但是我们为了演示过程的连续性,我们统一从上次生成的文件开始执行指令。

进行编译 :0e17e4a478784a949b27836b1d164269.png观察 file.s 文件内容:a5305c60fc244ff4887aa0588601ee8b.png上部分框起来的语句含有 c 语言的样子;而下部分框起来的语句则是汇编代码,由此证明在编译过后生成的文件为 C 语言汇编代码。

3、汇编

汇编之后会把汇编语言转换为二进制文件。


这里的二进制文件可以说是 可重定位二进制文件 。该文件不能被执行,类似于 windows 上的 .obj 文件。

这一步把我们自己的代码翻译为二进制目标文件

由于机器只认识二进制文件,所以这一步就是把人能看懂的文件,翻译成机器能看懂的,就是 生成机器可识别代码

汇编指令 :

gcc -c file.s -o test.o

-c 选项:让 gcc 进行程序的汇编,汇编之后就停下来。

.o :生成二进制文件的后缀。

进行汇编 :fd2bf8fb415949caa6be00564a3af7c0.pngfile.o 内容:image.png打开文件发现什么都看不懂。

这就是二进制文件,计算机可以识别该文件。

那么该文件可以执行吗?cc26f562d6ba4cc8b5807da3b53b05b9.png不可以执行,报错信息为权限被拒绝,通常为权限不够。那这怎么证明该文件不能执行?

我们将其提权试试:image.png然后再次 ./file.o 执行该文件:9d9cc3f633aa460bbf0103c21c4b8a4e.png仍然执行失败,并报错:无法执行该二进制文件。所以这就证明结论:汇编生成的二进制文件不可执行!

4、链接

链接过程就是将程序和对应的库链接起来,编译器会自动识别语言。

链接指令 :

gcc file.o -o myfile

生成文件为可执行程序

gcc file.o 也可以完成链接

进行链接 :2175709439264f1fa8d9c1da3ed90a74.png再执行生成的可执行程序 test :2a5dfdcd01744b779d0dfae683d9a2a3.png总结:链接后的可执行文件才可以执行。

总结

我们将翻译过程按步执行是为了理解程序由源代码到可执行程序的一个过程。

实际上,在我们日常编译代码只需要 gcc file.c 就可以一步生成可执行文件

快速记忆方式:

对于 预处理、编译、汇编 三步的选项分别为 ESc ,可以与键盘上的 esc 键来帮助记忆,区别前两个字母是大写。而生成的文件后缀分别为 iso 可以利用镜像文件(ISO)来记忆。

动静态链接库

1、库的认识

首先清楚一点,我们写的代码里面经常会用库函数,这些调用接口的方式是我们写的,但是这些库函数的底层实现不是我们写的,而这中间就有一个调用库的过程。

在链接的过程中,需要对形成的二进制文件和库文件进行合并从而形成可执行程序,这边就调用了库。库是能成功编译的必要条件。345dbbfd3f434f1e9d006df4871f6a03.png我们一直在使用库,至少是语言上的库。

比如上方链接生成的可执行程序 test ,它就依赖了库。

通过 ldd test ,就可以查看该程序依赖了哪些库:2cddda6b94b24218945f2485415651a6.png不仅程序依赖库,我们在 linux 下能进行代码编写也是因为内置了库。linux 默认有语言级别的头文件,和语言对应的库。

通过 ls /usr/include/ 就可以看到系统的内置的头文件,我们通过头文件就可以根据库函数,找到对应的方法,从而链接到正确的库:79a14ec439fa4b49b20e0913b5d59b31.png在linux 下,库分两种 :

静态库,格式为 libXXX.a 。

动态库,格式为 libXXX.so 。

XXX为库名

基于上面的格式,不同的库还可能会有版本,例如 test 程序就依赖了libc.so.6 ,后面的 .6 就是版本:75e85775fc0c4c71b78689516a692b4f.png并且我们发现可执行程序依赖的就是 .so 动态库。(图中的/lib64/libc.so.6就是当前云服务器当中的C标准库)


linux 上特有的后缀划分:

对于动静态库,以lib 为前缀,.a/.so 为后缀,掐头去尾就是名称。例如 libc.so.6 ,它的名字就是 c ,是 c 语言内置库。


windows 上特有的后缀划分:静态库为 lib ,动态库为 dll 。


不止可执行程序,就连指令也依赖于库,我们观察几个指令:(我们可以使用ldd指令查看动态链接的可执行文件所依赖的库)ede9b61c5ea146359a5e33dbb1a6eba3.png

常用的 ls, tar 它们都依赖于库,甚至还依赖于 c 库。

由此发现,指令和 c 程序一样,都依赖与库。所以我们可以将指令看待为:指令是程序,是工具。

虽然从编译角度来说,指令和我们写的 c 程序没有任何区别,但是从功能上来说确是天差地别。

总结:库是必要的,并且库分为动态库和静态库 。

2、链接方式

Linux 的链接方式就两种:

动态链接

静态链接

而 Linux 默认的链接方式为 动态链接 ,我们来证明一下:

用 file 指令查看 test 文件的类型:

180d643fb1b045a0852d4f513d5ca63c.png我们发现生成的可执行程序默认就是采用的 动态链接 。

那么为什么采用动态链接而不采用静态链接?这里面有什么原因?

我们先了解一下动静态库。

3、动态库与静态库

动态库对应的链接方式为动态链接;静态库对应的链接方式为静态链接。

动态链接必须使用动态库,静态链接必须使用静态库。

动态库优缺点:

动态库也可以说是共享库。动态库在链接的时候,并没有把相应的库文件加载到可执行程序中,而是在运行的时候,拷贝库中所需代码的地址到可执行程序中相关的位置。

通过这种链接方式,使用动态库就大大节省了内存损耗。

但是这也带来一个缺点,由于动态库链接时,是通过地址链接的。所以只要我们的动态库缺失,程序便无法运行。

静态库优缺点:

静态库则是在编译链接时,把库文件的代码全部加载到可执行程序中。

这种链接方式导致生成文件体积庞大。若文件数目一多,到时候内存就会被占用很多。

但是这也有一个优点,这样就使得程序不依赖于库了。即使库出了问题,也没事,因为我们已经将代码加载到程序中了。

通过上面,我们发现,动态库可以大大节省内存开销,并且一般对应的动态库并不会出问题,再衡量可执行程序很多的情况,动态链接其实是最好的链接方式。

所以 Linux 默认是采用动态链接的链接方式。

4、两种链接方式的使用

对于动态链接,我们已经使用过了,比如上文生成的 test 文件,就是动态链接生成的。

而静态链接则需要通过特定方式来使用,并且 Linux 默认只装了动态库,静态库是没装的,所以先安装一下:bd0604e414fa4b6d932d19d5292b074e.pngC语言静态库:

sudo yum install -y glibc-static
• 1

C++静态库:

sudo yum install -y libstdc++-static

C语言静态库:

sudo yum install -y glibc-static
• 1

C++静态库:

sudo yum install -y libstdc++-static

-o 后面还是自定义名称,这里只是为了做区别

结尾的 -static 代表以静态链接方式编译9c4df7399c4747f7bad6910cedd1e025.png我们发现,静态链接后生成的可执行程序的体积非常大。

再用 file file-static 查看一下文件类型:c79e430e09b94822859a2aeae18d5780.png就变成 statically linked:静态链接了。

5、debug和release

程序发布方式:

 1、debug版本:程序本身会被加入更多的调试信息,以便于进行调试。

 2、release版本:不会添加任何调试信息,是不可调试的。


在Linux当中gcc/g++默认生成的可执行程序是release版本的,是不可被调试的。如果想生成debug版本,就需要在使用gcc/g++生成可执行程序时加上-g选项。9e8236af93684c158543dacbe62704a4.png对同一份源代码分别生成其release版本和debug版本的可执行程序,并通过ll指令可以看到,debug版本发布的可执行程序的大小比release版本发布的可执行程序的大小要大一点,其原因就是以debug版本发布的可执行程序当中包含了更多的调试信息。2a5732d76d5646b1811c09685f36cfca.png扩展:可执行程序形成的时候,不是无序的二进制构成,有自己的格式的–可执行程序有自己的二进制格式–ELF格式

gcc/g++ 选项汇总

gcc/g++ 常用的选项和操作也就是 -o 选项还有 gcc file 直接生成可执行程序。

下面对其他选项做出一些补充:


-E :只激活预处理,这个不生成文件,你需要把它重定向到一个输出文件里面

-S :编译到汇编语言不进行汇编和链接

-c :编译到目标代码

-o :文件输出到文件

-static :此选项对生成的文件采用静态链接

-g :生成调试信息。GNU 调试器可利用该信息

-shared :此选项将尽量使用动态库,所以生成文件比较小,但是需要系统由动态库

-O0 :不做任何优化,这是默认的编译选项。

-O1 : 对程序做部分编译优化

-O2 :是比O1更高级的选项,进行更多的优化

-O3 :比O2更进一步的进行优化

-w :不生成任何警告信息

-Wall: 生成所有警告信息


安装和使用g++

g++是GNU的C++的编译器,使用前需要下载。

yum install gcc-c++

3d1e216ba9dc4a1cab1f5ae7e61ea779.png

下载完成

3f98515e507843a1a06504ebc290f08b.png

查看版本

aa631d7584ac44b59e8df12237bb5a74.png

新建一个C++文件

90509778ee014974b406836a4ce162c6.png

编写一段C++代码

0f312126e9f849c29847141df52cfb45.png

用g++编译test.cpp文件

db359e3a41d145dfa50dd8e14c00e72b.png

总结:

今天我们学习了如何使用 gcc/g++ ,了解程序经过翻译环境形成可执行程序的过程。还初步认识了动静态库,实际上动静态库还有很多知识,等到基础 I/O 再进一步学习。接下来,我们将继续学习其他Linux环境基础工具的基本使用及配置。希望我的文章和讲解能对大家的学习提供一些帮助。


当然,本文仍有许多不足之处,欢迎各位小伙伴们随时私信交流、批评指正!我们下期见~

c3ad96b16d2e46119dd2b9357f295e3f.jpg


相关文章
|
3月前
|
Linux 索引
在Linux中,符号链接与硬链接有何区别?
在Linux中,符号链接与硬链接有何区别?
|
1月前
|
Linux 编译器 C语言
【Linux快速入门(一)】Linux与ROS学习之编译基础(gcc编译)
【Linux快速入门(一)】Linux与ROS学习之编译基础(gcc编译)
|
3月前
|
Linux C语言
成功解决 在Linux CentOS 7 中安装gcc
这篇文章介绍了如何在Linux CentOS 7系统中安装gcc (g++) 8工具集。由于CentOS 7默认的gcc版本是4.8,而这个版本与Qt 5.14、Qt 5.15或更高版本不兼容,可能会导致编译时出现系统头文件错误。文章中提到,即使在项目配置中添加了`CONFIG+=c++11`,如果仍然报错,那么很可能是gcc版本的问题。为了解决这个问题,文章提供了使用CentOS的Software Collections (scl)来安装更新版本的gcc的步骤。
成功解决 在Linux CentOS 7 中安装gcc
|
2月前
|
Linux 编译器 C语言
Linux内核对GCC版本的检测
Linux内核对GCC版本的检测
|
3月前
|
Java Linux 编译器
【Linux】gcc简介+编译过程
【Linux】gcc简介+编译过程
100 0
|
4月前
|
网络协议 Ubuntu Linux
查询Linux中网络链接的状态:networkctl
【7月更文挑战第18天】
100 0
查询Linux中网络链接的状态:networkctl
|
Linux
LINUX上使用命令ln新建,修改链接
LINUX上使用命令ln新建,修改链接
126 0
|
8天前
|
监控 Linux
如何检查 Linux 内存使用量是否耗尽?这 5 个命令堪称绝了!
本文介绍了在Linux系统中检查内存使用情况的5个常用命令:`free`、`top`、`vmstat`、`pidstat` 和 `/proc/meminfo` 文件,帮助用户准确监控内存状态,确保系统稳定运行。
69 6
|
9天前
|
Linux
在 Linux 系统中,“cd”命令用于切换当前工作目录
在 Linux 系统中,“cd”命令用于切换当前工作目录。本文详细介绍了“cd”命令的基本用法和常见技巧,包括使用“.”、“..”、“~”、绝对路径和相对路径,以及快速切换到上一次工作目录等。此外,还探讨了高级技巧,如使用通配符、结合其他命令、在脚本中使用,以及实际应用案例,帮助读者提高工作效率。
35 3
|
9天前
|
监控 安全 Linux
在 Linux 系统中,网络管理是重要任务。本文介绍了常用的网络命令及其适用场景
在 Linux 系统中,网络管理是重要任务。本文介绍了常用的网络命令及其适用场景,包括 ping(测试连通性)、traceroute(跟踪路由路径)、netstat(显示网络连接信息)、nmap(网络扫描)、ifconfig 和 ip(网络接口配置)。掌握这些命令有助于高效诊断和解决网络问题,保障网络稳定运行。
26 2