GCC编译器优化选项分析及具体优化了什么-阿里云开发者社区

开发者社区> shy丶gril> 正文

GCC编译器优化选项分析及具体优化了什么

简介:
+关注继续查看

问题


在使用gcc作为编译器。在设定编译条件时,在debug模式下生成的程序正常,但是在release模式下往往会出现很多种预料之外的结果,尤其在嵌入式环境中,程序在板子上运行的时候,问题就愈发明显。
为了了解具体为什么造成该问题,对两种模式下的配置做了对比
debug模式编译器参数为-O0 -g –Wall
release模式编译器参数为-O2 -g –Wall

通过对比可以发现两种模式主要的不同在于编译器优化程度不同,那么编译器在两种优化下究竟做了什么优化那?现在我们来看看gcc编译器的优化参数到底做了什么优化

-O0

这里只介绍优化编译的参数
-O用来开启优化编译选项。
-O0:默认模式,不做任何优化。

-O1


-O1:优化。该模式下对于一个大的函数或功能会花费更多的时间和内存。
在-O1下:编译会尝试减少代码体积和代码运行时间。但是并不执行会花费大量时间的优化操作。
在该模式下将打开一下优化选项:

优化选项 描述
-fdefer-pop 推迟推出函数调用的参数,对于那些需要在函数调用后必须取出(pop)函数参数的机器而言,打开该项编译器将把函数调用的参数压入栈,等必要时几个函数调用参数一起取出(pop)。这将节省处理时间。
-fdelayed-branch 如果对目标机支持这个功能,它试图重新排列指令,以便利用延迟分支(delayed branch)指令后面的指令空隙.
-fguess-branch-probability 使用启发式算法预测分之指令,增加指令的命中率,提升运行效果。
-fcprop-registers 使用寄存器之间copy-propagation传值,因为在函数中把寄存器分配给变量, 所以编译器执行第二次检查以便减少调度依赖性(两个段要求使用相同的寄存器)并且删除不必要的寄存器复制操作
-floop-optimize 通过优化如何生成汇编语言中的循环, 编译器可以在很大程序上提高应用程序的性能。 通常, 程序由很多大型且复杂的循环构成。 通过删除在循环内没有改变值的变量赋值操作, 可以减少循环内执行指令的数量, 在很大程度上提高性能。 此外优化那些确定何时离开循环的条件分支, 以便减少分支的影响
-fif-conversion if-then语句应该是应用程序中仅次于循环的最消耗时间的部分,简单的if-then语句可能在最终的汇编语言代码中产生众多的条件分支通过减少或者删除条件分支, 以及使用条件传送 设置标志和使用运算技巧来替换他们, 编译器可以减少if-then语句中花费的时间量。
-fif-conversion2 这种技术结合更加高级的数学特性, 减少实现if-then语句所需的条件分支。
-ftree-ccp
-ftree-dce
-ftree-dominator-opts
-ftree-dse
-ftree-ter
-ftree-lrs
-ftree-sra
-ftree-copyrename
-ftree-fre
-ftree-ch
-funit-at-a-time
-fmerge-constants

该模式下在不影响调试的状况下还会打开‘-fomit-frame-pointer优化项。
同时该模式不会为Ada编译器打开‘-ftree-sra’优化项,如需要则请使用命令参数输入‘-ftree-sra’进行优化。

-O2


进一步优化.GCC执行几乎所有支持的操作但不包括空间和速度之间权衡的优化。
-O2优化等级下,并不执行循环展开和函数“内联”优化操作。
与-O1比较该优化-O2将会花费更多的编译时间当然也会生成性能更好的代码。

-O2除了打开-O1的所有优化参数外还打开以下优化选项。

优化选项 描述
-fthread-jumps
-fcrossjumping
-foptimize-sibling-calls
-fcse-follow-jumps -fcse-skip-blocks
-fgcse -fgcse-lm
-fexpensive-optimizations
-fstrength-reduce
-frerun-cse-after-loop -frerun-loop-o
-fcaller-saves
-fpeephole2
-fschedule-insns -fschedule-insns2
-fsched-interblock -fsched-spec
-fregmove
-fstrict-aliasing
-fdelete-null-pointer-checks
-freorder-blocks -freorder-functions
-falign-functions -falign-jumps
-falign-loops -falign-labels
-ftree-vrp
-ftree-pre

还要注意-fgcse下关于请求-O2优化等级的用于计算goto的程序。

-O3


-O3:更进一步优化。-O3打开-O2指定的所有优化操作并且打开:

-finline-functions
-funswitch-loops
-fgcse-after-reload
  • 1
  • 2
  • 3
  • 1
  • 2
  • 3

优化项-O3

-Os:针对程序空间大小优化(多用于嵌入式系统)。
-Os使能-O2中除去会增加程序空间的所有优化参数。同时-Os还会执行更加优化程序空间的选项。
-Os会关闭以下优化选项:

优化选项 描述
-falign-functions
-falign-jumps
-falign-loops
-falign-labels
-freorder-blocks
-freorder-blocks-and-partition
-fprefetch-loop-arrays
-ftree-vect-loop-version

关于GCC编译的优化选项一共有-O0(默认),-O1,-O2,-O3及-Os五个参数。
各个参数优选内容如上所示。
但是各个优化内容到底是指什么那?继续分析。


转载:http://blog.csdn.net/gatieme/article/details/48898261

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
《OpenACC并行程序设计:性能优化实践指南》一 3.12 参考文献
本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第3章,第3.12节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。
585 0
Linux系统中使用GCC CPU参数优化代码编译
Linux系统中使用GCC CPU参数优化代码编译 使用特定的GCC参数可以使编译出的程序执行效率有较大提升。具体如下: 1、优化原理: 在编译程序时,借助参数传递的方法,使用与系统CPU相匹配的gcc参数,编译出的程序就是为系统CPU而进行特定优化过的,因而执行速度和效率都会是最好。
733 0
IDA反汇编/反编译静态分析iOS模拟器程序(四)反汇编的符号信息与改名
首先看看windows IDA和xcode的反汇编有什么不同。因为不确定直接分析UIKit的代码会不会有法律问题,还是自己写个例子吧。分析UIKit的时候因为没有完整的debugging symbols,所以得到的反汇编信息会比自己写的代码较少。
810 0
IDA反汇编/反编译静态分析iOS模拟器程序(二)加载文件与保存数据库
启动windows版的IDA,在Quickstart界面点击New,弹出一个对话框选择文件。也可以按取消后再把文件拖进IDA。由于Mac版的IDA没注册,没有save功能,所以只好先把Mac上的东西拷贝到windows再打开了。
1019 0
IDA反汇编/反编译静态分析iOS模拟器程序(五)F5反编译
反编译是IDA最让人振奋的功能,它的本质是IDA的一个插件,不过会被当做hex-rays的另一个产品。既然是产品,那当然就另外收费,demo版是没有的。
1030 0
+关注
1878
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载