编译原理 - 编译优化

简介: 编译原理 - 编译优化

编译优化


基本概念


  • 代码优化是对被优化的程序进行的一种语义保持的变换
  • 语义保持:
  • 程序的可观察行为不能改变
  • 变换的目的是让程序能够比变换前:
  • 更小
  • 更快
  • cache行为更好
  • 更节能
  • 等等


不存在完全优化


等价于停机问题


  • 给定一个程序p,把opt§和下面的程序比较:L: jmp L


编译器从业者永不失业定理


代码优化很困难

  • 不能保证优化总能产生好的结果
  • 优化的顺序和组合很关键
  • 很多优化问题是非确定的
  • 优化的正确性论证很微妙


正确的观点


  • 把该做对的做对
  • 不是任何程序都会同概率出现
  • 所以能处理大部分常见情况的优化就可以接受
  • 不期待完美编译器
  • 如果一个编译器有足够多的优化,则就是一个很好的编译器


前端优化


常量折叠


  • 基本思想
  • 在编译期计算表达式的值
  • 可以在整形、布尔型、浮点型等数据类型上进行
  • 小结
  • 容易实现,可以在语法树或者中间表示上进行
  • 通常被实现成公共子函数被其他优化调用
  • 必须很小心遵守语言的语义


代数化简


  • 基本思想
  • 利用代数系统的性质对程序进行化简
  • 示例
  • a = 0+b => a=b
  • a = 1 * b => a=b
  • 2*a => a+a
  • 2*a => a<<1
  • 同样必须非常仔细的处理语义


不可达删除


  • 基本思想
  • 静态移除程序中不可执行的代码
  • 在控制流图上也可以进行这些优化,但在早期做这些优化可以简化代码中后端


中间表示上的优化


  • 依赖于具体所使用的中间表示
  • 控制流图(CFG)、控制依赖图(CDG)、静态单赋值形式(SSA)、后续传递风格(CPS)等
  • 共同特点是需要进行程序分析
  • 优化是全局进行的,而不是局部
  • 通用的模式是:程序分析-》程序重写


常量传播

拷贝传播

死代码删删除

目录
相关文章
|
Ubuntu
LLVM编译源码
LLVM编译源码
447 0
|
缓存 编译器
BOLT 二进制反馈优化技术
大型应用的代码往往达到数十甚至上百MB,这导致在程序执行时缓存机制无法充分利用,导致大量时间花费在CPU和内存链路上。通过对热点函数的布局进行优化,我们可以更好地利用CPU cache,从而获得较为可观的性能提升。针对这一问题,在编译技术上有PGO和Bolt两种解决办法,两者都是一种通过收集程序在运行时如跳转,调用关系,函数热度等执行信息,这些收集到的程序运行情况数据(profile data),可以更好地指导一些程序优化的策略,如是否对函数进行内联,以及对基本块和函数布局的排布来提高特定场景下的程序性能。
2830 2
BOLT 二进制反馈优化技术
|
人工智能 JavaScript 数据库
数据库原理第二章课后题答案(第四版)
数据库原理第二章课后题答案(第四版)
600 0
|
消息中间件 负载均衡 Kafka
【Kafka面试演练】那Kafka消费者手动提交、自动提交有什么区别?
嗯嗯Ok。分区的作用主要就是为了提高Kafka处理消息吞吐量。每一个topic会被分为多个分区。假如同一个topic下有n个分区、n个消费者,这样的话每个分区就会发送消息给对应的一个消费者,这样n个消费者负载均衡地处理消息。同时生产者会发送消息给不同分区,每个分区分给不同的brocker处理,让集群平坦压力,这样大大提高了Kafka的吞吐量。面试官思考中…
442 4
|
Kubernetes 网络协议 关系型数据库
Kubernetes----ExternalName类型的Service
Kubernetes----ExternalName类型的Service
2759 0
|
10月前
|
消息中间件 存储 网络协议
从零开始掌握进程间通信:管道、信号、消息队列、共享内存大揭秘
本文详细介绍了进程间通信(IPC)的六种主要方式:管道、信号、消息队列、共享内存、信号量和套接字。每种方式都有其特点和适用场景,如管道适用于父子进程间的通信,消息队列能传递结构化数据,共享内存提供高速数据交换,信号量用于同步控制,套接字支持跨网络通信。通过对比和分析,帮助读者理解并选择合适的IPC机制,以提高系统性能和可靠性。
1349 14
|
11月前
|
机器学习/深度学习 人工智能 编译器
【AI系统】Auto-Tuning 原理
本文探讨了在多样化硬件平台上部署深度神经网络(DNN)时,传统算子库面临的挑战及解决方案。随着硬件平台的多样化和快速迭代,手动编写高性能算子库变得日益困难。文中介绍了基于TVM的三种自动调优系统——AutoTVM、Ansor和Meta Scheduler,它们通过自动生成高性能算子,有效解决了传统方法的局限性,提高了DNN在不同硬件平台上的执行效率。
360 1
|
机器学习/深度学习 数据采集 算法
机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用
医疗诊断是医学的核心,其准确性和效率至关重要。本文探讨了机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用。文章还讨论了Python在构建机器学习模型中的作用,面临的挑战及应对策略,并展望了未来的发展趋势。
766 1
|
12月前
|
机器学习/深度学习 人工智能 搜索推荐
深度学习在医疗影像诊断中的应用与前景####
本文深入探讨了深度学习技术在医疗影像诊断领域的应用现状、面临的挑战以及未来发展趋势。通过分析卷积神经网络(CNN)等深度学习模型在处理复杂医学图像时的优势,结合具体案例,如癌症早期检测、疾病分类及分割等方面取得的显著成果,展示了深度学习如何革新传统医疗影像分析方法。同时,文章也指出了数据隐私保护、模型解释性不足、临床集成难度大等问题,并展望了联邦学习、可解释AI、多模态融合等技术在解决这些问题上的潜力,为推动深度学习在医疗健康领域的更广泛应用提供了思路。 ####
688 0
|
弹性计算 Linux 编译器
CoreBolt——在倚天上基于 Coresight 做 BOLT 优化
CoreBolt 是一种倚天平台的性能优化解决方案。CoreBolt 通过 Coresight 在程序运行时采集程序运行信息,对程序的热代码和冷代码进行区分,并通过 BOLT 对程序进行代码段重排,从而提升程序代码的局部性,减少程序运行过程中由 CPU iCache miss 和 iTLB miss 引发的性能下降,提升程序的整体性能。
1587 6