3.2 逐步性能提升
本书的示例表明,通过提交更多的活动和优化数据传输,使用性能分析驱动的开发可不断提升OpenACC应用程序的性能。图3-2列出了优化混合应用遵循的模式。
从应用准备开始性能优化周期,然后进行实际的性能测量,并对性能数据进行分析。基于这些数据,编程开发人员尝试减少性能问题,并重新开始整个过程。
下面使用Score-P和Vampri讲解性能提升周期里的前三步,以CUDA加速粒子单元模拟为例,其中CUDA部分代码很容易用OpenACC实现代替来获得同样的结果。此外,还引入了各种优化步骤,突出了更普遍适用的性能调优选项。