GPGPU OpenCL/CUDA 高性能编程的10大注意事项
1.展开循环
如果提前知道了循环的次数,可以进行循环展开,这样省去了循环条件的比较次数。但是同时也不能使得kernel代码太大。
循环展开代码例子:
1 #include
2 using namespace std;
3
4 int main(){
5 ...
GPGPU OpenCL使用结构体数据
OpenCL编程中可以使用结构体,只需要在核函数kernel中提供同样的结构体申明就可以啦。
如果在主函数中定义了结构体:
1 typedef struct studentNode{
2 int age;
3 float height;
4 }student;
...
AMD OpenCL大学课程(2)
1、OpenCL架构 OpenCL可以实现混合设备的并行计算,这些设备包括CPU,GPU,以及其它处理器,比如Cell处理器,DSP等。使用OpenCL编程,可以实现可移植的并行加速代码。