openCL

首页 标签 openCL
# openCL #
关注
309内容
OpenCL异构计算资料收集
  Easy OpenCL with Python   原文  http://www.drdobbs.com/open-source/easy-opencl-with-python/240162614     OpenCL与python联合工作:与CUDA的前景分析 http://www.opengpu.org/forum.php?mod=viewthread&tid=16571   如果你对python熟,可以用 PyOpenCL, 兼顾 host 端的简洁与 device 端的高效。
GPGPU OpenCL/CUDA 高性能编程的10大注意事项
1.展开循环   如果提前知道了循环的次数,可以进行循环展开,这样省去了循环条件的比较次数。但是同时也不能使得kernel代码太大。   循环展开代码例子: 1 #include 2 using namespace std; 3 4 int main(){ 5 ...
GPGPU OpenCL 获取设备信息
在使用OpenCL编程中,需要对GPU设备的底层理解,这样才能更好的进行代码优化。 比如计算单元CU数量,每个CU的执行单元PE数量,每个CU中的共享内存大小等等。只有了解了这些才能更好的使用共享内存,设计核函数的运行参数等。
GPGPU OpenCL编程步骤与简单实例
http://www.cnblogs.com/xudong-bupt/p/3582780.html  1.OpenCL概念   OpenCL是一个为异构平台编写程序的框架,此异构平台可由CPU、GPU或其他类型的处理器组成。
OpenCL 学习step by step (2) 一个简单的OpenCL的程序
现在,我们开始写一个简单的OpenCL程序,计算两个数组相加的和,放到另一个数组中去。程序用cpu和gpu分别计算,最后验证它们是否相等。OpenCL程序的流程大致如下: 下面是source code中的主要代码:   int main(int argc, char* ar...
OpenCL 学习step by step (1) 安装AMD OpenCL APP
从今天开始学习OpenCL,下面先介绍OpenCL APP(Accelerated Parallel processing)的安装。 下载地址:http://developer.amd.com/tools-and-sdks/opencl-zone/amd-accelerated-parallel-processing-app-sdk/ 根据你的OS,选择相应的SDK版本。
AMD OpenCL大学课程(10)
GPU线程及调度      本节主要讲述OpenCL中的Workgroup如何在硬件设备中被调度执行。同时也会讲一下同一个Workgroup中的workitem,如果它们执行的指令发生diverage(就是执行指令不一致)对性能的影响。
AMD OpenCL大学课程(5)
OpenCL内存模型     OpenCL的内存模型定义了各种各样内存类型,各种内存模型之间有层级关系。各种内存之间的数据传输必须是显式进行的,比如从host memory到device memory,从global memory到local memory等等。
AMD OpenCL大学课程(2)
1、OpenCL架构       OpenCL可以实现混合设备的并行计算,这些设备包括CPU,GPU,以及其它处理器,比如Cell处理器,DSP等。使用OpenCL编程,可以实现可移植的并行加速代码。
免费试用