Jarvis-拍立淘里面的深度学习引擎
深度学习的原理?局部响应归一化的作用?兄弟今天不是来讨论这个的,那都是科学家和算法同学的事儿。作为一个深度学习引擎,使命只有一个——就是快速和准确的计算。那怎么才能快呢?。。。借助于GPU(OpenCL),可以让运算飞起。。。
OpenCL异构计算资料收集
Easy OpenCL with Python
原文 http://www.drdobbs.com/open-source/easy-opencl-with-python/240162614
OpenCL与python联合工作:与CUDA的前景分析
http://www.opengpu.org/forum.php?mod=viewthread&tid=16571
如果你对python熟,可以用 PyOpenCL, 兼顾 host 端的简洁与 device 端的高效。
GPGPU OpenCL 精确字符串查找
字符串查找是信息安全、信息过滤领域的重要操作,尤其是对大文本的实时处理。这篇作为实例,使用GPU OpenCL进行精确模式串查找。
1.加速方法
(1)将少量常量数据,如模式串长度、文本长度等,保存在线程的private memory中。
GPGPU OpenCL 获取设备信息
在使用OpenCL编程中,需要对GPU设备的底层理解,这样才能更好的进行代码优化。
比如计算单元CU数量,每个CU的执行单元PE数量,每个CU中的共享内存大小等等。只有了解了这些才能更好的使用共享内存,设计核函数的运行参数等。
GPGPU OpenCL编程步骤与简单实例
http://www.cnblogs.com/xudong-bupt/p/3582780.html
1.OpenCL概念
OpenCL是一个为异构平台编写程序的框架,此异构平台可由CPU、GPU或其他类型的处理器组成。
OpenCL 学习step by step (7) 灰度图Histogram计算(1)
histogram翻译成中文就是直方图,在计算机图像处理和视觉技术中,通常用histogram来进行图像匹配,从而完成track,比如meanshift跟踪算法中,经常要用到图像的直方图。 灰度图的histogram计算,首先要选择bin(中文可以称作槽)的数量,对于灰度图,像素的范围通常是[0-255],所以bin的数目就是256,然后我们循环整幅图像,统计出每种像素值出现的次数,放到对应的bin中。