最近再看深度学习的时候,了解了一些CUDA和GPU编程的东西,于是便想着用自己熟悉的C++试一试GPU编程的乐趣,然后遇到了一些小坑,在此记录一些。
首先分享一个 CUDA安装的教程,之后开始填坑。
一、First 坑–“应输入表达式”
在调用核函数时,需要用到三重括号<<<>>>
,但是在c/c++语法中,没有这种语法,所以自然会报这个错误,错误截图如下所示:
这个错误无论将代码放在.cu
文件中,还是放在.cpp
文件中,都会出现,解决方法是:将源文件→属性→常规中的“项类型”改为CUDA C/C++
需要注意的是,改完之后,在代码界面仍会有报错提示,但是编译和运行代码已经不受影响了,有强迫症的小伙伴可以试试其他方式
二、Second 坑–程序不进入核函数
这个问题有两种可能性,第一种可能为下载的CUDA版本和电脑中的GPU版本不匹配,这样需要对照自己的GPU算力下载对应算力的CUDA;
第二种可能是当前VS中CUDA的配置不对!!!那我们需要项目→属性→CUDA C/C++→Device→Code Generation,将后边的数字修改为自己GPU的算力。
3、Hello world测试
#include<stdio.h> #include <cuda_runtime.h> #include <device_launch_parameters.h> __global__ void kernal() { printf("\nhello from GPUn"); } int main() { printf("hello from CPUn"); kernal << <1, 5 >> > ();//调用GPU中的5个线程 cudaError_t cudaStatus = cudaGetLastError(); if (cudaStatus != cudaSuccess) { fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cudaStatus)); } cudaDeviceReset(); return 0; }
若没有其他问题,粘贴上述代码可以输入的结果如下所示: