VS2017中嵌入CUDA编程的一些坑

简介: VS2017中嵌入CUDA编程的一些坑

最近再看深度学习的时候,了解了一些CUDA和GPU编程的东西,于是便想着用自己熟悉的C++试一试GPU编程的乐趣,然后遇到了一些小坑,在此记录一些。


首先分享一个 CUDA安装的教程,之后开始填坑。  



一、First 坑–“应输入表达式”


在调用核函数时,需要用到三重括号<<<>>>,但是在c/c++语法中,没有这种语法,所以自然会报这个错误,错误截图如下所示:

4234effe02514b78b37d6d3e3ba3755c.png

这个错误无论将代码放在.cu文件中,还是放在.cpp文件中,都会出现,解决方法是:将源文件→属性→常规中的“项类型”改为CUDA C/C++

48473bc99d5144d1a8ef6973e6282b67.png

需要注意的是,改完之后,在代码界面仍会有报错提示,但是编译和运行代码已经不受影响了,有强迫症的小伙伴可以试试其他方式




二、Second 坑–程序不进入核函数


这个问题有两种可能性,第一种可能为下载的CUDA版本和电脑中的GPU版本不匹配,这样需要对照自己的GPU算力下载对应算力的CUDA;


第二种可能是当前VS中CUDA的配置不对!!!那我们需要项目→属性→CUDA C/C++→Device→Code Generation,将后边的数字修改为自己GPU的算力。


a934c860e28b4c718fd8e8065eeb623d.png



3、Hello world测试


#include<stdio.h>
#include <cuda_runtime.h>
#include <device_launch_parameters.h>
__global__ void kernal()
{
  printf("\nhello from GPUn");
}
int main()
{
  printf("hello from CPUn");
  kernal << <1, 5 >> > ();//调用GPU中的5个线程
  cudaError_t cudaStatus = cudaGetLastError();
  if (cudaStatus != cudaSuccess)
  {
    fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cudaStatus));
  }
  cudaDeviceReset();
  return 0;
}

若没有其他问题,粘贴上述代码可以输入的结果如下所示:



f40793dc97f24c6a9132fe086788e604.png


相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
11月前
|
存储 API 计算机视觉
编译 MXNet 模型
编译 MXNet 模型
|
11月前
|
缓存 并行计算 算法
【CUDA学习笔记】第六篇:CUDA中的高级概念(上)
【CUDA学习笔记】第六篇:CUDA中的高级概念(上)
211 0
|
11月前
|
并行计算 计算机视觉 异构计算
【CUDA学习笔记】第三篇:CUDA C并行化编程【下半部分】(附案例代码下载方式)(二)
【CUDA学习笔记】第三篇:CUDA C并行化编程【下半部分】(附案例代码下载方式)(二)
122 0
【CUDA学习笔记】第三篇:CUDA C并行化编程【下半部分】(附案例代码下载方式)(二)
|
11月前
|
缓存 并行计算 API
【CUDA学习笔记】第三篇:CUDA C并行化编程【下半部分】(附案例代码下载方式)(一)
【CUDA学习笔记】第三篇:CUDA C并行化编程【下半部分】(附案例代码下载方式)(一)
128 0
|
11月前
|
存储 并行计算 程序员
【CUDA学习笔记】第二篇:CUDA C并行化编程【上半部分】(附案例代码下载方式)
【CUDA学习笔记】第二篇:CUDA C并行化编程【上半部分】(附案例代码下载方式)
249 0
|
并行计算 异构计算
|
缓存 并行计算 编译器
|
并行计算 调度