VS2017中嵌入CUDA编程的一些坑

简介: VS2017中嵌入CUDA编程的一些坑

最近再看深度学习的时候,了解了一些CUDA和GPU编程的东西,于是便想着用自己熟悉的C++试一试GPU编程的乐趣,然后遇到了一些小坑,在此记录一些。


首先分享一个 CUDA安装的教程,之后开始填坑。  



一、First 坑–“应输入表达式”


在调用核函数时,需要用到三重括号<<<>>>,但是在c/c++语法中,没有这种语法,所以自然会报这个错误,错误截图如下所示:

4234effe02514b78b37d6d3e3ba3755c.png

这个错误无论将代码放在.cu文件中,还是放在.cpp文件中,都会出现,解决方法是:将源文件→属性→常规中的“项类型”改为CUDA C/C++

48473bc99d5144d1a8ef6973e6282b67.png

需要注意的是,改完之后,在代码界面仍会有报错提示,但是编译和运行代码已经不受影响了,有强迫症的小伙伴可以试试其他方式




二、Second 坑–程序不进入核函数


这个问题有两种可能性,第一种可能为下载的CUDA版本和电脑中的GPU版本不匹配,这样需要对照自己的GPU算力下载对应算力的CUDA;


第二种可能是当前VS中CUDA的配置不对!!!那我们需要项目→属性→CUDA C/C++→Device→Code Generation,将后边的数字修改为自己GPU的算力。


a934c860e28b4c718fd8e8065eeb623d.png



3、Hello world测试


#include<stdio.h>
#include <cuda_runtime.h>
#include <device_launch_parameters.h>
__global__ void kernal()
{
  printf("\nhello from GPUn");
}
int main()
{
  printf("hello from CPUn");
  kernal << <1, 5 >> > ();//调用GPU中的5个线程
  cudaError_t cudaStatus = cudaGetLastError();
  if (cudaStatus != cudaSuccess)
  {
    fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cudaStatus));
  }
  cudaDeviceReset();
  return 0;
}

若没有其他问题,粘贴上述代码可以输入的结果如下所示:



f40793dc97f24c6a9132fe086788e604.png


相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
1月前
Jetson学习笔记(二):TensorRT 查看模型的输入输出
这篇博客介绍了如何使用TensorRT查看模型的输入输出,并通过代码示例展示了如何获取和验证模型的输入输出信息。
101 5
|
4月前
|
机器学习/深度学习 TensorFlow API
Keras是一个高层神经网络API,由Python编写,并能够在TensorFlow、Theano或CNTK之上运行。Keras的设计初衷是支持快速实验,能够用最少的代码实现想法,并且能够方便地在CPU和GPU上运行。
Keras是一个高层神经网络API,由Python编写,并能够在TensorFlow、Theano或CNTK之上运行。Keras的设计初衷是支持快速实验,能够用最少的代码实现想法,并且能够方便地在CPU和GPU上运行。
|
机器学习/深度学习 人工智能 自然语言处理
PyTorch 之 简介、相关软件框架、基本使用方法、tensor 的几种形状和 autograd 机制-1
PyTorch 是一个基于 Torch 的 Python 开源机器学习库,用于自然语言处理等应用程序。它主要由 Facebook 的人工智能小组开发,不仅能够实现强大的 GPU 加速,同时还支持动态神经网络,这一点是现在很多主流框架如 TensorFlow 都不支持的。
|
并行计算 PyTorch 测试技术
PyTorch 之 简介、相关软件框架、基本使用方法、tensor 的几种形状和 autograd 机制-2
由于要进行 tensor 的学习,因此,我们先导入我们需要的库。
|
PyTorch 算法框架/工具 Python
Pytorch转TensorRT范例代码
Pytorch转TensorRT范例代码
141 0
|
存储 并行计算 API
|
并行计算 索引
|
并行计算 API 索引
|
缓存 并行计算 编译器
|
并行计算 算法
CUDA学习(二十七)
终于结束了CUDA关于纹理内存的介绍,接下来的应该会GPU对原程序的性能优化有关
1560 0