VS2017中嵌入CUDA编程的一些坑

简介: VS2017中嵌入CUDA编程的一些坑

最近再看深度学习的时候,了解了一些CUDA和GPU编程的东西,于是便想着用自己熟悉的C++试一试GPU编程的乐趣,然后遇到了一些小坑,在此记录一些。


首先分享一个 CUDA安装的教程,之后开始填坑。  



一、First 坑–“应输入表达式”


在调用核函数时,需要用到三重括号<<<>>>,但是在c/c++语法中,没有这种语法,所以自然会报这个错误,错误截图如下所示:

4234effe02514b78b37d6d3e3ba3755c.png

这个错误无论将代码放在.cu文件中,还是放在.cpp文件中,都会出现,解决方法是:将源文件→属性→常规中的“项类型”改为CUDA C/C++

48473bc99d5144d1a8ef6973e6282b67.png

需要注意的是,改完之后,在代码界面仍会有报错提示,但是编译和运行代码已经不受影响了,有强迫症的小伙伴可以试试其他方式




二、Second 坑–程序不进入核函数


这个问题有两种可能性,第一种可能为下载的CUDA版本和电脑中的GPU版本不匹配,这样需要对照自己的GPU算力下载对应算力的CUDA;


第二种可能是当前VS中CUDA的配置不对!!!那我们需要项目→属性→CUDA C/C++→Device→Code Generation,将后边的数字修改为自己GPU的算力。


a934c860e28b4c718fd8e8065eeb623d.png



3、Hello world测试


#include<stdio.h>
#include <cuda_runtime.h>
#include <device_launch_parameters.h>
__global__ void kernal()
{
  printf("\nhello from GPUn");
}
int main()
{
  printf("hello from CPUn");
  kernal << <1, 5 >> > ();//调用GPU中的5个线程
  cudaError_t cudaStatus = cudaGetLastError();
  if (cudaStatus != cudaSuccess)
  {
    fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cudaStatus));
  }
  cudaDeviceReset();
  return 0;
}

若没有其他问题,粘贴上述代码可以输入的结果如下所示:



f40793dc97f24c6a9132fe086788e604.png


相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
3月前
|
机器学习/深度学习 TensorFlow API
Keras是一个高层神经网络API,由Python编写,并能够在TensorFlow、Theano或CNTK之上运行。Keras的设计初衷是支持快速实验,能够用最少的代码实现想法,并且能够方便地在CPU和GPU上运行。
Keras是一个高层神经网络API,由Python编写,并能够在TensorFlow、Theano或CNTK之上运行。Keras的设计初衷是支持快速实验,能够用最少的代码实现想法,并且能够方便地在CPU和GPU上运行。
|
5月前
|
API 算法框架/工具 异构计算
Python中Keras微调Google Gemma:定制化指令增强大语言模型LLM
Python中Keras微调Google Gemma:定制化指令增强大语言模型LLM
|
机器学习/深度学习 PyTorch 算法框架/工具
Pytorch基础模块一模型(1)
Pytorch基础模块一模型(1)
|
缓存 并行计算 算法
【CUDA学习笔记】第六篇:CUDA中的高级概念(上)
【CUDA学习笔记】第六篇:CUDA中的高级概念(上)
307 0
|
并行计算 PyTorch 测试技术
PyTorch 之 简介、相关软件框架、基本使用方法、tensor 的几种形状和 autograd 机制-2
由于要进行 tensor 的学习,因此,我们先导入我们需要的库。
|
机器学习/深度学习 人工智能 自然语言处理
PyTorch 之 简介、相关软件框架、基本使用方法、tensor 的几种形状和 autograd 机制-1
PyTorch 是一个基于 Torch 的 Python 开源机器学习库,用于自然语言处理等应用程序。它主要由 Facebook 的人工智能小组开发,不仅能够实现强大的 GPU 加速,同时还支持动态神经网络,这一点是现在很多主流框架如 TensorFlow 都不支持的。
|
PyTorch 算法框架/工具 Python
Pytorch转TensorRT范例代码
Pytorch转TensorRT范例代码
139 0
|
并行计算 C语言 编译器
|
人工智能 JSON API
MxNet与Caffe模型之间转换的桥梁-Onnx
Open Neural Network Exchange (ONNX)为AI模型提供了一种开源的数据模型格式。它定义了一个可扩展的计算图模型,以及内置运算符和标准数据类型的定义。它可以作为各种AI模型之间进行转换的媒介,例如,市面上没有现成的Caffe模型到MxNet模型的转换工具,我们可以借助于ONNX,首先将Caffe转换为Onnx,然后再将Onnx转换为MxNet,更为神奇的是,这之间的转换过程不过丢失原有模型的精度。
299 0
|
并行计算 异构计算
下一篇
无影云桌面