【参加CUDA线上训练营】——实验编写CUDA程序

简介: 实验编写CUDA程序

1.编写第一个程序 Hello CUDA

一般在CPU中写的程序:

#include <stdio.h>

void hello_from_cpu()
{
    printf("Hello World from the CPU!\n");
}

int main(void)
{
    hello_from_cpu();
    return 0;
}

利用CUDA写的程序

#include <stdio.h>

__global__ void hello_from_gpu()
{
    printf("Hello World from the GPU!\n");
}

int main(void)
{
    hello_from_gpu<<<1, 1>>>();
    cudaDeviceSynchronize();
    return 0;
}

2.编译

写完程序之后开始编译两种编译方法

1.nvcc

nvcc -arch=compute_72 -code=sm_72 hello_cuda.cu -o hello_cuda -run

2.Makefile

Makefile内容:

TEST_SOURCE = hello_cuda.cu

TARGETBIN := ./hello_cuda

CC = /usr/local/cuda/bin/nvcc

$(TARGETBIN):$(TEST_SOURCE)
    $(CC)  $(TEST_SOURCE) -o $(TARGETBIN)

.PHONY:clean
clean:
    -rm -rf $(TARGETBIN)
    -rm -rf *.o

命令行输入:make
然后生成一个可执行文件
接着输入:./hello_cuda
即可运行文件

再利用nvprof来查看性能:

nvprof ./hello_cuda

在这里插入图片描述

目录
相关文章
|
3月前
|
机器学习/深度学习 并行计算 PyTorch
从零开始下载torch+cu(无痛版)
这篇文章提供了一个详细的无痛版教程,指导如何从零开始下载并配置支持CUDA的PyTorch GPU版本,包括查看Cuda版本、在官网检索下载包名、下载指定的torch、torchvision、torchaudio库,并在深度学习环境中安装和测试是否成功。
从零开始下载torch+cu(无痛版)
|
编译器 Linux
手把手教你从零开始搭建友善之臂ARM-tiny4412开发环境
手把手教你从零开始搭建友善之臂ARM-tiny4412开发环境
475 0
|
并行计算 调度 异构计算
|
缓存 并行计算 芯片
|
TensorFlow 算法框架/工具 iOS开发
《从零到一:IOS平台TensorFlow入门及应用详解(附源》电子版地址
从零到一:IOS平台TensorFlow入门及应用详解(附源
82 0
《从零到一:IOS平台TensorFlow入门及应用详解(附源》电子版地址
|
PyTorch 算法框架/工具
pytorch使用方法积累
1. net.parameters()查看网络参数 2. torch.optim.lr_scheduler.MultiStepLR 2.1 学习率的参数配置
93 0
|
并行计算 异构计算
动手撸个MNIST分类(CPU版本+GPU版本)
动手撸个MNIST分类(CPU版本+GPU版本)
138 0
动手撸个MNIST分类(CPU版本+GPU版本)
|
并行计算 API C语言
|
并行计算 API 异构计算
|
并行计算 编译器 C语言