文档备案控制台

开发者社区云计算文章正文

【参加CUDA线上训练营】——实验编写CUDA程序

2023-02-07 410

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 实验编写CUDA程序

1.编写第一个程序 Hello CUDA

一般在CPU中写的程序：

#include <stdio.h>

void hello_from_cpu()
{
    printf("Hello World from the CPU!\n");
}

int main(void)
{
    hello_from_cpu();
    return 0;
}

利用CUDA写的程序

#include <stdio.h>

__global__ void hello_from_gpu()
{
    printf("Hello World from the GPU!\n");
}

int main(void)
{
    hello_from_gpu<<<1, 1>>>();
    cudaDeviceSynchronize();
    return 0;
}

2.编译

写完程序之后开始编译两种编译方法

1.nvcc

nvcc -arch=compute_72 -code=sm_72 hello_cuda.cu -o hello_cuda -run

2.Makefile

Makefile内容：

TEST_SOURCE = hello_cuda.cu

TARGETBIN := ./hello_cuda

CC = /usr/local/cuda/bin/nvcc

$(TARGETBIN):$(TEST_SOURCE)
    $(CC)  $(TEST_SOURCE) -o $(TARGETBIN)

.PHONY:clean
clean:
    -rm -rf $(TARGETBIN)
    -rm -rf *.o

命令行输入：make
然后生成一个可执行文件
接着输入：./hello_cuda
即可运行文件

再利用nvprof来查看性能：

nvprof ./hello_cuda

在这里插入图片描述

文章标签：

并行计算

Lvzt

目录

相关文章

wljslmz

|

关系型数据库 MySQL 网络安全

MySQL 8教程：详解如何更改和重置用户密码

【4月更文挑战第2天】

wljslmz

12088 1 2

MySQL 8教程：详解如何更改和重置用户密码

游客nhhwponctadnk

|

Prometheus 监控 Cloud Native

【监控利器Prometheus】——Prometheus+Grafana监控SpringBoot项目JVM信息

Prometheus+Grafana监控SpringBoot项目JVM信息 1. SpringBoot项目配置JVM采集 2. Prometheus配置 3. 配置grafana 4. 扩展-通过JMX Exporter监控JVM信息

游客nhhwponctadnk

3031 0 0

【监控利器Prometheus】——Prometheus+Grafana监控SpringBoot项目JVM信息

云小帮

|

4月前

|

存储弹性计算人工智能

阿里云服务器多少钱一年？新老用户差价惊人，2026优惠政策解读

2026年阿里云服务器价格大解析：轻量新用户38元/年起，ECS普惠款99元/年；新老用户价差显著，多年付低至3折。本文详解轻量与ECS年付价格表，附5大实测省钱技巧——抢秒杀、选多年付、避按量坑、叠优惠券、按需配配置，助个人开发者、学生及中小企业精准控本、低成本上云。（240字）

云小帮

355 2 2

尹正杰

|

虚拟化

ESXI 6.0使用指南

关于如何开启和使用ESXI 6.0的WebUI以及进行基本操作的指南。

尹正杰

1063 2 3

ephemerals__

|

存储编译器 C++

【c++】类和对象（中）（构造函数、析构函数、拷贝构造、赋值重载）

本文深入探讨了C++类的默认成员函数，包括构造函数、析构函数、拷贝构造函数和赋值重载。构造函数用于对象的初始化，析构函数用于对象销毁时的资源清理，拷贝构造函数用于对象的拷贝，赋值重载用于已存在对象的赋值。文章详细介绍了每个函数的特点、使用方法及注意事项，并提供了代码示例。这些默认成员函数确保了资源的正确管理和对象状态的维护。

ephemerals__

959 4 4

opencv学堂

|

机器学习/深度学习算法开发工具

【YOLOv8量化】普通CPU上加速推理可达100+FPS

【YOLOv8量化】普通CPU上加速推理可达100+FPS

opencv学堂

2540 0 0

八百标兵奔北坡

|

算法大数据 Python

局部异常因子（LOF）

局部异常因子（LOF）

八百标兵奔北坡

727 3 3

宋晨明

|

机器学习/深度学习算法 PyTorch

Pytorch-SGD算法解析

SGD（随机梯度下降）是机器学习中常用的优化算法，特别适用于大数据集和在线学习。与批量梯度下降不同，SGD每次仅使用一个样本来更新模型参数，提高了训练效率。本文介绍了SGD的基本步骤、Python实现及PyTorch中的应用示例。

宋晨明

1221 0 0

源码星辰

|

机器学习/深度学习测试技术 PyTorch

深度学习之测量GPU性能的方式

在深度学习中，测量GPU性能是一个多方面的任务，涉及运行时间、吞吐量、GPU利用率、内存使用情况、计算能力、端到端性能测试、显存带宽、框架自带性能工具和基准测试工具等多种方法。通过综合使用这些方法，可以全面评估和优化GPU的性能，提升深度学习任务的效率和效果。

源码星辰

1564 3 3

热门文章

最新文章

开发函数计算的正确姿势 —— 安装第三方依赖

windows环境下NPM / NodeJS的安装配置

好域名怎么选？总结15名网站大佬给我的8条建议！（精华）

.NET Core多平台开发体验[4]: Docker

FPGA - 7系列 FPGA内部结构之SelectIO -08- 高级逻辑资源之OSERDESE2（一）

阿里云山东特色产业集群

MySQL8.0InnoDB的架构。

性能优化技巧 - 集群维表

使用序列化快速读写XML文件

Python读写excel

AnalyticDB MySQL vs StarRocks/ByteHouse：云数仓选型指南——全托管 vs 自建方案

AnalyticDB MySQL vs Hologres：阿里云内部数仓产品如何选——场景化选型指南

AnalyticDB MySQL vs Snowflake：国内企业为什么选择阿里云 AnalyticDB

AnalyticDB MySQL vs ClickHouse：OLAP 数据库选型深度对比——谁更适合企业级分析

AnalyticDB MySQL vs Apache Doris：企业级云数仓如何选型——全维度对比指南

全链路闭环管理：ERP-MES 双向数据交互原理与落地说明

一篇文章讲清楚 AI Agent：从 Token、RAG、Skill 到 MCP、SDD 和 Harness 工程

2026出海海外客服机器人怎么选？五家厂商多语言能力与全球号码接入横评

Vibe Coding 实战：定义不是关键，可落地的工作流才是核心

云原生多租户隔离 + 近实时分析怎么选型？阿里云 AnalyticDB MySQL 资源隔离方案

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

阿里云正式发布 Agentic 代码安全：AI驱动的双Agent协同引擎