【参加CUDA线上训练营】——初识CUDA

简介: 初识CUDA

初识CUDA

1.异构计算

1.host CPU和内存
2.Device GPU和显存

2.CUDA的查看

一般显卡,服务器用 nvidia-smi查看相关参数
jetson设备 用jtop查看相关参数

3.程序编写

1.把数据用CPU处理好复制到gpu
2.执行芯片缓存数据,加载gpu程序并执行
3.将计算结果从GPU显存复制到CPU内存中
在这里插入图片描述

关键字:

__global__

将函数声明为内核,在device上执行,device上调用

__device__

执行空间说明符,声明一个函数,在device上执行,host和device上调用

__host__

声明了一个函数,执行和调用都是在host

CUDA编写在这里插入图片描述

int main()在host执行

__global__

在device上执行

CUDA程序的编译

cuda编译用nvcc
从.cu 编译为.o,再从.o编译为可执行文件

NVPROF

分析工具
分析命令:

nvprof -o out.nvvp a.exe
相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
人工智能 并行计算 架构师
CUDA编程模型都改了!英伟达架构师团队撰文详解:Hopper为啥这么牛?
CUDA编程模型都改了!英伟达架构师团队撰文详解:Hopper为啥这么牛?
387 0
|
并行计算
|
并行计算 调度 异构计算
|
存储 并行计算 算法
|
人工智能 并行计算 算法
|
机器学习/深度学习 人工智能 算法
首届TensorFlow开发者大会:值得关注的亮点都在这里(附资源)
当地时间 2 月 15 日,谷歌在加州山景城召开了第一届年度 TensorFlow 开发者大会(TensorFlow Developer Summit 2017),这可算得上是 TensorFlow 开发者、支持者与爱好者的第一次盛会,谷歌也在此次会议上发布了开发者期待已久的 TensorFlow 1.0。
200 0
首届TensorFlow开发者大会:值得关注的亮点都在这里(附资源)
|
并行计算 程序员
|
存储 缓存 并行计算
|
并行计算 异构计算 Windows
|
并行计算 API 异构计算