【参加CUDA线上训练营】——初识CUDA

简介: 初识CUDA

初识CUDA

1.异构计算

1.host CPU和内存
2.Device GPU和显存

2.CUDA的查看

一般显卡,服务器用 nvidia-smi查看相关参数
jetson设备 用jtop查看相关参数

3.程序编写

1.把数据用CPU处理好复制到gpu
2.执行芯片缓存数据,加载gpu程序并执行
3.将计算结果从GPU显存复制到CPU内存中
在这里插入图片描述

关键字:

__global__

将函数声明为内核,在device上执行,device上调用

__device__

执行空间说明符,声明一个函数,在device上执行,host和device上调用

__host__

声明了一个函数,执行和调用都是在host

CUDA编写在这里插入图片描述

int main()在host执行

__global__

在device上执行

CUDA程序的编译

cuda编译用nvcc
从.cu 编译为.o,再从.o编译为可执行文件

NVPROF

分析工具
分析命令:

nvprof -o out.nvvp a.exe
相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
并行计算
|
并行计算 调度 异构计算
|
存储 并行计算 算法
|
人工智能 并行计算 算法
|
并行计算 程序员
LiveVideoStackCon讲师热身分享 ( 十三 ) —— Intel QSV技术在FFmpeg中的实现与使用
LiveVideoStackCon 2018音视频技术大会是每年的多媒体技术人的盛宴,为了让参会者与大会讲师更多互动交流,我们推出了LiveVideoStackCon讲师热身分享第一季,在每周四晚19:30,邀请1名大会讲师进行线上分享技术干货,解答热点问题。
1299 0
LiveVideoStackCon讲师热身分享 ( 十三 ) —— Intel QSV技术在FFmpeg中的实现与使用
LiveVideoStackCon 2018音视频技术大会是每年的多媒体技术人的盛宴,为了让参会者与大会讲师更多互动交流,我们推出了LiveVideoStackCon讲师热身分享第一季,在每周四晚19:30,邀请1名大会讲师进行线上分享技术干货,解答热点问题。
1310 0
|
并行计算 API 异构计算
|
存储 缓存 并行计算
|
存储 缓存 并行计算
下一篇
无影云桌面