CUDA学习(二十四)-阿里云开发者社区

开发者社区> night李> 正文

CUDA学习(二十四)

简介:
+关注继续查看

共享内存的影响:
共享内存在多​​种情况下可能会有所帮助,例如帮助合并或消除对全局内存的冗余访问。但是,它也可以作为占用限制。在许多情况下,内核所需的共享内存量与所选块的大小有关,但线程与共享内存元素的映射不需要是一对一的。例如,可能需要在内核中使用32x32元素共享内存阵列,但由于每块最大线程数为512,因此无法启动每块32x32线程的内核。在这种情况下,可以启动32x16或32x8线程的内核,每个线程分别处理共享内存阵列的两个或四个元素。使用单个线程来处理共享内存阵列的多个元素的方法可能是有益的,即使每个块的线程限制不是问题。这是因为每个元素的一些操作可以由线程执行一次,将成本分摊到线程处理的共享内存元素的数量上。
确定性能对占用情况的敏感度的一项有用技术是通过试验动态分配的共享内存量,如执行配置的第三个参数中指定的那样。 通过简单地增加这个参数(不修改内核),可以有效地减少内核的占用率并测量它对性能的影响。
如前一节所述,一旦达到50%以上的占有率,通常不会优化参数以获得更高的入住率。 先前的技术可以用来确定是否已经达到这样的平台。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
9495 0
CUDA学习(六十五)
很早之前就发现云栖社区的编辑器有一个Bug,往草稿箱存博客,当草稿箱博客数超过十篇时,无法再选择十篇前的博客进行编辑
2094 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13183 0
Ubuntu 18.04 LTS+GTX1080Ti+CUDA10.0 深度学习主机环境搭建
由于之前的主机存在运行docker自动重启的问题,跑模型没问题,排查之后没有发现问题所在,所以最后决定升级技嘉主板的bios并重新安装系统和环境。
871 0
5 Ubuntu 18.04 LTS+GTX1080Ti+CUDA10.0 深度学习主机环境搭建
由于之前的主机存在运行docker自动重启的问题,跑模型没问题,排查之后没有发现问题所在,所以最后决定升级技嘉主板的bios并重新安装系统和环境。
426 0
+关注
night李
对机器视觉 图像处理有一定的兴趣 要做一条有梦想的咸鱼
225
文章
4
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载