《CUDA高性能并行计算》----3.6 推荐项目

简介: 1.改变距离数组中的元素数目并进行实验。当你将数目N定义成128、1024、63、65的时候是否遇到了一些问题? 2.计算包含4096个距离的距离数组并尝试改变TPB。你可以在系统上运行的最大(和最小)线程块大小是多大?注意,这个问题的答案依赖于你的GPU设备的计算能力。

本 节 书 摘 来 自 华 章 出 版 社 《CUDA高性能并行计算》 一 书 中 的 第3章,第3.6节, 作 者 CUDA for Engineers: An Introduction to High-Performance Parallel Computing[美] 杜安·斯托尔蒂(Duane Storti)梅特·尤尔托卢(Mete Yurtoglu) 著,苏统华 项文成 李松泽 姚宇鹏 孙博文 译 , 更 多 章 节 内 容 可 以 访 问 云 栖 社 区 “华 章 计 算 机” 公 众 号 查 看。

3.6 推荐项目

1.改变距离数组中的元素数目并进行实验。当你将数目N定义成128、1024、63、65的时候是否遇到了一些问题?

2.计算包含4096个距离的距离数组并尝试改变TPB。你可以在系统上运行的最大(和最小)线程块大小是多大?注意,这个问题的答案依赖于你的GPU设备的计算能力。参考《CUDA C Programming Guide》[1]来检查你的结果是否和其中的“每个线程块最大线程数目”的表格相同。


4cfe3b6c87d4454d3dffe7f45cdce23d202ac35b
相关文章
|
并行计算
《CUDA高性能并行计算》----1.4 推荐项目
项目1~5是关于运行其他CUDA样例程序的练习。
1436 0
|
Web App开发 并行计算 异构计算
《CUDA高性能并行计算》----2.4 推荐项目
1.去CUDA Zone注册并加入到CUDA开发者中(如果读者还没有这样做的话)。 2.观看 www.nvidia.com/object/nvision08_gpu_v_cpu.html的视频,体会关于并行和串行执行的有趣的对比。
1881 0
|
并行计算 C++ Windows
《CUDA高性能并行计算》----0.7 本书代码
本书应用程序的代码可以通过www.cudaforengineers.com获取。虽然书中采用了一些代码片断和“骨架”代码(skeleton code),但标记为“代码清单”的代码(包含行号)是真实可运行代码的一部分。
2033 0
|
存储 并行计算
《CUDA高性能并行计算》----3.5 本章小结
在本章中,我们使用CUDA依次创建了``dist_v1``与``dist_v2``的并行化版本``—dist_v1_cuda``与``dist_v2_cuda``。 ``dist_v2_cuda``为CUDA应用标准工作流程提供范例。下面是一些简明的内容回顾(CUDA应用包括的大致步骤):
1302 0
|
并行计算
《CUDA高性能并行计算》----2.3 本章小结
现在你已经掌握了开始创建一个拥有使用了CUDA进行GPU并行计算的优点的应用所必需的工具,我们将在第3章中开始创建CUDA应用。
829 0
|
并行计算
《CUDA高性能并行计算》----导读
Praise 本书赞誉 FORTRAN(盛行于20世纪60年代)是最早允许我们在大型机上编程的语言。之后是BASIC(流行于20世纪80年代)赋予我们为第一批微型计算机编写程序的能力。现在轮到CUDA,让我们可以为超级微型计算机编写程序。
1376 0
|
并行计算 C语言
《CUDA高性能并行计算》----0.9 历史沿革
本书是作者在CUDA疆域探险数年的经验总结。最初开展的是容积医学影像(volumetric medical imaging)、2D和3D成像(即透视和CT扫描)的配准以及计算机辅助设计(computer-aided design)和增材制造(additive manufacturing)的新方法研究。
1252 0
|
并行计算
《CUDA高性能并行计算》----1.3 本章小结
在本章,我们运行了一些CUDA样例程序并且获得了GPU并行计算的直观体验。同时我们介绍了两个串行的程序,将在后文作为并行化的实验函数。其中dist_v1提供了一个最简单的并行化实验例子,而dist_v2则描述了一个实用的结构和更典型的数据流。
1197 0