《CUDA高性能并行计算》----导读

简介: Praise 本书赞誉 FORTRAN(盛行于20世纪60年代)是最早允许我们在大型机上编程的语言。之后是BASIC(流行于20世纪80年代)赋予我们为第一批微型计算机编写程序的能力。现在轮到CUDA,让我们可以为超级微型计算机编写程序。

CUDA_A
CUDA_

目 录

[第0章 本书导读
0.1 什么是CUDA](https://yq.aliyun.com/articles/90038)
0.2 学习CUDA的“须知”
0.3 本书的读者对象
0.4 学习CUDA的必备
0.5 本书的组织结构
0.6 本书体例
0.7 本书代码
0.8 用户指南
[0.9 历史沿革
参考文献](https://yq.aliyun.com/articles/90059)
[第1章 起步
1.1 运行CUDA样例程序
1.1.1 在Windows下运行CUDA样例程序
1.1.2 在Linux下运行CUDA样例程序
1.1.3 估计“加速效果”](https://yq.aliyun.com/articles/89954)
[1.2 运行我们自己的串行程序
1.2.1 dist_v1应用
1.2.2 dist_v2应用](https://yq.aliyun.com/articles/89962)
1.3 本章小结
1.4 推荐项目
[第2章 CUDA基础知识
2.1 CUDA并行模式 ](https://yq.aliyun.com/articles/89976)
2.2 需要知道的CUDA API和C语言拓展
2.3 本章小结
[2.4 推荐项目
参考文献](https://yq.aliyun.com/articles/89986)
[第3章 从循环到网格
3.1 并行化 dist_v](https://yq.aliyun.com/articles/90003)
3.2 并行化dist_v
3.3 标准操作流程
[3.4 简化操作流程
3.4.1 统一内存和托管数组
3.4.2 使用cudaMallocManaged()实现的距离应用](https://yq.aliyun.com/articles/90024/)
3.5 本章小结
[3.6 推荐项目
参考文献](https://yq.aliyun.com/articles/90032)
第4章 二维网格与交互式图形
4.1 启动二维计算网格
4.1.1 二维内核启动的语法
4.1.2 定义二维内核
4.1.3 dist_2d
4.2 通过图形交互实时显示
4.3 stability应用程序
4.4 本章小结
4.5 推荐项目
参考文献
第5章 模板与共享内存
5.1 线程间依赖
5.2 一维网格上的导数计算
5.2.1 实现dd_ld_global
5.2.2 实现dd_ld_shared
5.2.3 解决二维拉普拉斯方程:heat_2d
5.2.4 图像边缘锐化:sharpen
5.3 本章小结
5.4 推荐项目
参考文献
第6章 归约与原子操作
6.1 全局交互的线程
6.2 实现parallel_dot
6.3 计算整体属性:centroid_2d
6.4 本章小结
6.5 推荐项目
参考文献
第7章 三维数据交互
7.1 计算三维网格数据:dist_3d
7.2 查看三维数据并与之交互:vis_3d
7.2.1 切片法
7.2.2 体绘制法
7.2.3 光线投射法
7.2.4 创建vis_3d应用
7.3 本章小结
7.4 推荐项目
参考文献
第8章 CUDA函数库实践
8.1 自定义的与现有的
8.2 Thrust库
8.2.1 使用inner_product()计算向量的模
8.2.2 使用transform()计算距离
8.2.3 使用generate()、transform()以及reduce()对的值进行估计
8.3 cuRAND库
8.4 NPP库
8.4.1 sharpen_npp
8.4.2 更多使用NPP进行的图像处理操作
8.5 线性代数中的cuSOLVER和cuBLAS实践
8.6 cuDNN库
8.7 ArrayFire库
8.8 本章小结
8.9 推荐项目
参考文献
第9章 探索CUDA生态系统
9.1 主要资源的权威列表
9.1.1 CUDA空间
9.1.2 其他的主要网络资源
9.1.3 在线课程
9.1.4 CUDA书籍
9.2 更多资源
9.2.1 CUDA样例
9.2.2 CUDA语言和库
9.2.3 更多的CUDA书籍
9.3 本章小结
9.4 推荐项目
附录A 硬件设置
附录B 软件设置
附录C C语言编程须知
附录D CUDA实践技巧:计时、性能分析、错误处理与调试

相关文章
|
并行计算 C++ 异构计算
Nvidia 并行计算架构 CUDA 分析(一)——CUDA 简介
    CUDA(Compute Unified Device Architecture,统一计算设备架构)是由 NVIDIA 推出的通用并行计算架构,该架构使 GPU 能够解决复杂的计算问题。
4820 0
|
并行计算
《CUDA高性能并行计算》----2.3 本章小结
现在你已经掌握了开始创建一个拥有使用了CUDA进行GPU并行计算的优点的应用所必需的工具,我们将在第3章中开始创建CUDA应用。
822 0
|
并行计算 C语言
《CUDA高性能并行计算》----0.9 历史沿革
本书是作者在CUDA疆域探险数年的经验总结。最初开展的是容积医学影像(volumetric medical imaging)、2D和3D成像(即透视和CT扫描)的配准以及计算机辅助设计(computer-aided design)和增材制造(additive manufacturing)的新方法研究。
1237 0
|
存储 并行计算
《CUDA高性能并行计算》----3.5 本章小结
在本章中,我们使用CUDA依次创建了``dist_v1``与``dist_v2``的并行化版本``—dist_v1_cuda``与``dist_v2_cuda``。 ``dist_v2_cuda``为CUDA应用标准工作流程提供范例。下面是一些简明的内容回顾(CUDA应用包括的大致步骤):
1280 0
|
并行计算
《CUDA高性能并行计算》----1.3 本章小结
在本章,我们运行了一些CUDA样例程序并且获得了GPU并行计算的直观体验。同时我们介绍了两个串行的程序,将在后文作为并行化的实验函数。其中dist_v1提供了一个最简单的并行化实验例子,而dist_v2则描述了一个实用的结构和更典型的数据流。
1187 0
|
并行计算 Linux
《CUDA高性能并行计算》----0.6 本书体例
本书使用以下约定: 为了跟正常文字区分,代码清单使用等宽(monospace)字体排版。 我们经常把类UNIX系统,如Linux和OS X,统一称为Linux。 我们把完整的示例程序称为应用程序(简写为app)。
924 0
|
并行计算 C++ Windows
《CUDA高性能并行计算》----0.7 本书代码
本书应用程序的代码可以通过www.cudaforengineers.com获取。虽然书中采用了一些代码片断和“骨架”代码(skeleton code),但标记为“代码清单”的代码(包含行号)是真实可运行代码的一部分。
2016 0
|
Web App开发 并行计算 异构计算
《CUDA高性能并行计算》----2.4 推荐项目
1.去CUDA Zone注册并加入到CUDA开发者中(如果读者还没有这样做的话)。 2.观看 www.nvidia.com/object/nvision08_gpu_v_cpu.html的视频,体会关于并行和串行执行的有趣的对比。
1856 0