《CUDA高性能并行计算》----0.3 本书的读者对象

简介: 我们的目标读者是懂技术的工程师。如果你是一个在职工程师或是学习了一年工程课程的大学生,那么本书就是为你准备的。本书提供的实例期望以清晰明了的方式帮助工程师利用CUDA驱动的计算,这些实例包括:

本 节 书 摘 来 自 华 章 出 版 社 《CUDA高性能并行计算》 一 书 中 的 第0章,第0.3节, 作 者 CUDA for Engineers: An Introduction to High-Performance Parallel Computing[美] 杜安·斯托尔蒂(Duane Storti)梅特·尤尔托卢(Mete Yurtoglu) 著,苏统华 项文成 李松泽 姚宇鹏 孙博文 译 , 更 多 章 节 内 容 可 以 访 问 云 栖 社 区 “华 章 计 算 机” 公 众 号 查 看。

0.3 本书的读者对象

我们的目标读者是懂技术的工程师。如果你是一个在职工程师或是学习了一年工程课程的大学生,那么本书就是为你准备的。本书提供的实例期望以清晰明了的方式帮助工程师利用CUDA驱动的计算,这些实例包括:

可视化二维(2D)和三维(3D)数据;

求解微分方程并不断改变初始值或边界条件;

显示/处理图像或图像栈;

计算内积和质心;

求解线性代数方程组;

蒙特卡罗计算。

我们假设你仅有少量开展计算的经验。学习过一门使用C或C++进行计算的入门级课程就足够了。如果你之前使用的是其他编程语言,那么附录C可以为你快速上手提供帮助。当你的应用程序涉及创建数组和循环结构,你就可以欣赏到基于CPU系统的串行计算典范与基于GPU和CUDA方式的并行计算范式的鲜明对比。

至于所需要的数学基础,接触过微分方程、有限差分逼近和线性代数将有助于理解某几个实例。即便没有这方面的储备也没有大碍,我们同时会提供必备的基础知识。当一个例子涉及专业背景时,会在讲述例子之前提供相关数学和工程概念的扼要说明,确保你甚至可以欣赏和领会在你专业之外的示例应用。

与背景知识同样不做要求的还有一些。你不需要和我们一起完全进入CUDA;你不需要成为一个计算机科学家或经验丰富的专业程序员;你不需要任何特定技术领域的背景知识;你也不需要具备高端的或者稀奇的计算系统。

相关文章
|
运维 监控 安全
交换机镜像之流镜像,有哪些分类?
【10月更文挑战第3天】
765 1
交换机镜像之流镜像,有哪些分类?
|
域名解析 SQL 网络协议
Hexo 个人博客快速部署到Gitee&Coding详细教程
Hexo 个人博客快速部署到Gitee&Coding详细教程
1285 0
Hexo 个人博客快速部署到Gitee&Coding详细教程
|
缓存 图形学
Unity 之 关于UnityHub无法打开项目的问题(弹出Unity启动界面有退回到Hub选择工程界面)
弹出Unity启动界面有退回到Hub选择工程界面方案一:万能的重启大法;方案二:未开启许可证;方案三:终极奥义 -- 弃用Hub
3847 0
Unity 之 关于UnityHub无法打开项目的问题(弹出Unity启动界面有退回到Hub选择工程界面)
|
IDE Linux 程序员
技术经验解读:【转】IO空间,IO端口,MMIO
技术经验解读:【转】IO空间,IO端口,MMIO
1002 0
|
Windows
windows端口冲突解决办法
windows端口冲突解决办法
476 1
windows端口冲突解决办法
|
监控 算法 数据挖掘
ERP系统中的生产线排程与调度优化解析
【7月更文挑战第25天】 ERP系统中的生产线排程与调度优化解析
617 6
|
Cloud Native 关系型数据库 分布式数据库
数据库性能诊断工具DBdoctor通过阿里云PolarDB产品生态集成认证
DBdoctor(V3.1.0)成功通过阿里云PolarDB分布式版(V2.3)集成认证,展现优秀兼容性和稳定性。此工具是聚好看科技的内核级数据库性能诊断产品,运用eBPF技术诊断SQL执行,提供智能巡检、根因分析和优化建议。最新版V3.1.1增加了对PolarDB-X和OceanBase的支持,以及基于cost的索引诊断功能。PolarDB-X是阿里巴巴的高性能云原生分布式数据库,兼容MySQL生态。用户可通过提供的下载地址、在线试用链接和部署指南体验DBdoctor。
702 0
|
设计模式 C++ 开发者
C++一分钟之-智能指针:unique_ptr与shared_ptr
【6月更文挑战第24天】C++智能指针`unique_ptr`和`shared_ptr`管理内存,防止泄漏。`unique_ptr`独占资源,离开作用域自动释放;`shared_ptr`通过引用计数共享所有权,最后一个副本销毁时释放资源。常见问题包括`unique_ptr`复制、`shared_ptr`循环引用和裸指针转换。避免这些问题需使用移动语义、`weak_ptr`和明智转换裸指针。示例展示了如何使用它们管理资源。正确使用能提升代码安全性和效率。
330 2
|
前端开发 芯片 网络架构
单口千兆以太网物理层芯片
一、基本介绍 YT8521S是一款单口千兆以太网物理层芯片,YT8521S是一款高度集成的以太网收发器,符合10BASE-Te、100BASE-TX和1000BASE-T IEEE 802.3标准。它提供了传输和接收所需的所有物理层功能通过CAT.5E UTP电缆的以太网数据包。 YT8521S采用最先进的DSP技术和模拟前端(AFE)实现高速数据通过UTP电缆进行传输和接收。交叉检测和自动校正、极性等功能校正、自适应均衡、串扰消除、回声消除、定时恢复和纠错在YT8521S中实现以提供10Mbps、100Mbps和100Mbps的鲁棒传输和接收能力,或1000Mbps。 MAC和PHY之
442 2
|
存储 机器学习/深度学习 Unix
【考研必备】解开“黑匣子”的神秘面纱,透视数字世界底层实现过程(计算机组成原理)(上)
【考研必备】解开“黑匣子”的神秘面纱,透视数字世界底层实现过程(计算机组成原理)
【考研必备】解开“黑匣子”的神秘面纱,透视数字世界底层实现过程(计算机组成原理)(上)