《CUDA高性能并行计算》----3.3 标准操作流程

简介: 看过以上典型的程序流程,我们来分析一下流程哪些部分是CUDA带来的开销,哪些能带来收益。开销应该是十分明显的:创建镜像数组并且在设备端和主机端传输数据,这些都是在串行计算中不需要进行的额外工作。为了抵消这些内存操作的“额外开销”,我们能从GPU成百上千的处理器核心上得到运算上的收益。

本 节 书 摘 来 自 华 章 出 版 社 《CUDA高性能并行计算》 一 书 中 的 第3章,第3.3节, 作 者 CUDA for Engineers: An Introduction to High-Performance Parallel Computing[美] 杜安·斯托尔蒂(Duane Storti)梅特·尤尔托卢(Mete Yurtoglu) 著,苏统华 项文成 李松泽 姚宇鹏 孙博文 译 , 更 多 章 节 内 容 可 以 访 问 云 栖 社 区 “华 章 计 算 机” 公 众 号 查 看。

3.3 标准操作流程

看过以上典型的程序流程,我们来分析一下流程哪些部分是CUDA带来的开销,哪些能带来收益。开销应该是十分明显的:创建镜像数组并且在设备端和主机端传输数据,这些都是在串行计算中不需要进行的额外工作。为了抵消这些内存操作的“额外开销”,我们能从GPU成百上千的处理器核心上得到运算上的收益。这些讨论直接引出了一些使用CUDA的推荐策略:

一次性将你的数据复制到设备端。

启动一个执行了大量工作的核函数(因此从大量并行化中获得的收益将大大超出内存传输的代价)。

只将结果复制回主机端一次。

这些并不是一成不变的,但是它们提供了一些有用的规则。在这里,你拥有执行这个典型工作流的所有工具。然而,在我们接触更复杂问题之前,让我们快速浏览一些可以简化开发流程的其他可选方案。

相关文章
|
机器学习/深度学习 SQL 人工智能
人工智能平台PAI使用问题之如何在阿里云服务器上搭建自己的人工智能
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
图形学 开发者
U3D开发进阶:精细调整Collider与优化碰撞检测性能
【7月更文第11天】在Unity 3D(简称U3D)开发过程中,精确控制Collider(碰撞器)的设置与合理利用Layer Collision Matrix(层级碰撞矩阵)对于提升游戏性能、优化物理模拟至关重要。本文将深入探讨这两项技术的应用,通过实际案例和代码示例,帮助开发者构建更加高效、流畅的游戏体验。
1669 2
|
负载均衡 算法 安全
一文带你了解LVS负载均衡模式与F5负载均衡
一文带你了解LVS负载均衡模式与F5负载均衡
2217 0
|
SQL Oracle 关系型数据库
flyway 的优缺点
Flyway 是一个开源的数据库迁移工具,用于在应用程序的开发过程中管理数据库的变更。以下是 Flyway 的一些优缺点: 优点: 1. **简单易用:** Flyway 的设计目标之一是简单易用,它采用约定优于配置的原则,使得开发人员可以快速上手并集成到他们的项目中。 2. **无依赖:** Flyway 是一个独立的数据库迁移工具,不需要依赖其他的库或服务。它可以轻松集成到各种项目中,不受特定框架或技术的限制。 3. **支持多种数据库:** Flyway 支持多种数据库系统,包括常见的关系型数据库(如MySQL、PostgreSQL、Oracle、SQL Server等),这使得
839 0
|
Web App开发 缓存 JavaScript
问题记录:net::ERR_CERT_DATE_INVALID
问题记录:net::ERR_CERT_DATE_INVALID
905 0
|
弹性计算 负载均衡 容灾
洛神云网络 应用负载均衡ALB产品技术解读
在阿里云2020年云栖大会上,阿里云智能网络产品研究员祝顺民重磅发布了应用负载均衡(Application Load Balancer,后文简称ALB)产品。一个月过去了,全新推出的ALB产品到底有哪些进展,在架构、特性、容灾、协议以及配置方式上做了哪些新设计,让我们一起来解读一下阿里云网络应用型负载均衡ALB。
5164 1
洛神云网络 应用负载均衡ALB产品技术解读
MySQL数据库“十宗罪”(十大经典错误案例)
老张我在刚开始学习数据库的时候,没少走弯路。经常会遇到各种稀奇古怪的 error 信息,遇到报错会很慌张,急需一个解决问题的办法。跟无头苍蝇一样,会不加思索地把错误粘到百度上,希望赶紧查找一下有没有好的处理问题的方法。
2376 0
|
机器学习/深度学习 人工智能 vr&ar
|
6天前
|
人工智能 运维 安全