第3章-图形处理单元-3.2-GPU管线概览

简介: 第3章-图形处理单元-3.2-GPU管线概览

第3章-图形处理单元-3.2-GPU管线概览

3.2 GPU管线概览

GPU实现了第2章中描述的概念:几何处理、光栅化和像素处理流水线阶段。这些阶段被分为几个具有不同程度的可配置性或可编程性的硬件阶段。图3.2显示了根据可编程或可配置程度对各个阶段进行颜色标识。请注意,这些物理阶段的划分与第2章中介绍的功能阶段有些不同。

图3.2. 渲染管线的GPU实现。这些阶段根据用户对其操作的控制程度进行颜色标识。绿色阶段是完全可编程的。虚线表示可选阶段。黄色阶段是可配置但不可编程的,例如,可以为合并阶段设置各种混合模式。蓝色阶段的功能完全固定。

我们在此描述GPU的逻辑模型,该模型通过API向作为程序员的你公开。正如第18章第23章所讨论的,这个逻辑管线的实现,即物理模型,取决于硬件供应商。逻辑模型中固定功能的阶段可以通过向相邻的可编程阶段添加命令而在GPU上执行。流水线中的单个程序可能被拆分为由单独的子单元执行的元素,或者完全由单独的通道执行。逻辑模型可以帮助您推理影响性能的因素,但不应将其误认为是GPU实际实现管道的方式。

顶点着色器是一个完全可编程的阶段,用于实现几何处理阶段。几何着色器是一个完全可编程的阶段,它对图元(点、线或三角形)的顶点进行操作。它可用于执行每个图元的着色操作、销毁图元或创建新图元。曲面细分阶段和几何着色器都是可选的,并非所有GPU都支持它们,尤其是在移动设备上。

裁剪、三角形设置和三角形遍历阶段由固定功能硬件实现。屏幕映射受窗口和视口设置的影响,内部形成简单的缩放和重新定位。像素着色器阶段是完全可编程的。虽然合并阶段不可编程,但它是高度可配置的,可以设置为执行各种操作。它实现了“合并”功能阶段,负责修改颜色、z缓冲区、混合、模板和任何其他与输出相关的缓冲区。像素着色器的执行和合并阶段构成了第2章中介绍的概念:像素处理阶段。

随着时间的推移,GPU管线已经从硬编码操作演变为提高灵活性和控制性。可编程着色器阶段的引入是这一演变中最重要的一步。下一节描述了各种可编程级的共同特征。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
21天前
|
图形学 异构计算
Siemens NX何时支持GPU光线追踪与图形加速?
NX的Ray Tracing Studio在NX 1847及更早版本中不支持NVIDIA RTX板的GPU加速,仅依赖CPU,性能较慢。从NX 1872起支持GPU加速。自2023年6月版起,若无GPU,NX将显示图形配置错误并记录到syslog文件,建议使用支持的GPU以避免未定义行为。更多支持的硬件和图形信息,请参阅鼎森电脑整理的文件“NX-Graphics-Certification-Table_20241207.xlsx”。链接:https://pan.baidu.com/s/1_FpOoJU_IrExnhVXyzB4cw?pwd=676s 提取码: 676s
41 0
|
3月前
|
缓存 算法 测试技术
|
8月前
【计算巢】网络拓扑结构的比较分析:星形、环形与总线型
【5月更文挑战第31天】本文介绍了网络的三种常见拓扑结构:星形、环形和总线型。星形拓扑易于管理和维护,信息传递高效;环形拓扑结构简单,信息环状传递,但环中断可能导致网络瘫痪;总线型成本低、扩展易,但总线故障会全局影响。理解其特点有助于根据需求选择合适的网络结构。
351 1
|
5月前
|
存储 算法 芯片
第3章-图形处理单元-3.0
第3章-图形处理单元-3.0
34 1
|
5月前
|
缓存 程序员 调度
第3章-图形处理单元-3.1-数据并行架构
第3章-图形处理单元-3.1-数据并行架构
42 1
|
5月前
|
存储 API 异构计算
第3章-图形处理单元-3.3-可编程着色器阶段
第3章-图形处理单元-3.3-可编程着色器阶段
49 0
第3章-图形处理单元-3.3-可编程着色器阶段
|
8月前
|
存储 芯片 异构计算
LabVIEW如何优化FPGA可用资源或提升速度
LabVIEW如何优化FPGA可用资源或提升速度
69 0
|
8月前
|
缓存 并行计算 算法
上帝视角看GPU(5):图形流水线里的不可编程单元
上帝视角看GPU(5):图形流水线里的不可编程单元
203 0
|
8月前
|
存储 缓存 算法
龚大视频学习笔记:上帝视角看GPU(1)-图形流水线基础
龚大视频学习笔记:上帝视角看GPU(1)-图形流水线基础
230 0
龚大视频学习笔记:上帝视角看GPU(1)-图形流水线基础

热门文章

最新文章