第3章-图形处理单元-3.2-GPU管线概览

简介: 第3章-图形处理单元-3.2-GPU管线概览

第3章-图形处理单元-3.2-GPU管线概览

3.2 GPU管线概览

GPU实现了第2章中描述的概念:几何处理、光栅化和像素处理流水线阶段。这些阶段被分为几个具有不同程度的可配置性或可编程性的硬件阶段。图3.2显示了根据可编程或可配置程度对各个阶段进行颜色标识。请注意,这些物理阶段的划分与第2章中介绍的功能阶段有些不同。

图3.2. 渲染管线的GPU实现。这些阶段根据用户对其操作的控制程度进行颜色标识。绿色阶段是完全可编程的。虚线表示可选阶段。黄色阶段是可配置但不可编程的,例如,可以为合并阶段设置各种混合模式。蓝色阶段的功能完全固定。

我们在此描述GPU的逻辑模型,该模型通过API向作为程序员的你公开。正如第18章第23章所讨论的,这个逻辑管线的实现,即物理模型,取决于硬件供应商。逻辑模型中固定功能的阶段可以通过向相邻的可编程阶段添加命令而在GPU上执行。流水线中的单个程序可能被拆分为由单独的子单元执行的元素,或者完全由单独的通道执行。逻辑模型可以帮助您推理影响性能的因素,但不应将其误认为是GPU实际实现管道的方式。

顶点着色器是一个完全可编程的阶段,用于实现几何处理阶段。几何着色器是一个完全可编程的阶段,它对图元(点、线或三角形)的顶点进行操作。它可用于执行每个图元的着色操作、销毁图元或创建新图元。曲面细分阶段和几何着色器都是可选的,并非所有GPU都支持它们,尤其是在移动设备上。

裁剪、三角形设置和三角形遍历阶段由固定功能硬件实现。屏幕映射受窗口和视口设置的影响,内部形成简单的缩放和重新定位。像素着色器阶段是完全可编程的。虽然合并阶段不可编程,但它是高度可配置的,可以设置为执行各种操作。它实现了“合并”功能阶段,负责修改颜色、z缓冲区、混合、模板和任何其他与输出相关的缓冲区。像素着色器的执行和合并阶段构成了第2章中介绍的概念:像素处理阶段。

随着时间的推移,GPU管线已经从硬编码操作演变为提高灵活性和控制性。可编程着色器阶段的引入是这一演变中最重要的一步。下一节描述了各种可编程级的共同特征。

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
自然语言处理
PubMedBERT:生物医学自然语言处理领域的特定预训练模型
今年大语言模型的快速发展导致像BERT这样的模型都可以称作“小”模型了。Kaggle LLM比赛LLM Science Exam 的第四名就只用了deberta,这可以说是一个非常好的成绩了。所以说在特定的领域或者需求中,大语言模型并不一定就是最优的解决方案,“小”模型也有一定的用武之地,所以今天我们来介绍PubMedBERT,它使用特定领域语料库从头开始预训练BERT,这是微软研究院2022年发布在ACM的论文。
519 1
|
存储 Python
用python将csv转excel (.xls和.xlsx)的几种方式
用python将csv转excel (.xls和.xlsx)的几种方式
766 4
IDEA2019版 中文汉化方案
IDEA2019版 中文汉化方案
3140 0
|
存储 缓存 人工智能
玄铁 E906处理器简介|学习笔记
快速学习玄铁 E906处理器简介
3024 0
玄铁 E906处理器简介|学习笔记
加载模型出现-RuntimeError: Error(s) in loading state_dict for Net:unexpected key(s) in state_dict: XXX
加载模型出现-RuntimeError: Error(s) in loading state_dict for Net:unexpected key(s) in state_dict: XXX
900 0
|
测试技术 API
在性能测试中,怎样设置合理的迭代次数?
在性能测试中,迭代次数的合理设置至关重要,它直接影响到测试结果的准确性和可靠性。
638 57
|
12月前
|
存储 NoSQL 关系型数据库
MySQL和Redis的区别
**MySQL和Redis的区别** MySQL和Redis都是流行的数据存储解决方案,但它们在设计、用途和特性上有显著区别。理解这些区别有助于选择合适的数据库来满足不同的应用需求。本文将详细介绍MySQL和Redis的区别,包括它们的架构、使用场景、性能和其他关键特性。 ### 一、基本概述 **MySQL**: MySQL是一个关系型数据库管理系统(RDBMS),使用结构化查询语言(SQL)进行数据管理。它支持事务、复杂查询和多种存储引擎,广泛应用于各种Web应用、企业系统和数据分析项目。 **Redis**: Redis是一个基于内存的键值数据库,通常被称为NoSQL数
676 4
|
负载均衡 网络协议 算法
【springcloud】Ribbon详解
Spring Cloud Ribbon是一个基于HTTP和TCP的客户端负载均衡工具,它基于Netflix Ribbon实现。简单点说,其主要功能是提供客户端的软件负载均衡算法和服务调用。Ribbon客户端组件提供一系列完善的配置项如连接超时,重试等。简单的说,就是在配置文件中列出Load Balancer(简称LB)后面所有的机器,Ribbon会自动的帮助你基于某种规则(如简单轮询,随机连接,权重等)去连接这些机器。
525 0
|
Prometheus 监控 Cloud Native
微服务的监控与可观测性
【8月更文第29天】在微服务架构中,确保每个服务的健康状态和性能表现是非常重要的。为了达到这一目标,我们需要实施一套完整的监控和可观测性方案。本篇文章将介绍如何通过日志、指标和追踪来监测微服务的状态和性能,并提供相应的代码示例。
1001 0
|
Web App开发 JavaScript 前端开发
Web 页面性能衡量指标-以用户为中心的性能指标
Web 页面性能衡量指标-以用户为中心的性能指标 以用户为中心的性能指标是理解和改进站点体验的关键点 一、以用户为中心的性能指标 1. 指标是用来干啥的? 指标是用来衡量性能和用户体验的 2. 指标类型 • 感知加载速度:网页可以多快地加载网页中的所有视觉元素并将其渲染到屏幕上 • 加载响应速度:页面加载和执行组件快速响应用户互动所需的 JavaScript 代码的速度 • 运行时响应速度:网页在加载后对用户互动的响应速度 • 视觉稳定性:页面上的元素是否会以用户意想不到的方式发生偏移,是否可能会干扰用户的互动? • 流畅性:过渡和动画是否以一致的帧速率渲染,并在一种状态之间流畅地流动
553 1