Unity3d面向英特尔® x86 平台的 Unity* 优化指南: 第 1 部分

简介: 如要充分发挥 x86 平台的作用,您可以在项目中进行多种性能优化,以最大限度地提升性能。 在本指南中,我们将展示 Unity*软件中的多种工具和特性,以帮助您增强 Unity 项目的性能。

如要充分发挥 x86 平台的作用,您可以在项目中进行多种性能优化,以最大限度地提升性能。 在本指南中,我们将展示 Unity*

软件中的多种工具和特性,以帮助您增强 Unity 项目的性能。 我们将介绍如何处理纹理质量、批处理、标压缩、光烘烤和 HDR 效果。

在本指南结束之际,您将能够了解 Unity 中的性能问题及其成因、关键优化和有助于开发优秀游戏的方法。 首先我们来看看有助于轻松识别应用中潜在热点的工具。

工具

在本指南中,我们将探讨三种主要工具: Unity 分析器、GPA 系统分析器和 GPA 帧分析器。 每种工具本身都拥有强大的游戏开发功能。 如果您能够组合使用所有三种工具,您将会在游戏简化和优化方面取得显著成效。

图 1.Unity 分析器主屏幕

Unity 分析器

Unity 分析器(图 1)是 Unity 中一个极其强大的工具,它可帮助您识别项目中各种子系统的问题。

分析器图形部分拥有不同的子分析器,后者可显示面向特定硬件的指标。 当前可用的子分析器包含 CPU 使用、GPU 使用、渲染、内存、音频、物理和

2D 物理等指标。 每个子分析器都可进一步划分为相关组件部分,可将这些部分相分离以深入了解细节。 例如,CPU

使用包含渲染、脚本、物理、垃圾收集器、垂直同步和其他部分。

图形部分下方是概览窗口,在此窗口中您可以看到一个指标列表,包括面向各种 Unity 子系统的计时信息和内存分配。 从渲染到垃圾收集,一切都在此显示,最好能检查下应用中优化耗时最长的部分。 单击图形的任何部分都会暂停分析器更新,让您研究突出显示的帧。

Unity 分析器可连接到编辑器或独立构件中的运行应用。 如要获得最准确的计时以避免编辑器开销,建议您不时地连接到独立构件。

具体操作是:点击窗口顶部的 ‘Active Profiler’ 按钮,从 ‘Android Player’

的可用实例以及网络上的任何内容进行选择,可通过 ADB (Android Debug Bridge) 检测可用实例。

另一个选项是“深入分析”应用。 不建议将该选项用于一般用途,因为它会实际使用所有单代码,这样会造成大量的分析开销。 幸运的是,Unity 能够直接使用您感兴趣的任何代码段。图 2 展示了如何利用代码,以便无论您提供何种标签,它都会显示在分析器上:

图 2.在 Profiler 中设置可供使用的代码段

GPA 系统分析器

图 3.GPA 系统分析器实时视图

英特尔® 图形性能分析器(英特尔® GPA) 是一套图形分析和优化工具,可帮助游戏开发人员加快游戏和其他图形密集型应用的运行速度。 英特尔® GPA 提供了广泛的功能,支持开发人员深入分析图形 API 调用以确定主要性能问题的原因。 本指南介绍的许多实验和指标都来自英特尔® GPA。 英特尔® GPA 支持您研究 DirectX* 应用在 Windows* 上的图形工作负载以及 OpenGL ES* 应用在部分运行 Android 的英特尔® 处理器系统上的图形工作负载。 尽管它无法直接监控 OpenGL* API 调用,但是在 OpenGL 游戏运行期间,您仍能够使用 GPA 系统分析器来研究 GPU 和 CPU 指标。 无论图形 API 如何,您都可以使用 GPA 平台分析器来查看详细的 CPU 负载,包括任何 OpenCL 活动。 如要查看更多详情,英特尔® GPA 可为您提供 API 来添加自己的工具。 GPA 工具集适用于 Android 和桌面,如欲了解更多信息并下载英特尔® GPA,请登录:www.intel.com/software/GPA/

第一步,使用英特尔® GPA 收集实时性能信息。 英特尔® GPA 拥有两种不同的实时数据显示模式(如上所示): 在应用顶层运行的平视显示器 (HUD),以及通过网络连接到测试系统的系统分析器。 两种工具都可以显示来自 DirectX 管线(一些英特尔® 处理器上的 OpenGL ES 管线)的指标、CPU 利用率和系统电源。 在受支持的英特尔® 处理器图形系统上,您也可以获得大量的 GPU 硬件指标。 HUD 和系统分析器提供了简单的实验,可帮助您快速检测性能问题。 请参见英特尔 GPA 文档,了解有关 HUD 与系统分析器特性和功能的更多详情。

图 4.GPA 系统分析器备用 HUD

如要把指标值添加到分析中,只需将其从左侧栏拖到主图形区域。 这些工具能够在 ARM* 设备上运行,但是在基于英特尔® 处理器的硬件上并非拥有所有指标。 更多信息,请参见面向WindowsOS XGPA 教程。以下各组指标在英特尔® 硬件上提供:

CPU

设备 IO

执行单元

片段着色器

GPU

输入-装配器

内存

OpenGL/DX

状态指标

输出-合成器

功耗

光栅器

顶点着色器

就 CPU 瓶颈而言,您可能会发现平台分析器可用于 DirectX 和 OpenGL。 它显示了所捕获的 CPU 活动痕迹。

如果想为代码添加工具,您可以将在 CPU 上运行的单个任务相关联,并通过 DirectX 观察它们的进程,驱动程序以及 GPU。

为了帮助您确定瓶颈,GPU 中包含了一个“状态覆盖”部分(图 5),支持您开展实验,检查在不断变化的条件下的帧率浮动。 几个示例:

图 5.可用覆盖

纹理 2x2

从高分辨率纹理中提取数据的成本十分高昂。 这将使用 2x2 纹理取代场景中所用的全部纹理。 通过勾选这一选项所导致的显著性能变化显示,可以缩小一些纹理的尺寸来提高帧率。

空硬件

这将模拟一个无限快的 GPU。如果这能够增加帧率,您的代码就可能会与驱动程序或 CPU 相绑定。

禁用绘制调用

这将会模拟一个非常快的驱动程序,如果帧率浮动,则表示您的代码可能与驱动程序相绑定。

简单的片段着色器

这将使用一个非常简单的片段着色器取代所有着色器。浮动可能表示着色器应针对性能提升进行优化。

实验部分下方是平台设置滑块。 该特性支持您以不同的频率运行 CPU。 这可帮助确定瓶颈,即使您的游戏/应用正在任何测试设备上以最大帧率运行。 这也可被用于验证您的游戏/应用是否能在广泛的设备上运行。CPU 频率滑块的另一大用途是强制施加特定频率,以防止英特尔® 睿频加速等技术导致测试结果出现偏差。

最后,您可以点击窗口顶部的相机图标来捕获帧。 随后,系统分析器会记录用于制作游戏/应用单帧的每个细节(状态更改、时间、纹理等)。 可使用帧分析器工具打开存储这一信息的文件,以进行深入研究。

GPA 帧分析器

图 6.GPA 帧分析器显示变更记录和相关帧信息

帧分析器工具(图 5)支持您打开单帧捕获。 捕获的帧将包含对所有状态变更、资源、定时信息等的记录。

窗口顶部的图形显示了在帧中所记录的每个绘制调用。 为方便可视化,这些绘制调用按照渲染目标进行分离。 图形中的 X 和 Y

值可通过左上方的下拉菜单进行更改。 左侧是单独渲染目标列表。 左下方显示了当前突出显示的绘制调用的预览以及它们在帧上的出现方式。

您可以通过各种选项对视图进行自定义,包括突出显示绘制的像素或保持它们正常。 您也可以选择调整未选定对象对预览的影响方式(隐藏或不隐藏)。

右下角是选项卡集,这些选项卡可提供有关当前所选绘制调用的更多洞察,包括:

帧概述

在面向整个帧的 GPU 管线中按阶段细分的计时/状态值

图 7.帧概述部分的报告值

详细信息

在面向图形/树中当前所选绘制调用的 GPU 管线中按阶段细分的计时/状态值

纹理(下图 8)

当前绑定的纹理列表

纹理选项卡下方的左侧栏可用于验证压缩、格式、mip 层等。

图 8.少数绘制调用所用纹理的视图

状态

面向选定绘制调用的状态设置

可以进行编辑,以查看对渲染目标预览和计时的影响

着色器

这一部分将向您介绍选定绘制调用所用的着色器。

您可以编辑着色器代码,并查看这些变更如何在视觉上影响场景预览。着色器代码变更也会体现在定时变更上,因此您可以看到多少特定优化正在影响帧时间。

图 9.编辑着色器以输出硬编码绿色值,将绘制调用速度加快 57.7%

实验

与系统分析器的实验部分相似,但可以按绘制调用使用。

图 10.实验展示了替代 2x2 纹理如何将绘制调用速度加快 5.9%。 在 Details 选项卡可以看到图形管线上各点的变更。

几何

该选项卡显示了窗口中面向选定绘制调用的几何数据 3D 表示。

图 11.查看 Geometry 选项卡中的几何模型

API 日志

显示面向选定绘制调用的所有 API 调用。 这对于跟踪可能会影响性能的不必要状态变更大有帮助。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
2月前
|
存储 设计模式 监控
运用Unity Profiler定位内存泄漏并实施对象池管理优化内存使用
【7月更文第10天】在Unity游戏开发中,内存管理是至关重要的一个环节。内存泄漏不仅会导致游戏运行缓慢、卡顿,严重时甚至会引发崩溃。Unity Profiler作为一个强大的性能分析工具,能够帮助开发者深入理解应用程序的内存使用情况,从而定位并解决内存泄漏问题。同时,通过实施对象池管理策略,可以显著优化内存使用,提高游戏性能。本文将结合代码示例,详细介绍如何利用Unity Profiler定位内存泄漏,并实施对象池来优化内存使用。
109 0
|
19天前
|
图形学 iOS开发 Android开发
从Unity开发到移动平台制胜攻略:全面解析iOS与Android应用发布流程,助你轻松掌握跨平台发布技巧,打造爆款手游不是梦——性能优化、广告集成与内购设置全包含
【8月更文挑战第31天】本书详细介绍了如何在Unity中设置项目以适应移动设备,涵盖性能优化、集成广告及内购功能等关键步骤。通过具体示例和代码片段,指导读者完成iOS和Android应用的打包与发布,确保应用顺利上线并获得成功。无论是性能调整还是平台特定的操作,本书均提供了全面的解决方案。
80 0
|
19天前
|
开发者 图形学 iOS开发
掌握Unity的跨平台部署与发布秘籍,让你的游戏作品在多个平台上大放异彩——从基础设置到高级优化,深入解析一站式游戏开发解决方案的每一个细节,带你领略高效发布流程的魅力所在
【8月更文挑战第31天】跨平台游戏开发是当今游戏产业的热点,尤其在移动设备普及的背景下更为重要。作为领先的游戏开发引擎,Unity以其卓越的跨平台支持能力脱颖而出,能够将游戏轻松部署至iOS、Android、PC、Mac、Web及游戏主机等多个平台。本文通过杂文形式探讨Unity在各平台的部署与发布策略,并提供具体实例,涵盖项目设置、性能优化、打包流程及发布前准备等关键环节,助力开发者充分利用Unity的强大功能,实现多平台游戏开发。
44 0
|
19天前
|
开发者 图形学 UED
深度解析Unity游戏开发中的性能瓶颈与优化方案:从资源管理到代码执行,全方位提升你的游戏流畅度,让玩家体验飞跃性的顺滑——不止是技巧,更是艺术的追求
【8月更文挑战第31天】《Unity性能优化实战:让你的游戏流畅如飞》详细介绍了Unity游戏性能优化的关键技巧,涵盖资源管理、代码优化、场景管理和内存管理等方面。通过具体示例,如纹理打包、异步加载、协程使用及LOD技术,帮助开发者打造高效流畅的游戏体验。文中提供了实用代码片段,助力减少内存消耗、提升渲染效率,确保游戏运行丝滑顺畅。性能优化是一个持续过程,需不断测试调整以达最佳效果。
43 0
|
1月前
|
Apache 图形学
WebGL☀️Unity WebGL适配到各平台的教程
WebGL☀️Unity WebGL适配到各平台的教程
|
1月前
|
C# 图形学 C语言
Unity3D学习笔记3——Unity Shader的初步使用
Unity3D学习笔记3——Unity Shader的初步使用
34 0
|
3月前
|
图形学
【unity小技巧】unity3D寻路指示轨迹预测
【unity小技巧】unity3D寻路指示轨迹预测
51 0
|
19天前
|
图形学 C#
超实用!深度解析Unity引擎,手把手教你从零开始构建精美的2D平面冒险游戏,涵盖资源导入、角色控制与动画、碰撞检测等核心技巧,打造沉浸式游戏体验完全指南
【8月更文挑战第31天】本文是 Unity 2D 游戏开发的全面指南,手把手教你从零开始构建精美的平面冒险游戏。首先,通过 Unity Hub 创建 2D 项目并导入游戏资源。接着,编写 `PlayerController` 脚本来实现角色移动,并添加动画以增强视觉效果。最后,通过 Collider 2D 组件实现碰撞检测等游戏机制。每一步均展示 Unity 在 2D 游戏开发中的强大功能。
62 6
|
19天前
|
测试技术 C# 图形学
掌握Unity调试与测试的终极指南:从内置调试工具到自动化测试框架,全方位保障游戏品质不踩坑,打造流畅游戏体验的必备技能大揭秘!
【9月更文挑战第1天】在开发游戏时,Unity 引擎让创意变为现实。但软件开发中难免遇到 Bug,若不解决,将严重影响用户体验。调试与测试成为确保游戏质量的最后一道防线。本文介绍如何利用 Unity 的调试工具高效排查问题,并通过 Profiler 分析性能瓶颈。此外,Unity Test Framework 支持自动化测试,提高开发效率。结合单元测试与集成测试,确保游戏逻辑正确无误。对于在线游戏,还需进行压力测试以验证服务器稳定性。总之,调试与测试贯穿游戏开发全流程,确保最终作品既好玩又稳定。
40 4
|
19天前
|
图形学 缓存 算法
掌握这五大绝招,让您的Unity游戏瞬间加载完毕,从此告别漫长等待,大幅提升玩家首次体验的满意度与留存率!
【8月更文挑战第31天】游戏的加载时间是影响玩家初次体验的关键因素,特别是在移动设备上。本文介绍了几种常见的Unity游戏加载优化方法,包括资源的预加载与异步加载、使用AssetBundles管理动态资源、纹理和模型优化、合理利用缓存系统以及脚本优化。通过具体示例代码展示了如何实现异步加载场景,并提出了针对不同资源的优化策略。综合运用这些技术可以显著缩短加载时间,提升玩家满意度。
38 5