Unity中Profiler性能分析

简介:

在项目中一般性能优化分为三种,资源优化、渲染优化、以及模型优化,在资源优化中,我们要保证我们的资源没有重复或多余,这就要在平时项目中仔细导入其他人所给的资源。渲染优化指的是在使用一些贴图的时候可以采用LOD等技术使模型面数减少以增加FPS帧率。并使用遮罩剔除等技术。模型优化就是尽量减少面数和顶点数,让我们的CPUGPU不再超负荷的工作。下面呢,我将带着大家一起来看一下我们Profiler面板中的一些重要的参数

wKiom1nltWTRFHTnAATDkea4xTc623.png-wh_50

A. WaitForTargetFps: 
      Vsync(垂直同步)功能所,即显示当前帧的CPU等待时间 
   B. Overhead 
      Profiler总体时间-所有单项的记录时间总和。用于记录尚不明确的时间消耗,以帮助进一步完善Profiler的统计。 
        C. Physics.Simulate 
      当前帧物理模拟的CPU占用时间。 
   D. Camera.Render 
      相机渲染准备工作的CPU占用量 
   E. RenderTexture.SetActive 
      设置RenderTexture操作. 
      底层实现:1.比对当前帧与前一帧的ColorSurfaceDepthSurface. 
               2.如果这两个Buffer一致则不生成新的RT,否则则生成新的RT,并设置与之相对应的Viewport和空间转换矩阵. 
   F. Monobehaviour.OnMouse_  
      用于检测鼠标的输入消息接收和反馈,主要包括:SendMouseEventsDoSendMouseEvents。(只要Edtor开起来,这个就会存在) 
   G. HandleUtility.SetViewInfo 
      仅用于Editor中,作用是将GUIEditor中的显示看起来与发布版本的显示一致。 
H. GUI.Repaint 
      GUI的重绘(说明在有使用原生的OnGUI) 
   I. Event.Internal_MakeMasterEventCurrent 
      负责GUI的消息传送 
   J. Cleanup Unused Cached Data 
      清空无用的缓存数据,主要包括RenderBuffer的垃圾回收和TextRendering的垃圾回收。 
         1.RenderTexture.GarbageCollectTemporary:存在于RenderBuffer的垃圾回收中,清除临时的FreeTexture. 
         2.TextRendering.Cleanup:TextMesh的垃圾回收操作 
   K. Application.Integrate Assets in Background 
      遍历预加载的线程队列并完成加载,同时,完成纹理的加载、SubstanceUpdate. 
   L. Application.LoadLevelAsync Integrate 
      加载场景的CPU占用,通常如果此项时间长的话70%的可能是Texture过长导致. 
   M. UnloadScene 
      卸载场景中的GameObjectsComponentGameManager,一般用在切换场景时. 
   N. CollectGameObjectObjects 
      执行上面M项的同时,会将场景中的GameObjectComponent聚集到一个Array.然后执行下面的Destroy. 
   O. Destroy 
      删除GameObjectComponentCPU占用. 
   P. AssetBundle.LoadAsync Integrate 
      多线程加载AwakeQueue中的内容,即多线程执行资源的AwakeFromLoad函数. 
   Q. Loading.AwakeFromLoad 
      在资源被加载后调用,对每种资源进行与其对应用处理. 




2. CPU Usage 
   A. Device.Present: 
      device.PresentFrame的耗时显示,该选项出现在发布版本中. 
   B. Graphics.PresentAndSync 
      GPU上的显示和垂直同步耗时.该选项出现在发布版本中. 
   C. Mesh.DrawVBO 
      GPU中关于MeshVertex Buffer Object的渲染耗时. 
   D. Shader.Parse 
      资源加入后引擎对Shader的解析过程. 
   E. Shader.CreateGPUProgram 
      根据当前设备支持的图形库来建立GPU工程. 
3. Memory Profiler 

   A. Used Total: 
      当前帧的Unity内存、Mono内存、GfxDriver内存、Profiler内存的总和. 
   B. Reserved Total: 
      系统在当前帧的申请内存. 
   C. Total System Memory Usage: 
      当前帧的虚拟内存使用量.(通常是我们当前使用内存的1.5~3) 
   D. GameObjects in Scene: 
      当前帧场景中的GameObject数量. 
   E. Total Objects in Scene: 
      当前帧场景中的Object数量(GameObject外,还有Component). 
   F. Total Object Count: 
      Object数据 + Asset数量. 

4. Detail Memory Profiler 
   A. Assets: 
      Texture2d:记录当前帧内存中所使用的纹理资源情况,包括各种GameObject的纹理、天空盒纹理以及场景中所用的Lightmap资源. 
   B. Scene Memory: 
      记录当前场景中各个方面的内存占用情况,包括GameObject、所用资源、各种组件以及GameManager等(天般情况通过AssetBundle加载的不会显示在这里). 
   A. Other: 
      ManagedHeap.UseSize:代码在运行时造成的堆内存分配,表示上次GC到目前为止所分配的堆内存量. 
      SerializedFile(3): 
      WebStream:这个是由WWW来进行加载的内存占用. 
      System.ExecutableAndDlls:不同平台和不同硬件得到的值会不一样。 
  

5. 优化重点 
   A. CPU-GC Allow: 
      关注原则:1.检测任何一次性内存分配大于2KB的选项 2.检测每帧都具有20B以上内存分配的选项. 
   B. Time ms: 
      记录游戏运行时每帧CPU占用(特别注意占用5ms以上的). 
   C. Memory Profiler-Other: 
      1.ManagedHeap.UsedSize: 移动游戏建议不要超过20MB. 
      2.SerializedFile: 通过异步加载(LoadFromCacheWWW)的时候留下的序列化文件,可监视是否被卸载. 
      3.WebStream: 通过异步WWW下载的资源文件在内存中的解压版本,SerializedFile大几倍或几十倍,重点监视.**** 
   D. Memory Profiler-Assets: 
      1.Texture2D: 重点检查是否有重复资源和超大Memory是否需要压缩等. 
      2.AnimationClip: 重点检查是否有重复资源. 
      3.Mesh: 重点检查是否有重复资源. 


6. 项目中可能遇到的问题 

   A. Device.Present: 
      1.GPUpresentdevice确实非常耗时,一般出现在使用了非常复杂的shader. 
      2.GPU运行的非常快,而由于Vsync的原因,使得它需要等待较长的时间. 
      3.同样是Vsync的原因,但其他线程非常耗时,所以导致该等待时间很长,比如:过量AssetBundle加载时容易出现该问题. 
      4.Shader.CreateGPUProgram:Shaderruntime阶段(非预加载)会出现卡顿(华为K3V2芯片). 
   B. StackTraceUtility.PostprocessStacktrace()StackTraceUtility.ExtractStackTrace(): 
      1.一般是由Debug.Log或类似API造成. 
      2.游戏发布后需将Debug API进行屏蔽. 

   C. Overhead: 
      1.一般情况为Vsync所致. 
      2.通常出现在Android设备上. 
   D. GC.Collect: 
      原因: 1.代码分配内存过量(恶性的) 2.一定时间间隔由系统调用(良性的). 
      占用时间:1.与现有Garbage size相关 2.与剩余内存使用颗粒相关(比如场景物件过多,利用率低的情况下,GC释放后需要做内存重排) 
   E. GarbageCollectAssetsProfile: 
      1.引擎在执行UnloadUnusedAssets操作(该操作是比较耗时的,建议在切场景的时候进行). 
      2.尽可能地避免使用Unity内建GUI,避免GUI.Repaint过渡GC Allow. 
      3.if(other.tag == GearParent.MogoPlayerTag)改为other.CompareTag(GearParent.MogoPlayerTag).因为other.tag为产生180BGC Allow. 
   F. 少用foreach,因为每次foreach为产生一个enumerator(16B的内存分配),尽量改为for. 
   G. Lambda表达式,使用不当会产生内存泄漏. 
   H. 尽量少用LINQ 
      1.部分功能无法在某些平台使用. 
      2.会分配大量GC Allow. 
   I. 控制StartCoroutine的次数: 
      1.开启一个Coroutine(协程),至少分配37B的内存. 
      2.Coroutine类的实例 -- 21B. 
      3.Enumerator -- 16B. 
   J. 使用StringBuilder替代字符串直接连接. 
   K. 缓存组件: 
      1.每次GetComponent均会分配一定的GC Allow. 
      2.每次Object.name都会分配39B的堆内存.

 



本文转自 宁金峰 51CTO博客,原文链接:http://blog.51cto.com/13243523/1973314,如需转载请自行联系原作者

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
5月前
|
存储 设计模式 监控
运用Unity Profiler定位内存泄漏并实施对象池管理优化内存使用
【7月更文第10天】在Unity游戏开发中,内存管理是至关重要的一个环节。内存泄漏不仅会导致游戏运行缓慢、卡顿,严重时甚至会引发崩溃。Unity Profiler作为一个强大的性能分析工具,能够帮助开发者深入理解应用程序的内存使用情况,从而定位并解决内存泄漏问题。同时,通过实施对象池管理策略,可以显著优化内存使用,提高游戏性能。本文将结合代码示例,详细介绍如何利用Unity Profiler定位内存泄漏,并实施对象池来优化内存使用。
368 0
|
4月前
|
SQL 存储 监控
|
6月前
|
机器学习/深度学习 并行计算 PyTorch
使用PyTorch Profiler进行模型性能分析,改善并加速PyTorch训练
加速机器学习模型训练是工程师的关键需求。PyTorch Profiler提供了一种分析工具,用于测量CPU和CUDA时间,以及内存使用情况。通过在训练代码中嵌入分析器并使用tensorboard查看结果,工程师可以识别性能瓶颈。Profiler的`record_function`功能允许为特定操作命名,便于跟踪。优化策略包括使用FlashAttention或FSDP减少内存使用,以及通过torch.compile提升速度。监控CUDA内核执行和内存分配,尤其是避免频繁的cudaMalloc,能有效提升GPU效率。内存历史记录分析有助于检测内存泄漏和优化批处理大小。
616 1
|
7月前
|
Dart 前端开发 开发者
【Flutter前端技术开发专栏】Flutter中的性能分析工具Profiler
【4月更文挑战第30天】Flutter Profiler是用于性能优化的关键工具,提供CPU、GPU、内存和网络分析。它帮助开发者识别性能瓶颈,如CPU过度使用、渲染延迟、内存泄漏和网络效率低。通过实时监控和分析,开发者能优化代码、减少内存占用、改善渲染速度和网络请求,从而提升应用性能和用户体验。定期使用并结合实际场景与其它工具进行综合分析,是实现最佳实践的关键。
349 0
【Flutter前端技术开发专栏】Flutter中的性能分析工具Profiler
|
人工智能 Java Android开发
全面了解CPU Profiler:解读CPU性能分析工具的核心功能与用法
**==Traceview==** 是一个用于分析应用程序性能的工具,用来分析函数调用过程。 **==CPU Profiler==** 是 集成在Android Studio 3.2版本之后的Android Profiler工具当中,实时记录展示 App cpu消耗,用来替代Traceview。
|
机器学习/深度学习 Web App开发 JSON
Paddle模型性能分析工具Profiler:定位瓶颈点、优化程序、提升性能
1.Paddle模型性能分析工具Profiler:定位瓶颈点、优化程序、提升性能
|
前端开发 API JavaScript
React 官方发布性能分析插件Profiler
React 16.5 新增了对开发工具(DevTools)性能分析插件(profiler plugin)的支持。
2398 0
|
Java 图形学 异构计算
Unity - Profiler参数详解
CPU Usage ​       ● GC Alloc - 记录了游戏运行时代码产生的堆内存分配。这会导致ManagedHeap增大,加速GC的到来。我们要尽可能避免不必要的堆内存分配,同时注意:1、检测任何一次性内存分配大于2KB的选项;2、检测每帧都具有20B以上内存分配的选项。
2427 0
|
图形学
Unity Profiler CPU使用情况分析器
内容翻译主要以机器翻译为主,有翻译错误的地方大家留言我可以及时更正 CPU使用情况分析器 CPU使用情况分析器显示您在游戏中花费的时间。
2399 0