本⽂出⾃于“「2021友盟+移动应⽤性能挑战赛」”中的参赛作品,该⽂章表述了作者如何借助友盟+U-APM⼯具进⾏了性能优化。
作为⼀款倒计时⽇历APP,我们需要对每个⽇期实时显示倒计时并精确到秒。但是我们的app在滑动刷新数据时,会出现卡顿。卡顿在很⼤程度上取决于设备的CPU和其他消耗CPU时间的进程。于是我们尝试使⽤了友盟+U-APM内存分析对APP进⾏分析:
通过观察内存的分布, ⼤部分程序的运⾏都处于可预测的范围内, 我们需要更加细粒度地进⾏测 试。
启动AndroidProfilerToolWindow,打开CPUProfiler并选择正确的时间线。连接我们的测试设备并再次进⾏滑动刷新,可以看到Profile线程被添加到应⽤进程并消耗了额外的CPU时间。看看Logcat:
I/Choreographer: Skipped 147 frames! The application may be doing too much |
查看CPUProfiler时间线:
图表上⽅有⼀个视图表示⽤户与应⽤程序的交互。所有⽤户输⼊事件在此处显示为紫⾊圆圈。可以看到⼀个圆圈,代表我们为刷新数据⽽执⾏的滑动。在事件下⽅,有⼀个 CPU 时间线,它以图形⽅式显示了与可⽤ CPU 总时间相关的应⽤程序和 其他进程的CPU 使⽤率。还可以查看应⽤程序正在使⽤的线程数。
底部可以看到属于应⽤进程的线程活动时间线 。每个线程处于由颜⾊指示的三种状态之⼀:活动(绿⾊)、等待(⻩⾊)或睡眠(灰⾊)。
在列表顶部, 可以找到应⽤程序的主线程。在我的设备 (Nexus 5X) 上,它使⽤的 CPU 时间⼤ 约5秒。我们可以记录⼀个⽅法跟踪来查看。
在滑动之前单击“记录”按钮以刷新操作并在数据刷新完成后⽴即停⽌记录⏹:
我们将从第⼀个选项卡中显示的图表开始分析。横轴代表时间的流逝。
调⽤者及其被调⽤者(从上到下) 显示在垂直轴上。⽅法调⽤也通过颜⾊区分,具体取决于是调⽤系统API、第三⽅API还是我们本地函数。每个⽅法调⽤的总时间是⽅法⾃身时间及其被调⽤者时间的总和:
从这张图表中,可以推断出性能问题出在generateItems⽅法内部。为了证实我们的推断,我们⼜使⽤了友盟+U-APM进⾏了线上测试,测试结果和前⽂相同,下图是友盟+ U-APM的卡顿分析测试,图中展示了主要是哪些⽅法造成了CPU的⾼耗时,导致了卡顿情况的发⽣:
⽕焰图揭示了哪些⽅法占⽤了宝贵的CPU时间,并聚合了相同的调⽤堆栈:
发现了两个可疑的地⽅, getRemainingTime整个⽅法执⾏时间达到2秒以上,LocalDateTime.format占⽤CPU时间1秒以上:
此时间还包括线程未处于活动状态的时间段。另外,可以切换要在线程时间中显示的计时信息。最后⼀个选项卡中的图表显示按CPU时间消耗降序排列的⽅法调⽤列表。该图表提供详细的计时信息(以微秒为单位):
从图表中获取消耗过多CPU时间的⽅法的计时信息。将它们与调⽤堆栈中的两个⽅法相关联:
class method total time (in ms) percentage of recorded duration
Sample1Activity refreshData 3027 89.28
Sample1Activity generateItems 3025 89.22
Sample1Activity getRemainingTime 1723 50.83
LocalDateTime format 1003 29.59
可以看到getRemainingTime和LocalDateTime.format消耗了超过80%的时间。为了解决卡顿问题,我们需要从这⾥⼊⼿。那么该怎么办? 聪明的读者可能已经提出了⼏种解决⽅案。 由于我们执⾏了⼤量计算, 所以我们 将只为少数当前显示和准备显示的项⽬调⽤getRemainingTime和LocalDateTime.format⽅法。
为了实现它,我们需要更新Item属性,保存必要的数据以便稍后执⾏格式化:
data class Item(val now: LocalDateTime, val offset: Int) |
这需要在generateItems和bindItem函数中应⽤以下更改:
private fun generateItems(): List<Item> {
val now = LocalDateTime.now()
return List(1_000) { Item(now, it + 1) }
}
private fun bindItem(holder: ViewHolderBinder<Item>, item: Item) = with(
valdate=item.now.plusDays(item.offset.toLong()).toLocalDate().atS
val remainingTime =getRemainingTime(item.now,date)
我们内联了 createItem 函数, 现在所有函数都在 bindItem ⽅法内部。在我们的代码修改⽣效之后, 重新启动 CPU Profiler 并记录⽅法的运⾏情况。
为了检查我们的优化是否成功,我们需要查看CallChart:
将⿏标移到generateItems函数上,会发现现在耗时约为0.3秒。⽐优化前减少了13倍以上的CPU时间。为了确保我们的更改不会对bindItem⽅法的耗时造成负⾯增益,我们切换到⽕焰图标来检查bindItem的总耗时。如图所示,它最多消耗0.1秒:
此外,我们可以进⾏滚动测试,以确保我们的代码优化不会影响整体应⽤程序的性能,并且在滚动过程中加以记录。测试发现滚动之后不会再出现卡顿和掉帧的情况了。成功!代码已优化!AndroidProfiler和友盟+U-APM都是很好的测试⼯具。如果我们追求流畅的⽤户体验,那么使⽤这些优秀的debug⼯具是⼗分必要的。在本⽂中, 我主要关注性能调优。
但是,本⽂中未涵盖的AndroidProfiler的MemoryProfiler和NetworkProfiler,友盟+U-APM的内存分析、OOF异常和内存占⽤也同样值得研究。记录内存分配对查找内存泄漏有很⼤帮助,例如代码中有没有回收bitmap。⽆论如何, 使⽤恰当的分析⼯具可以带来多项优化成果, 期待读者们的⾃⾏探索。
作者:查宇