利用“崩溃轨迹”分析崩溃

简介:

原文出自【听云技术博客】:http://blog.tingyun.com/web/article/detail/777

“崩溃,严重伤害用户的情感,严重损害用户体验,罪恶行径简直令人发指,特请xx狮、xx猿火速缉拿案犯归案,刻不容缓,钦此。”

虽然在“听云App”等类似优秀工具的帮助下,大多数的崩溃都能快速的、轻易的定位问题,如图:

上图所示,已经定位到某源文件的某行,再加上崩溃message,崩溃的原因就显而易见了。

但有些崩溃的原因就不是那么显而易见了,往往需要寻找更多蛛丝马迹来定位问题,要不然也谈不上什么“分析”了。

本文用两个例子说明“崩溃轨迹”在分析崩溃过程中的重要作用。

“崩溃轨迹”介绍

遇到难分析的崩溃时,最想得到的信息是:用户当时是怎么操作的?如何能复现崩溃?

“崩溃轨迹”也即“交互轨迹”,它记录的是崩溃前若干连续的用户操作。利用这些操作,或者能复现崩溃(这是最理想的),或者帮助缩小嫌疑范围。

下图是一个崩溃轨迹,先来认识一下:

好了,我们通过两个例子进一步了解“崩溃轨迹”的作用。

案例1

今年4月21日,我们的一家客户发现他们的app发生了大量的崩溃,崩溃率很高,其中一个bug导致的崩溃占了总崩溃的63%,可是从堆栈上看不出有价值的信息,如图:

我们帮客户分析时发现,这个堆栈没有反映出崩溃的原因,对于分析没有什么帮助。

这时我们把眼光投向“崩溃轨迹”,如图:

请注意,最后两个动作的时间都是“1秒前”,而且触发的函数也一样……猜到啥情况了吗?这是app的使用者快速连续操作了。基于这个推断,我们与客户一起,按照这个轨迹操作,果然,在那个界面只要快速连续点击,必崩!

能复现就好办了,直接联机调试,问题立即解决。

案例2:

这个例子是几天刚发生的,栈信息如图:

同样的,也是崩溃堆栈只有main函数,也是一头雾水,但崩溃轨迹提供了重要信息,请看轨迹:

最后一个操作发生在崩溃前0秒,这意味着崩溃就发生在那个函数里,这一下子范围小多了!虽然这个崩溃不是必现,没有按照轨迹复现出来,但因为“嫌疑”范围就在那几行,客户的开发人员很快就想到了问题所在。

通过以上两个例子介绍崩溃轨迹的重要作用,希望对大家有帮助。

目录
相关文章
|
6月前
|
网络安全
LabVIEW崩溃后如何排查故障
LabVIEW崩溃后如何排查故障
52 0
|
6月前
|
JavaScript IDE Java
bugly崩溃排查3:观察是谁调用了崩溃函数
bugly崩溃排查3:观察是谁调用了崩溃函数
75 0
|
6月前
|
监控 JavaScript C++
监控游戏c/c++的崩溃的解决方案
监控游戏c/c++的崩溃的解决方案
104 0
|
Java 编译器 应用服务中间件
几行代码就可以把系统高崩溃;
几行代码就可以把系统高崩溃;
93 0
|
6月前
|
运维 监控 Java
线上故障突突突?如何紧急诊断、排查与恢复
本文简单介绍了阿里云上关于故障恢复、诊断的一些最佳实践。
线上故障突突突?如何紧急诊断、排查与恢复
|
运维 Java
线上故障快速定位及恢复(下)
线上故障快速定位及恢复(下)
190 0
线上故障快速定位及恢复(下)
|
Java Linux
线上故障快速定位及恢复(上)
线上故障快速定位及恢复(上)
230 0
线上故障快速定位及恢复(上)
|
存储 缓存 Java
崩溃堆栈还原技术大揭秘
岳鹰全景监控平台,具备分布式的符号化系统,独有的C++崩溃堆栈还原,完美支持inline函数、行号还原。这样强大的系统是如何涉及到呢?本文为您揭秘!
1464 0
崩溃堆栈还原技术大揭秘
|
Java API 微服务
日志排查问题困难?分布式日志链路跟踪来帮你
开发排查系统问题用得最多的手段就是查看系统日志,在分布式环境中一般使用`ELK`来统一收集日志,但是在并发大时使用日志定位问题还是比较麻烦,由于大量的其他用户/其他线程的日志也一起输出穿行其中导致很难筛选出指定请求的全部相关日志,以及下游线程/服务对应的日志。
837 0
日志排查问题困难?分布式日志链路跟踪来帮你
|
Linux 测试技术 Shell
系统诊断小技巧(11):如何解决“问题复现了,但是捕捉数据进程因为CPU打满没有运行”?
引子 曾经搞过一个尴尬的案例。排查过一个CPU打满的问题。因为问题是在凌晨出现,而且非常随机。所以我们就准备了一个脚本,用来捕获占用CPU高的线程。但尴尬的是,问题复现了,我们的脚本偏偏在问题复现的时候,没有记录。
2042 0