移动端性能监控探索:iOS RUM SDK 技术架构与实践

简介: 阿里云 RUM SDK 作为一款性能体验监控采集工具,可以作为辅助 App 运维的强有力助手,提升您的问题排查效率。

作者:元泊


前言


作为移动端的研发同学,你是否也曾陷入这样的困境:用户在应用商店留下了一星差评,抱怨“App 用起来很卡”或者“支付时闪退了”,但无论你在测试环境如何操作,都无法复现问题?面对着从海量日志中捞出的、可能毫无关联的信息,以及一个孤立的、缺少上下文的崩溃堆栈,排查问题就像在浓雾中“盲人摸象”,耗费了数天时间,最终却只能提交一个基于猜测的修复。

为了提升这种低效的排查模式,我们进行了 iOS 数据采集与关联方向的探索,并进行了产品化的实践。它可以站在每一位真实用户的视角,把应用的性能指标、错误日志和用户行为等数据串联起来,提升您的问题排查效率。


iOS 数据采集简介


为了能够把应用性能指标、错误日志、用户行为等串联起来,SDK 需要具备体系化的数据采集与分析能力。SDK 的核心数据采集能力覆盖以下几个方面:


  • 用户会话轨迹:SDK 会记录用户的完整的操作轨迹,并与相关的事件进行关联。当问题发生时,通过会话轨迹可以回溯用户的操作路径、API 调用和资源加载情况。
  • 性能指标:对影响用户体验的关键链路进行监控测量,包括:应用启动耗时、页面加载耗时、网络请求耗时、网络请求成功率、页面卡顿率等。
  • 异常与稳定性监控:能够自动捕获应用触发的各类异常,包含:Mach 内核异常,Objective-C 异常,Swift 异常,C/C++ 异常等。
  • 自定义数据上报:除了标准的性能和异常数据外,还支持业务根据自身需求上报自定义事件与日志,将用户行为与业务指标相结合,赋能更深层次的产品分析与角色。

数据采集架构和实现


为了有效应对以上挑战,SDK 通过一个轻量化、模块化的架构,对应用的不同阶段进行 hook 和监听,以实现应用性能和稳定性的监控。

1760943544570_D7CC386D-60F5-4e25-97FC-3CD256F5FF2A.png

  • 公共接口层:提供对外公开的 API,用户通过 API 与 SDK 进行交互。
  • SDK 管理层:管理 SDK 的各个模块,SDK 的启停等。
  • 数据采集等:管理各个数据采集模块,实现数据采集细节,各个数据模块实现隔离。
  • 基础核心层:支撑整个 SDK 的运行,提供时间同步,数据处理,配置管理等能力。

在基础核心层,SDK 为了统一各个端的实现,以及性能的考虑,使用 C 实现了独立的跨平台数据处理和跨平台配置管理模块,使多端保持一致的数据持久化、数据发送、数据序列化、配置拉取和管理等逻辑。

在数据采集层,为了高效、精准、无侵入地采集各类事件,SDK 基于 Method Swizzling 技术和 iOS 系统平台特性与框架能力,构建了多样化的采集方案。并针对不同的场景和数据类型,分别采用合适的技术手段,主要包含:


  • 基于 Method Swizzling 的网络等数据采集。
  • 基于系统特性与框架能力的数据采集。
  • 崩溃异常数据的采集。


基于 Method Swizzling 的数据采集

iOS 开发的主要语言是 Objective-C 和 Swift,提到 Method Swizzling 技术离不开 iOS 的 ObjC 运行时。ObjC 是一门动态语言,在运行时间会对变量的数据类型检查,同时根据函数名查找要调用的函数。这种特性使得 ObjC 变得比较灵活,SDK 可以在程序运行时动态修改一个方法的实现,从而达到数据采集和埋点插桩的目的。

Method Swizzling 被称为动态方法交换技术,用于改变一个已经存在的 selector 实现。基于此技术,SDK 可以在程序运行时,通过改变 selector 所在 Class 的 method list 的映射,从而改变方法的调用,本质上是交换两个方法的 IMP。

1760943621883_EA42F710-FBD1-41d2-AC3A-D8865CE32559.png

通过以上方式,SDK 支持:


  • 网络请求数据采集:支持性能数据,状态码,错误原因,端到端链路打通等数据的采集。通过 Method Swizzling,SDK 对实现了对 URLSession 和 URLConnection 等网络库的无侵入数据采集。
  • 页面数据采集:支持页面加载耗时,页面状态变化等数据的采集。
  • Action 数据采集:支持 UITableView、UITableView 等控件的点击事件采集。
  • WebView 数据采集:结合 web 探针,支持了应用内置 H5 页面数据的采集,包含:网络资源请求,页面和路由切换,js 异常等。


基于系统特性与框架能力的数据采集

除了 Method Swizzling 之外,SDK 还利用系统特性和框架的标准 API 来采集应用在运行时的关键事件。


如上图所示,是 iOS 应用从启动到终止过程(包含前后台切换),系统通过事件通知中心对外暴露的事件状态变化。SDK 通过注册这些事件完成应用状态事件的采集。


为了准确采集应用的状态变化,SDK 按照不同的场景,分别对不同的事件进行处理:


  • 应用进入到前台事件:SDK 会对 willEnterForeground 和 didBecomeActive 事件处理。
  • 应用进入到后台事件:SDK 会对 willResignActive 和 didEnterBackground 事件处理。

为了统一的监控这些事件,SDK 提供了 AppLifeCycle 类对这些事件进行管理,简化事件处理的同时也能保证调用时序。除此之外,SDK 还对 RunLoop 进行了监听,通过检查 RunLoop 运行状态,实现卡顿监控事件的采集等。

通过以上方式,SDK 支持:


  • 应用启动耗时采集:支持应用冷启动、热启动耗时指标采集。
  • 卡顿事件采集:支持卡顿事件的采集,同时支持耗时堆栈的提取。
  • 网络状态的采集:支持网络类型的采集。


崩溃异常数据的采集

SDK 崩溃数据的采集能力基于业界知名的 KSCrash 框架开发。KSCRash 是一款强大的 iOS 崩溃报告库,其核心优点是“崩溃安全”,确保处理过程自身稳定可靠。它能全面捕获 Mach、C++、OC 等多种致命错误,生成包含所有线程堆栈和丰富上下文的详尽报告,极大提升开发者定位问题的效率。KSCrash 的工作流程主要分为下面五个部分:


  • 核心功能模块:协调各个模块工作,实现异常捕获的核心逻辑。
  • 监控系统:管理和协调各类异常监视器,全面捕获不同类型的异常。
  • 报告系统:生成详细的崩溃报告,进行本地存储和数据过滤。
  • 配置系统:按需配置框架的行为。
  • 安装系统:处理框架的安装流程,崩溃报告的发送工作。

1760943667080_16546AE0-3249-4768-B99C-6A401E617D17.png

基于 KSCrash,SDK 支持:


  • Mach、C++、OC、Signal 等类型的崩溃捕获。
  • 基于 KSCrash 的堆栈捕获能力,支持卡顿耗时堆栈的读取。


结语


阿里云 RUM SDK 作为一款性能体验监控采集工具,可以作为辅助 App 运维的强有力助手,提升您的问题排查效率。您可以参考接入文档https://help.aliyun.com/zh/arms/user-experience-monitoring/monitor-ios-apps体验接入 iOS SDK。相关问题可以加入“RUM 用户体验监控支持群”(钉钉群号: 67370002064)进行咨询。

您也可以参考以下文档体验接入 Android、Harmony SDK:

Android:https://help.aliyun.com/zh/arms/user-experience-monitoring/monitor-android-apps

HarmonyOS:https://help.aliyun.com/zh/arms/user-experience-monitoring/monitor-harmonyos-apps


点击此处,查看接入文档。

相关实践学习
通过轻量消息队列(原MNS)主题HTTP订阅+ARMS实现自定义数据多渠道告警
本场景将自定义告警信息同时分发至多个通知渠道的需求,例如短信、电子邮件及钉钉群组等。通过采用轻量消息队列(原 MNS)的主题模型的HTTP订阅方式,并结合应用实时监控服务提供的自定义集成能力,使得您能够以简便的配置方式实现上述多渠道同步通知的功能。
相关文章
|
5月前
|
数据采集 监控 JavaScript
移动端性能监控探索:鸿蒙 NEXT 探针架构与技术实现
阿里云 ARMS 团队倾力打造的鸿蒙 NEXT SDK,为鸿蒙应用提供了业界领先的全链路监控解决方案。这不仅仅是一个 SDK,更是您洞察用户体验、优化应用性能的智能伙伴。
703 43
|
安全 Android开发 iOS开发
深入探索Android与iOS的差异:从系统架构到用户体验
在当今的智能手机市场中,Android和iOS无疑是最受欢迎的两大操作系统。本文旨在探讨这两个平台之间的主要差异,包括它们的系统架构、开发环境、安全性、以及用户体验等方面。通过对比分析,我们可以更好地理解为何不同的用户群体可能会偏好其中一个平台,以及这些偏好背后的技术原因。
|
Android开发 Swift iOS开发
深入探索iOS与Android操作系统的架构差异及其对应用开发的影响
在当今数字化时代,移动设备已经成为我们日常生活和工作不可或缺的一部分。其中,iOS和Android作为全球最流行的两大移动操作系统,各自拥有独特的系统架构和设计理念。本文将深入探讨iOS与Android的系统架构差异,并分析这些差异如何影响应用开发者的开发策略和用户体验设计。通过对两者的比较,我们可以更好地理解它们各自的优势和局限性,从而为开发者提供有价值的见解,帮助他们在这两个平台上开发出更高效、更符合用户需求的应用。
|
10月前
|
JavaScript 前端开发 Go
Wasm Client SDK 架构介绍
Wasm Client SDK 架构介绍
402 13
|
开发工具 Android开发 iOS开发
Android与iOS生态差异深度剖析:技术架构、开发体验与市场影响####
本文旨在深入探讨Android与iOS两大移动操作系统在技术架构、开发环境及市场表现上的核心差异,为开发者和技术爱好者提供全面的视角。通过对比分析,揭示两者如何塑造了当今多样化的移动应用生态,并对未来发展趋势进行了展望。 ####
|
安全 Android开发 iOS开发
深入探索iOS与Android系统架构差异及其对开发者的影响
本文旨在通过对比分析iOS和Android两大移动操作系统的系统架构,探讨它们在设计理念、技术实现及开发者生态方面的差异。不同于常规摘要仅概述内容要点,本摘要将简要触及核心议题,为读者提供对两大平台架构特点的宏观理解,铺垫
|
IDE 安全 Android开发
深入探索Android与iOS操作系统的架构差异
本文旨在对比分析Android和iOS两大主流移动操作系统在架构设计上的根本差异。通过详细解读两者的系统架构、开发环境、以及安全性等方面,揭示它们各自的特点及优势,为开发者选择合适的平台提供参考。
|
安全 Android开发 iOS开发
深入探讨Android与iOS的系统架构差异
本文旨在通过对比分析Android和iOS两大移动操作系统的系统架构,揭示它们在设计理念、安全性、应用生态及开发环境等方面的显著差异。我们将从底层架构出发,逐步剖析至用户界面层面,为开发者和科技爱好者提供一份详尽的技术参考。
932 1
|
安全 Linux Android开发
深入探索Android与iOS的系统架构:一场技术较量
在当今数字化时代,智能手机操作系统的选择成为了用户和开发者关注的焦点。本文将深入探讨Android与iOS两大主流操作系统的系统架构,分析它们各自的优势与局限性,并对比两者在用户体验、开发生态和安全性方面的差异。通过本文的技术剖析,读者将对这两个平台的核心技术有更深入的理解。
|
iOS开发 前端开发 开发者

热门文章

最新文章