支付宝 App 构建优化解析:通过安装包重排布优化 Android 端启动性能

本文涉及的产品
mPaaS订阅基础套餐,标准版 3个月
简介: 本章节我们将围绕《支付宝 App 构建优化解析》另启新系列,细分拆解客户端在“代码管理”、“证书管理”、“版本管理”、“构建打包”等维度的具体实现方案展开讨论,带领大家进一步了解支付宝在 App 构建模块下的持续优化。

1. 前言

本章节我们将围绕《支付宝 App 构建优化解析》另启新系列,细分拆解客户端在“代码管理”、“证书管理”、“版本管理”、“构建打包”等维度的具体实现方案展开讨论,带领大家进一步了解支付宝在 App 构建模块下的持续优化。

本节将主要记录通过对支付宝 Android Apk 文件的重新布局,来改善 IO 性能的过程。

2. 背景

支付宝 App 在 Android 平台上,由于大量业务快速上线,Android 长尾机型等原因,造成启动阶段及部分核心链路上,性能体验不理想,进而影响用户的使用的感受。
从纯业务角度,可以通过优化 UI 布局,优化代码结构,优化 bundle 加载等方式,对性能体验有所改善。作为工程技术团队,按照传统思维来看,似乎无法对性能优化做多少贡献。经过一些方案调研后,我们尝试通过对编译产物的优化,干预构建流程,以提升 App 性能。

3. 原理

布局前后,Apk 中实际的文件并没有本质改变,只有位置发生了变化。那么为什么这样的调整会有性能造成影响?这个原理要追溯到 Linux 的文件系统机制。

如下图所示,Linux 底层文件系统中 VFS 上次 App 进程之间,存在一层 pagecache,pagecache 由内存中的物理 page 组成,其内容对应磁盘上的 block。Pagecache 的大小是动态变化的,可以扩大,也可以在内存不足时缩小。Cache 缓存的存储设备被称为后备存储(backing store),一个 page 通常包含多个 block,这些 block 不一定是连续的。

当内核发起一个读请求时(例如进程发起 read() 请求),首先会检查请求的数据是否缓存到了 pagecache 中。如果有,那么直接从内存中读取,不需要访问磁盘,这被称为 cache命中(cache hit)。如果 cache 中没有请求的数据,即 cache 未命中(cache miss),就必须从磁盘中读取数据。

然后内核将读取的数据缓存到 cache 中,这样后续的读请求就可以命中 cache 了。Page 可以只缓存一个文件部分的内容,不需要把整个文件都缓存进来。对磁盘的数据进行缓存从而提高性能主要是基于两个因素:

  • 第一,磁盘访问的速度比内存慢好几个数量级(毫秒和纳秒的差距)。
  • 第二是被访问过的数据,有很大概率会被再次访问。

结合 Android 系统实际来看,上层 App 每次读取磁盘时,文件系统默认会按 16 * 4k block 去磁盘读取数据,并把数据放到 pagecache 中。如果下次读取文件已经在 pagecache 中,则不会发生真实的磁盘 IO,而是直接从 pagecache中 读取,大大提升读的速度。有缓存就有回收,pagecache 的另一个重要工作是释放 page,从而释放内存空间。Cache 回收的任务是选择合适的 page 释放,并且如果 page 是 dirty 的,需要将 page 写回到磁盘中再释放。

理想的做法是释放距离下次访问时间最久的 page,但是很明显,这是不现实的。基于 LRU改进的 Two-List 是 Linux 使用的策略。这个回收策略非常类似业务开发领域,常见的图片加载的缓存策略。LRU 算法是选择最近一次访问时间最靠前的 page,即干掉最近没被光顾过的 page。原始 LRU 算法存在的问题是,有些文件只会被访问一次,但是按照 LRU 的算法,即使这些文件以后再也不会被访问了,但是如果它们是刚刚被访问的,就不会被选中。

Two-List 策略维护了两个list,active list 和 inactive list。在 active list 上的 page 被认为是 hot 的,不能释放。只有 inactive list 上的 page 可以被释放的。首次缓存的数据的 page 会被加入到 inactive list 中,已经在 inactive list 中的 page 如果再次被访问,就会移入 active list 中。两个链表都使用了伪 LRU 算法维护,新的 page 从尾部加入,移除时从头部移除,就像队列一样。

如果 active list 中 page 的数量远大于 inactive list,那么 active list 头部的页面会被移入 inactive list 中,从而维持两个表的平衡。简单的说,通过文件重布局的目的,就是将启动阶段需要用到的文件在 APK 文件中排布在一起,尽可能的利用 pagecache 机制,用最少的磁盘 IO 次数,读取尽可能多的启动阶段需要的文件,减少 IO 开销,从而达到提升启动性能的目的。

4. 落地方案

在了解原理之后,就需要考虑怎么用工程化的方案在支付宝 App 上落地,主要从以下三个流程来设计方案并落地。

  • 度量:

重布局的前提必须是精确的度量,定位到那些可以调整,需要调整的文件。这个过程需要足够的准确,否则会导致重布局之后的效果不佳。
度量的最终目的是要,统计到支付宝启动阶段,哪些文件加载了,并且是发生真实的磁盘IO,还是命中了 pagecache 缓存。我们提供了一个度量工具,通过修改 kernel 源码,dump 出文件系统的 IO 行为,在特定的 Android ROM 上打个补丁,用来统计启动时刻文件行为。部分数据如下:

数据中,第一列的数据表示发生 IO 行为的文件,第二列表示该文件中此偏移量对应的部分发生了 IO 行为。

第一列表示发生 IO 的位置,如果为 0,则表示发生了真实的磁盘 IO;如果为 1,则表示从pagecache 缓存中读取了内容。

通过数据可以发现,Apk 中部分文件,实际上是发生了磁盘 IO,可以尝试将启动阶段, Apk 中所用到的文件排布到一起,期望通过少量的 IO,就将所有的文件全部读到。之后的工作,需要通过解析 zip 包结构,将上述结果中,文件偏移量对应到详细的文件名。首先需要得到安装包中的文件排布情况,可以通过类似 010 Editor 的工具得到,为了工程化的考虑,也可以参考 zip 格式定义通过脚本分析 zip 文件实现。

然后通过解析结果和先前的统计结果对应分析,就能找到 zip 中哪些文件,在启动阶段被读到,为重布局提供数据支撑。

  • 重布局:

在得到一个启动阶段的文件列表后,第二步工作,就是根据这个文件列表,在构建打包阶段,在 Apk 中把这部分文件排布在一起。这里需要修改 7z 压缩工具的源码。支付宝构建流程,为了提升压缩效率,减少包大小,使用 7z 工具进行最后压缩出 Apk 的过程。这里在简单阐述下,重排布的原因,无论是那种压缩工具,zip 中文件顺序是文件系统的默认顺序,即按照阿拉伯数字和字母顺序。如果想指定文件排在一起,必然要打破这种规则。
修改 7z 源码的过程,简单思路如下,扩展一个命令行参数,我们使用了上箭头'^'(表意性强,提前的意思),可以传入 list.txt,然后 7z 执行输出文件流时候,按照 list 中的文件顺序,改变最后的输出顺序,从而达到重排布的目的。例如如下命令,就是将 source 目录中,所有文件压缩,并且把 list 中指定文件排布在 zip 包的开始位置。

7z a -tzip archive.zip source* ^list.txt

通过这种方式,就实现了文件重排布的简单过程,当然在支付宝的构建流程中,较为复杂,中间还涉及到重打包,重签名等一系列流程。后续内容会提到。
这里有一个小插曲,在刚开始调整文件顺序时,我们通过测量发现效果并不好。后来发现了原因,原先我们调整的文件列表,只是度量阶段发现,所有发生磁盘 IO 的文件,把他们排布到一起,错误的认为,只要他们调整了,整体 IO 情况就会改善。可是忽略了“此消彼长”的问题,如果只调整这些文件,那么原先排布在这些文件后面,利用预读机制进缓存 cache 的文件,如果在启动阶段用到,可能会发生新的磁盘 IO。正确的调整方式,应该能精确按时间顺序统计启动阶段的所有文件,排布在一起,这样发生少量 IO,就能全部读到 cache 中。
简单看下某一次实验主 Apk 中文件调整前后的效果如下,几个和配置相关的移到文件头部。

调整前

调整后

  • 回归测试:

按照所以计划将文件全部调整完毕后,就到了验证效果的环节。主要有以下几种验证方式和思路:

  • 线下录屏,然后拆解视频帧,测直观的启动时间。
  • 线下使用工具度量 IO 情况,观察启动阶段磁盘 IO 数量是否减少,量化一个“cache miss 率”的概念。
  • 线下通过埋点的方案,通过脚本,多次模拟冷启动,取平均值测量,消除可能误差,观察趋势。
  • 线上灰度在其他优化和代码类似情况下,只通过调整 IO,比较两个版本的启动时间变化。 在重布局方案实验阶段,使用一二两种方案较多,后续工程化落地和常态化优化时,应采用三四种方案。

5. 演进

通过上述落地方案,在线下以及某些线上灰度版本中完成初步实验后,我们考虑工程化,常态化的进行这件事情。在工程化之前,先对度量流程进行了扩充,探索出了一种较为简单的度量手段。

  • 度量优化:

原先的度量方案,具备较深的技术含量,在这个方案中,需要对 Linux 底层文件系统非要熟悉和了解,并且还需具备修改源码的能力,此方案是由其他资深专家指导下实现,短期内,团队暂时无法独立这个方案。
为了让整体方案可控,我们想到了直接在 Android 源码的资源加载流程中记录日志,然后通过日志直接分析,这样启动阶段文件加载一目了然,当然缺陷也很明显,无法通过判断文件读取是通过磁盘 IO 还是 pagecache 缓存。
干预资源加载记录,要不通过 hook 方式,要不就是直接改 framework,刷个 ROM,考虑到工程化自动化测试的因素,采用了修改 framework 的方式,方便后续有测试平台,直接使用特定手机跑脚本执行即可。
以 Android 7.0 版本为例,主要修改 drawable 相关流程和 xml 相关流程。其他版本如果做测试度量机型的化,修改方式类似。

  • xml 加载流程修改,在解析 xml 文件流程,直接打日志。
  /**
     * Loads an XML parser for the specified file.
     *
     * @param file the path for the XML file to parse
     * @param id the resource identifier for the file
     * @param assetCookie the asset cookie for the file
     * @param type the type of resource (used for logging)
     * @return a parser for the specified XML file
     * @throws NotFoundException if the file could not be loaded
     */
    @NonNull
    XmlResourceParser loadXmlResourceParser(@NonNull String file, @AnyRes int id, int assetCookie,
            @NonNull String type)
            throws NotFoundException {
        if (id != 0) {
            try {
                synchronized (mCachedXmlBlocks) {
                    if (!getResourcePackageName(id).equalsIgnoreCase("android")) {
                        Log.i("AlipayRes", "ResourceId: " + Integer.toHexString(id) + "  ResourcePackage name: " + getResourcePackageName(id) + "  Loading xml: " + file);
                    }
                    final int[] cachedXmlBlockCookies = mCachedXmlBlockCookies;
                    final String[] cachedXmlBlockFiles = mCachedXmlBlockFiles;
                    final XmlBlock[] cachedXmlBlocks = mCachedXmlBlocks;
                    // First see if this block is in our cache.
                    final int num = cachedXmlBlockFiles.length;
                    for (int i = 0; i < num; i++) {
                        if (cachedXmlBlockCookies[i] == assetCookie && cachedXmlBlockFiles[i] != null
                                && cachedXmlBlockFiles[i].equals(file)) {
                            return cachedXmlBlocks[i].newParser();
                        }
                    }
            ……
            ……
    }
  • drawable 修改
 /**
     * Loads a drawable from XML or resources stream.
     */
    private Drawable loadDrawableForCookie(Resources wrapper, TypedValue value, int id,
            Resources.Theme theme) {
        if (value.string == null) {
            throw new NotFoundException("Resource \"" + getResourceName(id) + "\" ("
                    + Integer.toHexString(id) + ") is not a Drawable (color or path): " + value);
        }

        final String file = value.string.toString();

        if (TRACE_FOR_MISS_PRELOAD) {
            // Log only framework resources
            if ((id >>> 24) == 0x1) {
                final String name = getResourceName(id);
                if (name != null) {
                    Log.d(TAG, "Loading framework drawable #" + Integer.toHexString(id)
                            + ": " + name + " at " + file);
                }
            }
        }

        if (DEBUG_LOAD) {
            Log.v(TAG, "Loading drawable for cookie " + value.assetCookie + ": " + file);
        }
        if (!getResourcePackageName(id).equalsIgnoreCase("android")) {
            Log.i("AlipayRes", "ResourceId: " + Integer.toHexString(id) + "  ResourcePackage name: " + getResourcePackageName(id) + "  Loading drawable: " + file);
        }
        ……
        ……
    }

刷入 ROM,替换修改后 framework 后,冷启动支付宝,清楚缓存,通过日志过滤即可得到完整启动文件加载列表。

adb shell am force-stop com.eg.android.AlipayGphone
adb shell
echo 1 > /proc/sys/vm/drop_caches

  • 工程化:

所以单点能力都基本具备单点能力都具备后,需要找到一个能尽可能自动化的方案。具体流程图如下。
后续对于 ReApk (优化Apk)流程,可以扩展其他的构建构建产物优化方案。

6. 结果与展望

目前整体方案,已上线支付宝钱包 Android App,该单项,启动性能,在整体全量用户下有 5% 左右的优化效果,低端机上效果较明显,根据不同机型,能有10%左右的启动性能优化效果。

Facebook 的工具链优化方案 Redex,对于 dex 的优化,从度量到回归测试,开源出了一整套解决方案,对于 zip 的重布局,希望未来能将此整套方案,做到尽可能的“开箱即用”,赋能公司内外更多的 App。

7. 小结

通过本节内容,我们初步了解了支付宝在 Android 客户端如何通过安装包重排布来优化 IO 性能。由于篇幅限制,很多技术要点我们无法一一展开。而相应的技术内核,我们同样应用在了 mPaaS 并对外输出,欢迎大家上手体验:

https://tech.antfin.com/docs/2/49549

关于 Android 端启动性能优化的设计思路和具体实践,同样期待你们的反馈,欢迎一起探讨交流。

往期阅读

《支付宝客户端架构解析:iOS 容器化框架初探》

《支付宝客户端架构解析:Android 容器化框架初探》

《支付宝客户端架构解析:Android 客户端启动速度优化之「垃圾回收」》

《支付宝客户端架构解析:iOS 客户端启动性能优化初探》

关注我们微信公众号「mPaaS」,获得第一手 mPaaS 技术实践干货

目录
相关文章
|
8天前
|
IDE Android开发 iOS开发
深入解析Android与iOS的系统架构及开发环境差异
本文旨在探讨Android和iOS两大主流移动操作系统在系统架构、开发环境和用户体验方面的显著差异。通过对比分析,我们将揭示这两种系统在设计理念、技术实现以及市场策略上的不同路径,帮助开发者更好地理解其特点,从而做出更合适的开发决策。
36 2
|
13天前
|
传感器 C# Android开发
深度解析Uno Platform中的事件处理机制与交互设计艺术:从理论到实践的全方位指南,助您构建响应迅速、交互流畅的跨平台应用
Uno Platform 是一款开源框架,支持使用 C# 和 XAML 开发跨平台原生 UI 应用,兼容 Windows、iOS、Android 及 WebAssembly。本文将介绍 Uno Platform 中高效的事件处理方法,并通过示例代码展示交互设计的核心原则与实践技巧,帮助提升应用的用户体验。事件处理让应用能响应用户输入,如点击、触摸及传感器数据变化。通过 XAML 或 C# 添加事件处理器,可确保及时反馈用户操作。示例代码展示了一个按钮点击事件处理过程。此外,还可运用动画和过渡效果进一步增强应用交互性。
122 57
|
13天前
|
机器学习/深度学习 存储 人工智能
让模型评估模型:构建双代理RAG评估系统的步骤解析
在当前大语言模型(LLM)应用开发中,评估模型输出的准确性成为关键问题。本文介绍了一个基于双代理的RAG(检索增强生成)评估系统,使用生成代理和反馈代理对输出进行评估。文中详细描述了系统的构建过程,并展示了基于四种提示工程技术(ReAct、思维链、自一致性和角色提示)的不同结果。实验结果显示,ReAct和思维链技术表现相似,自一致性技术则呈现相反结果,角色提示技术最为不稳定。研究强调了多角度评估的重要性,并提供了系统实现的详细代码。
41 10
让模型评估模型:构建双代理RAG评估系统的步骤解析
|
11天前
|
存储 开发框架 数据可视化
深入解析Android应用开发中的四大核心组件
本文将探讨Android开发中的四大核心组件——Activity、Service、BroadcastReceiver和ContentProvider。我们将深入了解每个组件的定义、作用、使用方法及它们之间的交互方式,以帮助开发者更好地理解和应用这些组件,提升Android应用开发的能力和效率。
|
14天前
|
缓存 Android开发 开发者
Android RecycleView 深度解析与面试题梳理
本文详细介绍了Android开发中高效且功能强大的`RecyclerView`,包括其架构概览、工作流程及滑动优化机制,并解析了常见的面试题。通过理解`RecyclerView`的核心组件及其优化技巧,帮助开发者提升应用性能并应对技术面试。
40 8
|
14天前
|
存储 缓存 Android开发
Android RecyclerView 缓存机制深度解析与面试题
本文首发于公众号“AntDream”,详细解析了 `RecyclerView` 的缓存机制,包括多级缓存的原理与流程,并提供了常见面试题及答案。通过本文,你将深入了解 `RecyclerView` 的高性能秘诀,提升列表和网格的开发技能。
38 8
|
9天前
|
存储 安全 算法
网络安全与信息安全:构建数字世界的坚固防线在数字化浪潮席卷全球的今天,网络安全与信息安全已成为维系社会秩序、保障个人隐私与企业机密的关键防线。本文旨在深入探讨网络安全漏洞的成因与影响,解析加密技术如何筑起数据安全的屏障,并强调提升公众安全意识的重要性,共同绘制一幅数字时代安全防护的蓝图。
本文聚焦网络安全与信息安全领域,通过剖析网络安全漏洞的多样形态及其背后成因,揭示其对个人、企业乃至国家安全的潜在威胁。随后,详细阐述了加密技术的原理、分类及应用,展现其在保护数据安全方面的核心作用。最后,强调了提升全民网络安全意识的紧迫性,提出具体策略与建议,旨在构建一个更加安全、可靠的数字环境。
|
15天前
|
存储 缓存 自然语言处理
深度解析ElasticSearch:构建高效搜索与分析的基石
【9月更文挑战第8天】在数据爆炸的时代,如何快速、准确地从海量数据中检索出有价值的信息成为了企业面临的重要挑战。ElasticSearch,作为一款基于Lucene的开源分布式搜索和分析引擎,凭借其强大的实时搜索、分析和扩展能力,成为了众多企业的首选。本文将深入解析ElasticSearch的核心原理、架构设计及优化实践,帮助读者全面理解这一强大的工具。
97 7
|
缓存 开发工具 Android开发
Android App性能评测分析-启动时间篇
1、前言 随着项目版本的迭代,App的性能问题会逐渐暴露出来,而好的用户体验与性能表现紧密相关,性能问题从应用的启动优化开始,下面会根据实际app性能测试案例,进行app性能评测之启动时间的分析和总结。
4246 0
|
Shell Linux 测试技术
Android App性能评测分析-cpu占用篇
1、前言 很多时候在使用APP的时候,手机可能会发热发烫。这是因为CPU使用率过高,CPU过于繁忙,会使整个手机无法响应用户,整体性能降低,用户体验就会很差,也容易引起ANR等等一系列问题。
5110 0

推荐镜像

更多
下一篇
无影云桌面