热修复技术对比及阿里百川HtFix 2.0深入剖析

简介: 近两年来,热修复技术在安卓开发圈儿成为焦点。随之而来的是,相关的解决方案也不断涌现。为此,本文将热修复的几大流派分别做较深入的阐述,以使关注这一技术的开发同学有更深的了解。
近两年来,热修复技术在安卓开发圈儿成为焦点。随之而来的是,相关的解决方案也不断涌现。为此,本文将热修复的几大流派分别做较深入的阐述,以使关注这一技术的开发同学有更深的了解。

在正式切入话题之前,我们先来看看传统的开发流程究竟有哪些痛点。概括之,可以用三个“太”来描述:1.重新发布版本的代价太大;2.用户下载安装的成本太高;3.BUG修复不及时造成用户体验太差。

正因为如此,热修复技术才得以施展,并被广大开发者追捧。那么,热修复开发流程具有怎样的优势?总结起来,也有三点。

第一, 无需重新发版,而且实时高效。
第二, 用户对修复过程无感知,也无需下载新的应用,总之,代价非常小。
第三, 修复的成功率高,可以吧损失降至最低。

哎呀,热修复技术真是棒棒哒。但是热修复技术虽好,可不能“贪杯”,毕竟流派较多,哪款才适合呢?

目前,市面上主流的几个热修复流派有这些,阿里andfix、美团Robust、QQ空间和微信Tinker。那,咱们就一起来看看这些技术方案都有哪些优缺点?

阿里andfix   

hook本地方法. 并没有整体替换class。1. 打开链接库得到操作句柄, 获取native层内部函数, 得到classobject对象. 2. 修复访问权限属性为public 3. 得到新旧方法的指针, 新方法指向目标方法, 实现方法的替换

优点:1. 不侵入打包, 性能无损耗;2. 即时生效。

缺点:1. 需要针对dalvik虚拟机和art虚拟机做适配,需要考虑指令集的兼容问题,需要native代码支持,兼容性上会有一定的影响; 2. 不支持新增类方法/字段,以及修改<init>方法,也不支持对资源的替换。

美团Robust   

类似Instant Run原理, 每个产品代码的每个函数都在编译打包阶段自动的插入了一段代码。

客户端拿到patch.dex后,用DexClassLoader加载patch.dex. 其中的changeQuickRedirect字段赋值为用patch.dex中的StatePatch.java这个class new出来的对象。这就是打patch的主要过程。

优点:正常的使用DexClassLoader,兼容性高,未反射注入,实时生效。

缺点:1. 原来能被ProGuard内联的函数不能被内联了,所以可能导致方法数的增加,原来没超过65536但是后面可能就操作了65536限制,同时apk的体积也会一定程度的增大;2. so和资源的替换暂时不支持;3. 侵入式打包。

QQ空间       

类似Multidex, 注入, 插桩. 大致的过程就是:把BUG方法修复以后,放到一个单独的DEX里,插入到dexElements数组的最前面,让虚拟机去加载修复完后的方法。

davilk: 但是有一个问题是,当两个调用关系的类不在同一个DEX时,就会产生异常报错。我们知道,在APK安装时,davilk虚拟机通过dexopt将classes.dex优化成odex文件,然后才会执行。在这个过程中,会进行类的verify操作,如果调用关系的类都在同一个DEX中的话就会被打上CLASS_ISPREVERIFIED的标志,然后才会写入odex文件。所以,为了可以正常的进行打补丁修复,必须避免类被打上CLASS_ISPREVERIFIED标志,具体的做法就是单独放一个类在另外DEX中,让其他类调用。但是虽然阻止了被打上CLASS_ISPREVERIFIED标志, 但是运行时加载类做verify与optimize所以效率低下. 特别是应用刚启动的情况下需要加载大量类的情况下就会花不少时间。

art: Art采用了新的方式,插桩对代码的执行效率并没有什么影响。但是若补丁中的类出现修改类变量或者方法,可能会导致出现内存地址错乱的问题。为了解决这个问题我们需要将修改了变量、方法以及接口的类的父类以及调用这个类的所有类都加入到补丁包中。

优点:兼容性高

缺点:1. 不支持实时生效;2. avilk下类加载性能问题;3. art下补丁包包很大;4. 侵入式打包。

微信Tinker   

dex merge,微信针对QQ空间超级补丁技术的不足提出了一个提供DEX差量包,整体替换DEX的方案。主要的原理是与QQ空间超级补丁技术基本相同,区别在于不再将patch.dex增加到elements数组中,而是差量的方式给出patch.dex,然后将patch.dex与应用的classes.dex合并,然后整体替换掉旧的DEX,达到修复的目的。

优点:1. 自研DexDiff算法, 深度利用Dex的格式来减少差异的大小。它的粒度是Dex格式的每一项,可以充分利用原本Dex的信息,而BsDiff的粒度是文件 补丁包足够小。2. 有效防止了qq空间导致的加载效率下降问题。3. 侵入式打包。

缺点:1. 不支持即时生效;2. 需要给应用开启新的进程才能进行合并,并且很容易因为内存消耗等原因合并失败;3. 合并时占用额外磁盘空间,对于多DEX的应用来说,如果修改了多个DEX文件,就需要下发多个patch.dex与对应的classes.dex进行合并操作时,这种情况会更严重。

这里来一张图,一目了然~~
367dc4f9c96a92e19a4cbd7c68281229f02bd87b
咦,这表格里面怎么多了一个东东?百川HotFix是什么鬼?

阿里百川HotFix

百川HotFix是在阿里AndFix的基础上,增加了补丁管理后台。我们可以在下面的图中看到我们的服务后台功能,可以上传补丁。补丁必须跟版本号绑定,同时提供了补丁控制功能, 比如停止发布/继续发布/灰度/全量发布等功能。 

同时HotFix基于手淘的实践针对andfix做了大量优化,性能上提高了兼容和稳定性,功能上比如支持新增类和基于类方法作为粒度所以有更小的补丁包,开源的andfix补丁包是以类作为粒度。

事实上,阿里百川HotFix也在不断演进之中,最新的2.0版已经突破了很多限制,比如,不支持资源修复,so修复;不支持新增类方法/类字段等。现在这些都不是问题啦,而且它还在依然在不断进化!

相较于最初的1.X版本,阿里百川HotFix  2.0可谓发生了“翻天覆地”的变化。有哪些?请看。

* 将1.x版本的所有限制全部取消;
* 不仅仅只基于AndFix而是自由切换方案;
* 不管资源/SO文件/类修复都能做到实时生效;
* 傻瓜式接入, 完全不侵入你的打包过程, 可视化UI界面打补丁。

这么一个好东东究竟啥时候有啊?别急,2017年1月中旬就会上线,到时候就可以“你有我有全都有了!”

另外,阿里百川HotFix还有一些“计划”。

1、更小的补丁包,比如尝试so和资源文件做bsdiff。
2、支持四大组件的代理。
3、更好的性能和稳定兼容性。

你以为这样就完了?No,下面再给大家分享一下阿里百川HotFix的一些具体修复方案。

百川Hotfix2.X 类修复方案

补丁工具检测补丁冷部署or热部署

* 由于热部署andfix修复正在运行的方法有crash的风险, 所以补丁工具提供参数由业务方来决定是否尝试走热部署, 如果用户patch的方法没有被高频调用同时又有实时生效的需求, 那么可以优先选择走热部署方案

热部署 ->andfix支持的代码变更

* 此时走优化后的andfix方案
> 也就是目前hotfix1.0的方案

冷部署 ->andfix不支持代码变更

* davilk下hack本地方法native层绕过dvmresolveclass
> patch dex追加到PathClassLoad的dexElements中, 同时我们知道插桩的解决方案会影响到运行时性能的原因在于:app内的所有类都预埋引用一个独立dex的空类,导致安装dexopt阶段的preverify失败,运行时将再次verify+optimize. 所以我们选择了hack本地方法native层绕过dvmresolveclass方法的方式。 

* art下直接合成dex,采用手淘目前成熟的art动态部署方案 
> 不同于微信tinker的dex merge方案, dex merge其实很占用应用内存, 所以最终会导致dex merge失败, 实际上art上默认已经支持多dex的合并, 我们只需要把patch dex跟原来apk中的dex合并成完整的新dex, 然后去替换PathClassLoad的dexElements即可.

阿里百川Hotfix2.X SO文件修复方案

* art下预load原来so, 再load补丁so
* davilk下预load补丁so, 再load原来的so 
* 关键:  综合机型支持的abis和补丁包中的abis共同决定补丁so的新libPath

davilk和art下so文件加载的方式不一样, 导致了需要区分art和davilk做不同的处理. 实际上我们还有另外一个so补丁的方案, 这里暂时不对外透露 

更好的性能

* SOPatchManager.load(String libPath) ->代替  System.load(String pathName)
* SOPatchManager.loadLibrary(String libName) ->代替  System.loadLibrary(String libName)

我们知道一个so文件如果load两次那么本地内存的使用会变大. 所以我们提供了替代System加载so文件的方法, 我们建议所有的so文件加载都通过这个方法, 那么加载so文件的时候只会尝试去加载指定目录下去的补丁so, 而不会去加载安装apk中的so文件

阿里百川Hotfix2.X 资源文件修复方案

Android资源文件的特点

* 资源id编码于resources.arsc文件中,排布紧密。按照排布顺序进行自动编号
* res目录保存所有带id的资源文件。布局文件为二进制形式的xml文件,xml以资源id的方式引用其他资源
* assets目录存放所有原始文件,不带id
* aapt进行资源的构造,包括自动分配资源id与R文件的生成,默认情况下,每次编译不保证和之前包中的id一致

目前市面上普遍采用的三种方式。

* 差量合成完整的资源包,运行时完整加载资源。 缺点:合成资源占用时间和内存,容易引起卡顿。
* 修改aapt,对以后可能新增的资源提前留空,运行时patch包中新增资源id对应留出的位置。 缺点:需改变打包流程,修改代码并编译替换sdk中的aapt。打包侵入太强,且留空占用一定磁盘空间。留空多少是预先定好的,无法改变。
* 插件化,组件化资源。 缺点:资源需要划分模块,提前规划。杀鸡焉用牛刀?

一个优秀的资源热修复方案应该做到:

* 补丁包尽可能地小。加载补丁迅速,性能好,内存和时间消耗极小。
* 不改变打包流程,保持sdk工具链的完整性。
* 开发透明,开发者无感知。不需要事先固定资源id。
* 方便易用,傻瓜式操作。一键完成patch工作。

阿里百川资源热修复

* 直接基于新旧两个apk来构造补丁包,不需要改造aapt,对编译过程无要求。
* 精确比较各个资源id的使用情况,最大程度利用原先基线包资源,补丁包中只包含新增和修改的资源。
* 运行时无需合成操作,快速应用生效。不影响性能。
* 不仅仅是简单修复,对于任意程度、乃至天翻地覆的修改都能适用。只是补丁文件会比较大。
* 使用方便,只需要选取新旧两个apk,一键生成补丁。
* 兼容Android所有机型,稳定性好。
* 配合类修复方案, 我们能够做到资源修复的实时生效

需要注意的地方

* 如果事先自己做了资源混淆,需要保证新旧包混淆的关系保持一致,否则打补丁时会找不到原来基线包中资源,而将非新增资源视为新增资源,导致补丁包变大。
* 建议每次打包时设置去除无用的资源。这样即可以减小包大小,同时也保证补丁包中新增资源都是有用的。
* AndroidManifest中引用的资源无法改变。有些资源如icon是安装时固定的,目前所有补丁方案都无法进行改变。而另一些资源,如Theme,我们可以提取AndroidManifest中的资源信息,通过代码的方式进行设置。

阿里百川HotFix管理后台服务
  
* 补丁灰度发布/正式发布  
> 发布前可以通过本地/扫码两种方式验证之后再发布上线, 本地补丁模式是指补丁可以放到任何一个指定的目录下即可. 扫码模式是扫描二维码生成一个下载url, 然后直接下载这个时候不需要和服务器验证身份.  灰度发布指定具体的用户数然后随机推送

* 补丁回滚  
> 回滚到目标补丁版本, 所有该应用版本下的设备都会回滚到目标补丁的版本。

* 补丁安全
> 1. 平台托管RSA秘钥  2. 补丁加载安全签名校验

我们后续提供的服务

* 补丁自定义平台无关AES秘钥
> 更安全, 此时打补丁的时候用户可以填入自定义AES秘钥, 然后SDK初始化的时候填入这个秘钥即可. 我们阿里百川平台完全不知道你的秘钥, 所以你们的补丁在我们的后台是绝对安全的. 

* 补丁条件下发 
> 1. 分系统版本 比如一个bug只在android5.0上复现, 那么可能只想对android5.0下发补丁
> 2. 分渠道  比如只想对某个具体的渠道, 豌豆荚/小米不同的渠道进行分发 
> 3. 自定义TAG 上述几个是默认提供的条件, 当然我们提供了更加自由的方式, 你可以对任何一个补丁打tag, 然后客户端只能请求下载到后台指定tag的补丁.   

* 实时显示补丁加载成功率等数据
> 后续可能会上报补丁加载失败详情, 方便排查问题. 

* 一键清除补丁  
> 使用回滚功能必需要具备一下几个条件:1. 当前的版本已停止发布 2. 该版本之前存在至少一个历史版本 所以如果第一个补丁就下发错误的话, 补丁回滚就无能为力了, 所以我们提供一键清除补丁的功能。

好了,分享就到这里了,干货还是很多的,大家慢慢消化吧~~~
目录
相关文章
|
8天前
|
人工智能 前端开发 中间件
通义灵码上线一周年,与百万开发者同行,开启技术公开课
通义灵码产品经理、前端开发、后端开发带来的线上直播分享会,将和你一同回顾过去一年通义灵码产品的发展历程,带你深度感受通义灵码的使用技巧,展望未来的技术趋势。
|
机器学习/深度学习 算法 测试技术
蚂蚁集团开源代码大模型CodeFuse!(含魔搭体验和最佳实践)
蚂蚁集团在刚刚结束的2023外滩大会上开源了代码大模型CodeFuse,目前在魔搭社区可下载、体验。
|
人工智能 运维 Cloud Native
直播预告 | 阿里巴巴自研代码管理平台技术解密
4月23日16点,云效开发者交流群见!
872 0
直播预告 | 阿里巴巴自研代码管理平台技术解密
|
新零售 开发者
阿里巴巴小程序繁星计划 官方钉群正式上线
3月21日,在2019阿里云峰会·北京上,阿里巴巴旗下的阿里云、支付宝、淘宝、钉钉、高德等联合发布“阿里巴巴小程序繁星计划”:提供20亿元补贴,扶持200万+小程序开发者、100万+商家。凡入选“超星”的小程序,入驻支付宝、淘宝、钉钉、高德后还能得到流量重点支持。
7873 0
|
机器学习/深度学习 自然语言处理 算法
藏经阁计划发布一年,阿里知识引擎有哪些技术突破?
2018年4月阿里巴巴业务平台事业部——知识图谱团队联合清华大学、浙江大学、中科院自动化所、中科院软件所、苏州大学等五家机构,联合发布藏经阁(知识引擎)研究计划。
3755 0
|
域名解析 网络协议 调度
一文纵览EMAS 到底内含多少阿里核心技术能力
EMAS的整体定位是阿里巴巴移动技术对外输出的主窗口,沉淀了阿里巴巴近10年在移动互联网技术架构上的积累以及在一系列垂直场景中所实践的核心技术能力。一方面,EMAS希望为广大开发者提供安全、稳定、快速、弹性的移动应用基础设施,另一方面也希望帮助广大中小企业、初创团队以及处于“互联网+”转型阶段的传统企业构建工程化、系统化、智能化的企业级移动互联网研发体系,并将近十年来阿里巴巴在移动互联网总结和沉淀的一系列方法论分享给业界。
4564 0
|
安全 AndFix 测试技术
阿里HotFix2.0升级详解——技术运营小二畅谈热修复领域那些事
热修复领域充斥着各大流派,如阿里AndFix、美团Robust、微信Tinker等,每种方法各有优劣。本文介绍的百川Hotfix 2.x是在1.x版本进行了优化和创新,不仅支持灵活切换热部署和冷部署的方案;实现了资源、SO文件、类修复的实时生效;接入时不侵入打包过程,并为用户提供了可视化的UI界面。
10048 3
|
Kubernetes Cloud Native 前端开发
|
Devops 容器 开发框架
【0601 - 0605 直播导视 | PPT 下载】阿里巴巴内部研发效能峰会首次对外直播预热来啦!
本周开发者社区将为大家了多场技术直播,并且6月12日—13日阿里巴巴内部研发效能峰会首次对外直播预热来啦!快来预约吧!
653 0