Android熱修復原理(一)熱修復框架對比和代碼修復

相關(guān)文章
解析ClassLoader系列

前言

在Android應(yīng)用開發(fā)中,熱修復技術(shù)被越來越多的開發(fā)者所使用,也出現(xiàn)了很多熱修復框架,比如:AndFix、Tinker、Dexposed和Nuwa等等。如果只是會這些熱修復框架的使用那意義并不大,我們還需要了解它們的原理,這樣不管熱修復框架如何變化,只要基本原理不變,我們就可以很快的掌握它們。這一個系列不會對某些熱修復框架源碼進行解析,而是講解熱修復框架的通用原理。

1.熱修復的產(chǎn)生概述

在開發(fā)中我們會遇到如下的情況:

  1. 剛發(fā)布的版本出現(xiàn)了嚴重的bug,這就需要去解決bug、測試并打渠道包在各個應(yīng)用市場上重新發(fā)布,這會耗費大量的人力物力,代價會比較大。
  2. 已經(jīng)改正了此前發(fā)布版本的bug,如果下一個版本是一個大版本,那么兩個版本的間隔時間會很長,這樣要等到下個大版本發(fā)布再修復bug,這樣此前版本的bug會長期的影響用戶。
  3. 版本升級率不高,并且需要很長時間來完成版本覆蓋,此前版本的bug就會一直影響不升級版本的用戶。
  4. 有一個小而重要的功能,需要短時間內(nèi)完成版本覆蓋,比如節(jié)日活動。

為了解決上面的問題,熱修復框架就產(chǎn)生了。對于Bug的處理,開發(fā)人員不要過于依賴熱修復框架,在開發(fā)的過程中還是要按照標準的流程做好自測、配合測試人員完成測試流程。

2.熱修復框架的對比

熱修復框架的種類繁多,按照公司團隊劃分主要有以下幾種:

類別 成員
阿里系 AndFix、Dexposed、阿里百川、Sophix
騰訊系 微信的Tinker、QQ空間的超級補丁、手機QQ的QFix
知名公司 美團的Robust、餓了么的Amigo、美麗說蘑菇街的Aceso
其他 RocooFix、Nuwa、AnoleFix

雖然熱修復框架很多,但熱修復框架的核心技術(shù)主要有三類,分別是代碼修復、資源修復和動態(tài)鏈接庫修復,其中每個核心技術(shù)又有很多不同的技術(shù)方案,每個技術(shù)方案又有不同的實現(xiàn),另外這些熱修復框架仍在不斷的更新迭代中,可見熱修復框架的技術(shù)實現(xiàn)是繁多可變的。作為開發(fā)需需要了解這些技術(shù)方案的基本原理,這樣就可以以不變應(yīng)萬變。

部分熱修復框架的對比如下表所示。

特性 AndFix Tinker/Amigo QQ空間 Robust/Aceso
即時生效
方法替換
類替換
類結(jié)構(gòu)修改
資源替換
so替換
支持gradle
支持ART
支持Android7.0

我們可以根據(jù)上表和具體業(yè)務(wù)來選擇合適的熱修復框架,當然上表的信息很難做到完全準確,因為部分的熱修復框架還在不斷更新迭代。
從表中也可以發(fā)現(xiàn)Tinker和Amigo擁有的特性最多,是不是就選它們呢?也不盡然,擁有的特性多也意味著框架的代碼量龐大,我們需要根據(jù)業(yè)務(wù)來選擇最合適的,假設(shè)我們只是要用到方法替換,那么使用Tinker和Amigo顯然是大材小用了。另外如果項目需要即時生效,那么使用Tinker和Amigo是無法滿足需求的。對于即時生效,AndFix、Robust和Aceso都滿足這一點,這是因為AndFix的代碼修復采用了底層替換方案,而Robust和Aceso的代碼修復借鑒了Instant Run原理,現(xiàn)在我們就來學習代碼修復。

3.代碼修復

代碼修復主要有三個方案,分別是底層替換方案、類加載方案和Instant Run方案。

3.1 類加載方案

類加載方案基于Dex分包方案,什么是Dex分包方案呢?這個得先從65536限制和LinearAlloc限制說起。
65536限制
隨著應(yīng)用功能越來越復雜,代碼量不斷地增大,引入的庫也越來越多,可能會在編譯時提示如下異常:

com.android.dex.DexIndexOverflowException: method ID not in [0, 0xffff]: 65536

這說明應(yīng)用中引用的方法數(shù)超過了最大數(shù)65536個。產(chǎn)生這一問題的原因就是系統(tǒng)的65536限制,65536限制的主要原因是DVM Bytecode的限制,DVM指令集的方法調(diào)用指令invoke-kind索引為16bits,最多能引用 65535個方法。
LinearAlloc限制
在安裝時可能會提示INSTALL_FAILED_DEXOPT。產(chǎn)生的原因就是LinearAlloc限制,DVM中的LinearAlloc是一個固定的緩存區(qū),當方法數(shù)過多超出了緩存區(qū)的大小時會報錯。

為了解決65536限制和LinearAlloc限制,從而產(chǎn)生了Dex分包方案。Dex分包方案主要做的是在打包時將應(yīng)用代碼分成多個Dex,將應(yīng)用啟動時必須用到的類和這些類的直接引用類放到主Dex中,其他代碼放到次Dex中。當應(yīng)用啟動時先加載主Dex,等到應(yīng)用啟動后再動態(tài)的加載次Dex,從而緩解了主Dex的65536限制和LinearAlloc限制。

Dex分包方案主要有兩種,分別是Google官方方案、Dex自動拆包和動態(tài)加載方案。因為Dex分包方案不是本章的重點,這里就不再過多的介紹,我們接著來學習類加載方案。
Android解析ClassLoader(二)Android中的ClassLoader中講到了ClassLoader的加載過程,其中一個環(huán)節(jié)就是調(diào)用DexPathList的findClass的方法,如下所示。
libcore/dalvik/src/main/java/dalvik/system/DexPathList.java

 public Class<?> findClass(String name, List<Throwable> suppressed) {
        for (Element element : dexElements) {//1
            Class<?> clazz = element.findClass(name, definingContext, suppressed);//2
            if (clazz != null) {
                return clazz;
            }
        }
        if (dexElementsSuppressedExceptions != null) {
            suppressed.addAll(Arrays.asList(dexElementsSuppressedExceptions));
        }
        return null;
    }

Element內(nèi)部封裝了DexFile,DexFile用于加載dex文件,因此每個dex文件對應(yīng)一個Element。
多個Element組成了有序的Element數(shù)組dexElements。當要查找類時,會在注釋1處遍歷Element數(shù)組dexElements(相當于遍歷dex文件數(shù)組),注釋2處調(diào)用Element的findClass方法,其方法內(nèi)部會調(diào)用DexFile的loadClassBinaryName方法查找類。如果在Element中(dex文件)找到了該類就返回,如果沒有找到就接著在下一個Element中進行查找。
根據(jù)上面的查找流程,我們將有bug的類Key.class進行修改,再將Key.class打包成包含dex的補丁包Patch.jar,放在Element數(shù)組dexElements的第一個元素,這樣會首先找到Patch.dex中的Key.class去替換之前存在bug的Key.class,排在數(shù)組后面的dex文件中的存在bug的Key.class根據(jù)ClassLoader的雙親委托模式就不會被加載,這就是類加載方案,如下圖所示。


類加載方案需要重啟App后讓ClassLoader重新加載新的類,為什么需要重啟呢?這是因為類是無法被卸載的,因此要想重新加載新的類就需要重啟App,因此采用類加載方案的熱修復框架是不能即時生效的。
雖然很多熱修復框架采用了類加載方案,但具體的實現(xiàn)細節(jié)和步驟還是有一些區(qū)別的,比如QQ空間的超級補丁和Nuwa是按照上面說得將補丁包放在Element數(shù)組的第一個元素得到優(yōu)先加載。微信Tinker將新舊apk做了diff,得到patch.dex,然后將patch.dex與手機中apk的classes.dex做合并,生成新的classes.dex,然后在運行時通過反射將classes.dex放在Element數(shù)組的第一個元素。餓了么的Amigo則是將補丁包中每個dex 對應(yīng)的Element取出來,之后組成新的Element數(shù)組,在運行時通過反射用新的Element數(shù)組替換掉現(xiàn)有的Element 數(shù)組。

采用類加載方案的主要是以騰訊系為主,包括微信的Tinker、QQ空間的超級補丁、手機QQ的QFix、餓了么的Amigo和Nuwa等等。

3.2 底層替換方案

與類加載方案不同的是,底層替換方案不會再次加載新類,而是直接在Native層修改原有類,由于是在原有類進行修改限制會比較多,不能夠增減原有類的方法和字段,如果我們增加了方法數(shù),那么方法索引數(shù)也會增加,這樣訪問方法時會無法通過索引找到正確的方法,同樣的字段也是類似的情況。
底層替換方案和反射的原理有些關(guān)聯(lián),就拿方法替換來說,方法反射我們可以調(diào)用java.lang.Class.getDeclaredMethod,假設(shè)我們要反射Key的show方法,會調(diào)用如下所示。

   Key.class.getDeclaredMethod("show").invoke(Key.class.newInstance());

Android 8.0的invoke方法,如下所示。
libcore/ojluni/src/main/java/java/lang/reflect/Method.java

    @FastNative
    public native Object invoke(Object obj, Object... args)
            throws IllegalAccessException, IllegalArgumentException, InvocationTargetException;

invoke方法是個native方法,對應(yīng)Jni層的代碼為:
art/runtime/native/java_lang_reflect_Method.cc

static jobject Method_invoke(JNIEnv* env, jobject javaMethod, jobject javaReceiver,
                             jobject javaArgs) {
  ScopedFastNativeObjectAccess soa(env);
  return InvokeMethod(soa, javaMethod, javaReceiver, javaArgs);

Method_invoke函數(shù)中又調(diào)用了InvokeMethod函數(shù):
art/runtime/reflection.cc

jobject InvokeMethod(const ScopedObjectAccessAlreadyRunnable& soa, jobject javaMethod,
                     jobject javaReceiver, jobject javaArgs, size_t num_frames) {

...
  ObjPtr<mirror::Executable> executable = soa.Decode<mirror::Executable>(javaMethod);
  const bool accessible = executable->IsAccessible();
  ArtMethod* m = executable->GetArtMethod();//1
...
}

注釋1處獲取傳入的javaMethod(Key的show方法)在ART虛擬機中對應(yīng)的一個ArtMethod指針,ArtMethod結(jié)構(gòu)體中包含了Java方法的所有信息,包括執(zhí)行入口、訪問權(quán)限、所屬類和代碼執(zhí)行地址等等,ArtMethod結(jié)構(gòu)如下所示。
art/runtime/art_method.h

class ArtMethod FINAL {
...
 protected:
  GcRoot<mirror::Class> declaring_class_;
  std::atomic<std::uint32_t> access_flags_;
  uint32_t dex_code_item_offset_;
  uint32_t dex_method_index_;
  uint16_t method_index_;
  uint16_t hotness_count_;
 struct PtrSizedFields {
    ArtMethod** dex_cache_resolved_methods_;//1
    void* data_;
    void* entry_point_from_quick_compiled_code_;//2
  } ptr_sized_fields_;
}

ArtMethod結(jié)構(gòu)中比較重要的字段是注釋1處的dex_cache_resolved_methods_和注釋2處的entry_point_from_quick_compiled_code_,它們是方法的執(zhí)行入口,當我們調(diào)用某一個方法時(比如Key的show方法),就會取得show方法的執(zhí)行入口,通過執(zhí)行入口就可以跳過去執(zhí)行show方法。
替換ArtMethod結(jié)構(gòu)體中的字段或者替換整個ArtMethod結(jié)構(gòu)體,這就是底層替換方案。
AndFix采用的是替換ArtMethod結(jié)構(gòu)體中的字段,這樣會有兼容問題,因為廠商可能會修改ArtMethod結(jié)構(gòu)體,導致方法替換失敗。Sophix采用的是替換整個ArtMethod結(jié)構(gòu)體,這樣不會存在兼容問題。
底層替換方案直接替換了方法,可以立即生效不需要重啟。采用底層替換方案主要是阿里系為主,包括AndFix、Dexposed、阿里百川、Sophix。

3.3 Instant Run方案

除了資源修復,代碼修復同樣也可以借鑒Instant Run的原理, 可以說Instant Run的出現(xiàn)推動了熱修復框架的發(fā)展。
Instant Run在第一次構(gòu)建apk時,使用ASM在每一個方法中注入了類似如下的代碼:

IncrementalChange localIncrementalChange = $change;//1
        if (localIncrementalChange != null) {//2
            localIncrementalChange.access$dispatch(
                    "onCreate.(Landroid/os/Bundle;)V", new Object[] { this,
                            paramBundle });
            return;
        }

其中注釋1處是一個成員變量localIncrementalChange ,它的值為$change,$change實現(xiàn)了IncrementalChange這個抽象接口。當我們點擊InstantRun時,如果方法沒有變化則$change為null,就調(diào)用return,不做任何處理。如果方法有變化,就生成替換類,這里我們假設(shè)MainActivity的onCreate方法做了修改,就會生成替換類MainActivity$override,這個類實現(xiàn)了IncrementalChange接口,同時也會生成一個AppPatchesLoaderImpl類,這個類的getPatchedClasses方法會返回被修改的類的列表(里面包含了MainActivity),根據(jù)列表會將MainActivity的$change設(shè)置為MainActivity$override,因此滿足了注釋2的條件,會執(zhí)行MainActivity$overrideaccess$dispatch方法,access$dispatch方法中會根據(jù)參數(shù)"onCreate.(Landroid/os/Bundle;)V"執(zhí)行MainActivity$override的onCreate方法,從而實現(xiàn)了onCreate方法的修改。
借鑒Instant Run的原理的熱修復框架有Robust和Aceso。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容