對 ART 垃圾收集進行偵錯

本頁面說明如何對 Android 執行階段 (ART) 垃圾收集進行偵錯 (GC) 正確性和效能問題。說明如何使用 GC 驗證功能 找出 GC 驗證失敗的解決方案,並 才能解決 GC 效能問題

如要使用 ART,請參閱 ART 和 Dalvik 的頁面 和 Dalvik 執行檔格式。 如需有關驗證應用程式行為的其他說明,請參閱 驗證中 Android 執行階段 (ART) 的應用程式行為。

ART GC 總覽

ART 有幾種不同的 GC 方案,包括執行不同垃圾 收集器。自 Android 8 (Oreo) 起,預設方案為同時複製 (CC)。 另一項 GC 方案是 Concurrent Mark Sweep (CMS)。

並行複製 GC 的主要特色如下:

  • CC 可讓您使用名為 RegionTLAB 的串場廣告指標配置器。這會分配執行緒本機 每個應用程式執行緒的配置緩衝區 (TLAB),類別可以從其 TLAB 中分配物件 提高「頂部」指標,不含任何同步處理。
  • CC 會在不暫停應用程式執行緒的情況下同時複製物件,執行堆積重組。 在這項機制的協助下,讀取器會攔截讀取器中的參照讀取作業 堆積,不需要應用程式開發人員任何介入。
  • GC 只有一次小幅暫停,這在堆積大小方面維持不變。
  • CC 已延伸為 Android 10 以上版本的 GC。還能用來收集 年輕的物體,而且這類物件往往很快就會變得難以存取。這有助於 會增加 GC 處理量,並大幅延遲執行完整堆積 GC 所需的工作。

ART 仍支援的其他 GC 是 CMS。這個 GC 也支援壓縮,但不支援並行。應用程式會避免壓縮 進入背景,屆時應用程式執行緒會暫停執行,以執行壓縮。 當物件配置因分段而失敗時,也會需要壓縮。在本 應用程式可能會出現一段時間沒有回應的情況

由於 CMS 很少壓縮,因此免費物件可能不太連續 免費清單式配置器 RosAlloc。這種預算的分配成本比 RegionTLAB。最後,由於內部分段 Java 堆積的記憶體用量 可能是 CMS 的 70% 以上

GC 驗證和效能選項

變更 GC 類型

原始設備製造商 (OEM) 可變更 GC 類型。變更程序 需要在建構期間設定 ART_USE_READ_BARRIER 環境變數。 預設值為 true,因此會在 CC 收集器使用讀取屏障時啟用。針對 CMS 變數必須明確設為 false

根據預設,CC 收集器會在 Android 10 以上版本的代別模式下執行。目的地: 停用生成模式,-Xgc:nogenerational_cc 指令列引數可以是 或者,可以按照以下方式設定系統屬性:

adb shell setprop dalvik.vm.gctype nogenerational_cc
CMS 收集器一律會在產生模式下執行。

驗證堆積

堆積驗證可能是最實用的 GC 偵錯選項 GC 相關錯誤或堆積毀損。啟用堆積驗證功能會導致 GC 檢查垃圾作業期間各時間點的堆積是否正確 收集程序。堆積驗證的選項與 變更 GC 類型如果啟用,堆積驗證會驗證根憑證 確保可連線的物件只會參照其他可連線的物件。總承包商 傳遞以下 -Xgc 值,即可啟用驗證功能:

  • 如果啟用,[no]preverify 會先執行堆積驗證,再啟動 GC。
  • 如果啟用,[no]presweepingverify 會執行堆積驗證 再啟動垃圾收集器清除程序
  • 啟用後,[no]postverify 會在以下時間執行堆積驗證 清理工作後
  • [no]preverify_rosalloc[no]postsweepingverify_rosalloc[no]postverify_rosalloc 是其他 GC 選項 只有 RosAlloc 內部會計狀況因此,它們只適用於 CMS 收集器,這項工具使用 RosAlloc 分配器。驗證的主要內容為 魔法值符合預期常數和 記憶體的可用區塊 已登錄於 free_page_runs_ 地圖。

成效

評估 GC 成效的主要工具有兩種:GC 時間 傾印和 Systrace另有一個名為 Perfetto 的進階版 Systrace。 評估 GC 效能問題的視覺化方式 是使用 Systrace 和 Perfetto 找出哪些 GC 導致長時間暫停 先佔應用程式執行緒。雖然 ART GC 隨時間大幅改善,但不良的變動器 也可能引發效能問題

收集策略

CC GC 是透過執行年輕 GC 或全堆積 GC 收集而來。最好是年輕的 GC 執行頻率越高GC 會進行較年輕的 CC 資料收集作業,直到輸送量 (以位元組計算) 剛完成的資料收集週期的釋出/秒) 低於平均處理量 完整堆積 CC 集合的數量發生這種情形時,系統會為 而非採用年輕的 CC。完整堆積集合完成後, GC 已切換回較低的 CC。這項策略奏效的關鍵因素之一是年輕的輔助轉換率 不會在記憶體用量限制後調整用量限制。這會導致年輕的 CC 發生越來越多 並增加頻率直到處理量低於全堆積 CC ,導致堆積增加

使用 SIGQUIT 取得 GC 效能資訊

如要取得應用程式 GC 效能時間,請將 SIGQUIT 傳送至 已在執行中的應用程式,或傳入 -XX:DumpGCPerformanceOnShutdown 變更為 dalvikvm。當應用程式取得 ANR 要求信號 (SIGQUIT) 會轉儲與鎖定相關的資訊 執行緒堆疊和 GC 效能

如要取得 GC 時間傾印,請使用:

adb shell kill -s QUIT PID

這會建立一個檔案 (檔名中的日期和時間為 ar_2020-07-13-19-23-39-817) 在「/data/anr/」中。這個 檔案包含一些 ANR 傾印和 GC 時間碼。您可以在 搜尋「Duming accing Gc times」(減少 GC 累計時間) 的時間,即可判定 GC 時間。這些時機 顯示一些使用者可能感興趣的資訊 包括 每個 GC 類型的階段和暫停停頓點通常比較重要 。例如:

young concurrent copying paused:	Sum: 5.491ms 99% C.I. 1.464ms-2.133ms Avg: 1.830ms Max: 2.133ms

這表示平均暫停時間是 1.83 毫秒,應該低到足夠的值 不會導致多數應用程式出現遺漏的影格,無需為此擔心。

另一個重點領域是暫停「時間」 在 GC 要求送出的 GC 要求之後 就會暫停運作這個時間包含在 GC 暫停中,因此非常實用 判斷長時間暫停是由於垃圾收集速度緩慢還是執行緒所致 慢速暫停中以下是正常暫停時間的範例 使用 Nexus 5:

suspend all histogram:	Sum: 1.513ms 99% C.I. 3us-546.560us Avg: 47.281us Max: 601us

其他感興趣的領域,包括總花費時間和 GC 處理量例如:

Total time spent in GC: 502.251ms
Mean GC size throughput: 92MB/s
Mean GC object throughput: 1.54702e+06 objects/s

以下範例說明如何轉儲已執行中應用程式的 GC 時間:

adb shell kill -s QUIT PID
adb pull /data/anr/anr_2020-07-13-19-23-39-817

目前,GC 時間位於 anr_2020-07-13-19-23-39-817。輸出內容範例如下 來自 Google 地圖:

Start Dumping histograms for 2195 iterations for concurrent copying
MarkingPhase:   Sum: 258.127s 99% C.I. 58.854ms-352.575ms Avg: 117.651ms Max: 641.940ms
ScanCardsForSpace:      Sum: 85.966s 99% C.I. 15.121ms-112.080ms Avg: 39.164ms Max: 662.555ms
ScanImmuneSpaces:       Sum: 79.066s 99% C.I. 7.614ms-57.658ms Avg: 18.014ms Max: 546.276ms
ProcessMarkStack:       Sum: 49.308s 99% C.I. 6.439ms-81.640ms Avg: 22.464ms Max: 638.448ms
ClearFromSpace: Sum: 35.068s 99% C.I. 6.522ms-40.040ms Avg: 15.976ms Max: 633.665ms
SweepSystemWeaks:       Sum: 14.209s 99% C.I. 3.224ms-15.210ms Avg: 6.473ms Max: 201.738ms
CaptureThreadRootsForMarking:   Sum: 11.067s 99% C.I. 0.835ms-13.902ms Avg: 5.044ms Max: 25.565ms
VisitConcurrentRoots:   Sum: 8.588s 99% C.I. 1.260ms-8.547ms Avg: 1.956ms Max: 231.593ms
ProcessReferences:      Sum: 7.868s 99% C.I. 0.002ms-8.336ms Avg: 1.792ms Max: 17.376ms
EnqueueFinalizerReferences:     Sum: 3.976s 99% C.I. 0.691ms-8.005ms Avg: 1.811ms Max: 16.540ms
GrayAllDirtyImmuneObjects:      Sum: 3.721s 99% C.I. 0.622ms-6.702ms Avg: 1.695ms Max: 14.893ms
SweepLargeObjects:      Sum: 3.202s 99% C.I. 0.032ms-6.388ms Avg: 1.458ms Max: 549.851ms
FlipOtherThreads:       Sum: 2.265s 99% C.I. 0.487ms-3.702ms Avg: 1.031ms Max: 6.327ms
VisitNonThreadRoots:    Sum: 1.883s 99% C.I. 45us-3207.333us Avg: 429.210us Max: 27524us
InitializePhase:        Sum: 1.624s 99% C.I. 231.171us-2751.250us Avg: 740.220us Max: 6961us
ForwardSoftReferences:  Sum: 1.071s 99% C.I. 215.113us-2175.625us Avg: 488.362us Max: 7441us
ReclaimPhase:   Sum: 490.854ms 99% C.I. 32.029us-6373.807us Avg: 223.623us Max: 362851us
EmptyRBMarkBitStack:    Sum: 479.736ms 99% C.I. 11us-3202.500us Avg: 218.558us Max: 13652us
CopyingPhase:   Sum: 399.163ms 99% C.I. 24us-4602.500us Avg: 181.851us Max: 22865us
ThreadListFlip: Sum: 295.609ms 99% C.I. 15us-2134.999us Avg: 134.673us Max: 13578us
ResumeRunnableThreads:  Sum: 238.329ms 99% C.I. 5us-2351.250us Avg: 108.578us Max: 10539us
ResumeOtherThreads:     Sum: 207.915ms 99% C.I. 1.072us-3602.499us Avg: 94.722us Max: 14179us
RecordFree:     Sum: 188.009ms 99% C.I. 64us-312.812us Avg: 85.653us Max: 2709us
MarkZygoteLargeObjects: Sum: 133.301ms 99% C.I. 12us-734.999us Avg: 60.729us Max: 10169us
MarkStackAsLive:        Sum: 127.554ms 99% C.I. 13us-417.083us Avg: 58.111us Max: 1728us
FlipThreadRoots:        Sum: 126.119ms 99% C.I. 1.028us-3202.499us Avg: 57.457us Max: 11412us
SweepAllocSpace:        Sum: 117.761ms 99% C.I. 24us-400.624us Avg: 53.649us Max: 1541us
SwapBitmaps:    Sum: 56.301ms 99% C.I. 10us-125.312us Avg: 25.649us Max: 1475us
(Paused)GrayAllNewlyDirtyImmuneObjects: Sum: 33.047ms 99% C.I. 9us-49.931us Avg: 15.055us Max: 72us
(Paused)SetFromSpace:   Sum: 11.651ms 99% C.I. 2us-49.772us Avg: 5.307us Max: 71us
(Paused)FlipCallback:   Sum: 7.693ms 99% C.I. 2us-32us Avg: 3.504us Max: 32us
(Paused)ClearCards:     Sum: 6.371ms 99% C.I. 250ns-49753ns Avg: 207ns Max: 188000ns
Sweep:  Sum: 5.793ms 99% C.I. 1us-49.818us Avg: 2.639us Max: 93us
UnBindBitmaps:  Sum: 5.255ms 99% C.I. 1us-31us Avg: 2.394us Max: 31us
Done Dumping histograms
concurrent copying paused:      Sum: 315.249ms 99% C.I. 49us-1378.125us Avg: 143.621us Max: 7722us
concurrent copying freed-bytes: Avg: 34MB Max: 54MB Min: 2062KB
Freed-bytes histogram: 0:4,5120:5,10240:19,15360:69,20480:167,25600:364,30720:529,35840:405,40960:284,46080:311,51200:38
concurrent copying total time: 569.947s mean time: 259.657ms
concurrent copying freed: 1453160493 objects with total size 74GB
concurrent copying throughput: 2.54964e+06/s / 134MB/s  per cpu-time: 157655668/s / 150MB/s
Average major GC reclaim bytes ratio 0.486928 over 2195 GC cycles
Average major GC copied live bytes ratio 0.0894662 over 2199 major GCs
Cumulative bytes moved 6586367960
Cumulative objects moved 127490240
Peak regions allocated 376 (94MB) / 2048 (512MB)
Start Dumping histograms for 685 iterations for young concurrent copying
ScanCardsForSpace:      Sum: 26.288s 99% C.I. 8.617ms-77.759ms Avg: 38.377ms Max: 432.991ms
ProcessMarkStack:       Sum: 21.829s 99% C.I. 2.116ms-71.119ms Avg: 31.868ms Max: 98.679ms
ClearFromSpace: Sum: 19.420s 99% C.I. 5.480ms-50.293ms Avg: 28.351ms Max: 507.330ms
ScanImmuneSpaces:       Sum: 9.968s 99% C.I. 8.155ms-30.639ms Avg: 14.552ms Max: 46.676ms
SweepSystemWeaks:       Sum: 6.741s 99% C.I. 3.655ms-14.715ms Avg: 9.841ms Max: 22.142ms
GrayAllDirtyImmuneObjects:      Sum: 4.466s 99% C.I. 0.584ms-14.315ms Avg: 6.519ms Max: 24.355ms
FlipOtherThreads:       Sum: 3.672s 99% C.I. 0.631ms-16.630ms Avg: 5.361ms Max: 18.513ms
ProcessReferences:      Sum: 2.806s 99% C.I. 0.001ms-9.459ms Avg: 2.048ms Max: 11.951ms
EnqueueFinalizerReferences:     Sum: 1.857s 99% C.I. 0.424ms-8.609ms Avg: 2.711ms Max: 24.063ms
VisitConcurrentRoots:   Sum: 1.094s 99% C.I. 1.306ms-5.357ms Avg: 1.598ms Max: 6.831ms
SweepArray:     Sum: 711.032ms 99% C.I. 0.022ms-3.502ms Avg: 1.038ms Max: 7.307ms
InitializePhase:        Sum: 667.346ms 99% C.I. 303us-2643.749us Avg: 974.227us Max: 3199us
VisitNonThreadRoots:    Sum: 388.145ms 99% C.I. 103.911us-1385.833us Avg: 566.635us Max: 5374us
ThreadListFlip: Sum: 202.730ms 99% C.I. 18us-2414.999us Avg: 295.956us Max: 6780us
EmptyRBMarkBitStack:    Sum: 132.934ms 99% C.I. 8us-1757.499us Avg: 194.064us Max: 8495us
ResumeRunnableThreads:  Sum: 109.593ms 99% C.I. 6us-4719.999us Avg: 159.989us Max: 11106us
ResumeOtherThreads:     Sum: 86.733ms 99% C.I. 3us-4114.999us Avg: 126.617us Max: 19332us
ForwardSoftReferences:  Sum: 69.686ms 99% C.I. 14us-2014.999us Avg: 101.731us Max: 4723us
RecordFree:     Sum: 58.889ms 99% C.I. 0.500us-185.833us Avg: 42.984us Max: 769us
FlipThreadRoots:        Sum: 58.540ms 99% C.I. 1.034us-4314.999us Avg: 85.459us Max: 10224us
CopyingPhase:   Sum: 52.227ms 99% C.I. 26us-728.749us Avg: 76.243us Max: 2060us
ReclaimPhase:   Sum: 37.207ms 99% C.I. 7us-2322.499us Avg: 54.316us Max: 3826us
(Paused)GrayAllNewlyDirtyImmuneObjects: Sum: 23.859ms 99% C.I. 11us-98.917us Avg: 34.830us Max: 128us
FreeList:       Sum: 20.376ms 99% C.I. 2us-188.875us Avg: 29.573us Max: 998us
MarkZygoteLargeObjects: Sum: 18.970ms 99% C.I. 4us-115.749us Avg: 27.693us Max: 122us
(Paused)SetFromSpace:   Sum: 12.331ms 99% C.I. 3us-94.226us Avg: 18.001us Max: 109us
SwapBitmaps:    Sum: 11.761ms 99% C.I. 5us-49.968us Avg: 17.169us Max: 67us
ResetStack:     Sum: 4.317ms 99% C.I. 1us-64.374us Avg: 6.302us Max: 190us
UnBindBitmaps:  Sum: 3.803ms 99% C.I. 4us-49.822us Avg: 5.551us Max: 70us
(Paused)ClearCards:     Sum: 3.336ms 99% C.I. 250ns-7000ns Avg: 347ns Max: 7000ns
(Paused)FlipCallback:   Sum: 3.082ms 99% C.I. 1us-30us Avg: 4.499us Max: 30us
Done Dumping histograms
young concurrent copying paused:        Sum: 229.314ms 99% C.I. 37us-2287.499us Avg: 334.764us Max: 6850us
young concurrent copying freed-bytes: Avg: 44MB Max: 50MB Min: 9132KB
Freed-bytes histogram: 5120:1,15360:1,20480:6,25600:1,30720:1,35840:9,40960:235,46080:427,51200:4
young concurrent copying total time: 100.823s mean time: 147.187ms
young concurrent copying freed: 519927309 objects with total size 30GB
young concurrent copying throughput: 5.15683e+06/s / 304MB/s  per cpu-time: 333152554/s / 317MB/s
Average minor GC reclaim bytes ratio 0.52381 over 685 GC cycles
Average minor GC copied live bytes ratio 0.0512109 over 685 minor GCs
Cumulative bytes moved 1542000944
Cumulative objects moved 28393168
Peak regions allocated 376 (94MB) / 2048 (512MB)
Total time spent in GC: 670.771s
Mean GC size throughput: 159MB/s per cpu-time: 177MB/s
Mean GC object throughput: 2.94152e+06 objects/s
Total number of allocations 1974199562
Total bytes allocated 104GB
Total bytes freed 104GB
Free memory 10MB
Free memory until GC 10MB
Free memory until OOME 442MB
Total memory 80MB
Max memory 512MB
Zygote space size 2780KB
Total mutator paused time: 544.563ms
Total time waiting for GC to complete: 117.494ms
Total GC count: 2880
Total GC time: 670.771s
Total blocking GC count: 1
Total blocking GC time: 86.373ms
Histogram of GC count per 10000 ms: 0:259879,1:2828,2:24,3:1
Histogram of blocking GC count per 10000 ms: 0:262731,1:1
Native bytes total: 30599192 registered: 8947416
Total native bytes at last GC: 30344912

用於分析 GC 正確性問題的分析工具

多種原因都可能導致 ART 發生當機。造成當機的 讀取或寫入物件欄位可能表示堆積損毀。如果 GC 在執行期間異常終止,也可能代表堆積損毀。 堆積損毀最常見的原因就是應用程式程式碼有誤。幸好,你可以使用這些工具 偵錯 GC 和堆積相關當機問題,包括指定的堆積驗證選項 以及 CheckJNI

檢查 JNI

CheckJNI 模式可新增 JNI 檢查,以驗證應用程式行為。不屬於 。檢查功能會找出幾個可能導致堆積損毀的錯誤。 ,例如使用無效/過時的本機和全域參照。如何啟用 CheckJNI:

adb shell setprop dalvik.vm.checkjni true

CheckJNI 的強制複製模式很適合用來偵測 寫入範圍超過陣列區域的結尾。啟用時,強制複製會引發陣列 存取 JNI 函式,以傳回含有紅色區域的副本。紅色的 區域是傳回指標終點/開始位置的區域, 特殊值,會在陣列釋出時驗證。如果 與預期不符,紅色區間就會發生緩衝區超過預期的情況 或未發生記憶體不足的情況這會導致 CheckJNI 取消。啟用方式 強制複製模式:

adb shell setprop dalvik.vm.jniopts forcecopy

CheckJNI 應該擷取的錯誤示例,就是寫入結尾之後 從 GetPrimitiveArrayCritical 取得的陣列。這項作業 是否會損毀 Java 堆積。如果寫入 更新時,CheckJNI 會在 系統會呼叫相對應的 ReleasePrimitiveArrayCritical否則 寫入作業會在 並可能導致日後的 GC 當機。如果記憶體毀損 為參照欄位,則 GC 可能會擷取錯誤,並輸出「Tevered to」(收件人) 標示 <ptr>未包含在任何空格中

當 GC 嘗試將物件標示為無法標記時,就會發生這個錯誤 尋找聊天室。檢查失敗後,GC 會掃遍根目錄並嘗試 看看無效物件是否為根目錄。接著,您有兩個選項: 物件為根或非根物件。

根範例無效

如果物件為無效的根,就會 實用資訊: art E 5955 5955 art/runtime/gc/collector/mark_sweep.cc:383] Tried to mark 0x2 not contained by any spaces

art E  5955  5955 art/runtime/gc/collector/mark_sweep.cc:384] Attempting see if
it's a bad root
art E  5955  5955 art/runtime/gc/collector/mark_sweep.cc:485] Found invalid
root: 0x2
art E  5955  5955 art/runtime/gc/collector/mark_sweep.cc:486]
Type=RootJavaFrame thread_id=1 location=Visiting method 'java.lang.Object
com.google.gwt.collections.JavaReadableJsArray.get(int)' at dex PC 0x0002
(native PC 0xf19609d9) vreg=1

在本例中,vreg=1 位於 com.google.gwt.collections.JavaReadableJsArray.get 為 應該包含堆積參照,但包含無效的指標 (地址為 0x2)。根號無效。目的地: 偵錯這個問題,請在 Oat 檔案上使用 oatdump,然後 傳送至含有無效根目錄的方法在此例中,錯誤已變成 會是 x86 後端中的編譯器錯誤以下是已修正的變更清單:https://android-review.googlesource.com/#/c/133932/

毀損的物件示例

如果物件並非根目錄,輸出如下所示: 沖印相片:

01-15 12:38:00.196  1217  1238 E art     : Attempting see if it's a bad root
01-15 12:38:00.196  1217  1238 F art     :
art/runtime/gc/collector/mark_sweep.cc:381] Can't mark invalid object

當堆積毀損不是無效的根層級時,就很難進行偵錯。 這則錯誤訊息表示堆積中至少有一個物件 目前指向無效物件的目標物件數量