閱讀錯誤報告

錯誤在任何類型的開發中都是現實——錯誤報告對於識別和解決問題至關重要。所有版本的 Android 都支持使用Android Debug Bridge (adb)捕獲錯誤報告; Android 4.2 及更高版本支持開發者選項,用於獲取錯誤報告並通過電子郵件、雲端硬盤等進行共享。

Android 錯誤報告包含文本 (.txt) 格式的dumpsysdumpstatelogcat數據,使您能夠輕鬆搜索特定內容。以下部分詳細介紹了錯誤報告組件,描述了常見問題,並提供了有用的提示和grep命令以查找與這些錯誤相關的日誌。大多數部分還包括grep命令和輸出和/或dumpsys輸出的示例。

日誌貓

logcat日誌是所有logcat信息的基於字符串的轉儲。系統部分是為框架保留的,並且比包含其他所有內容的main具有更長的歷史。每行通常以timestamp UID PID TID log-level開頭,儘管UID可能不會在舊版本的 Android 中列出。

查看事件日誌

此日誌包含二進制格式的日誌消息的字符串表示形式。它比logcat日誌噪音小,但也更難閱讀。查看事件日誌時,您可以在此部分搜索特定的進程 ID (PID),以查看進程一直在做什麼。基本格式為: timestamp PID TID log-level log-tag tag-values

日誌級別包括以下內容:

  • 五:冗長
  • D:調試
  • 一:資料
  • W:警告
  • E:錯誤

有關其他有用的事件日誌標籤,請參閱/services/core/java/com/android/server/EventLogTags.logtags

ANR 和死鎖

錯誤報告可以幫助您確定導致應用程序無響應 (ANR)錯誤和死鎖事件的原因。

識別無響應的應用程序

當應用程序在一定時間內沒有響應時,通常是由於主線程阻塞或繁忙,系統會終止進程並將堆棧轉儲到/data/anr 。要發現 ANR 背後的罪魁禍首,請在二進制事件日誌中 grep 查找am_anr

您還可以在logcat日誌中對ANR in grep,其中包含有關 ANR 時 CPU 使用情況的更多信息。

查找堆棧跟踪

您通常可以找到與 ANR 對應的堆棧跟踪。確保 VM 跟踪上的時間戳和 PID 與您正在調查的 ANR 匹配,然後檢查進程的主線程。記住:

  • 主線程只告訴您在 ANR 時線程在做什麼,這可能對應也可能不對應 ANR 的真正原因。 (錯誤報告中的堆棧可能是無辜的;其他東西可能已經被卡住了很長時間——但還不足以導致 ANR——在解除卡住之前。)
  • 可能存在不止一組堆棧跟踪( VM TRACES JUST NOWVM TRACES AT LAST ANR )。確保您正在查看正確的部分。

發現死鎖

死鎖通常首先表現為 ANR,因為線程卡住了。如果死鎖命中系統服務器,看門狗最終會殺死它,導致日誌中出現類似於: WATCHDOG KILLING SYSTEM PROCESS的條目。從用戶的角度來看,設備會重新啟動,儘管從技術上講,這是運行時重新啟動,而不是真正的重新啟動。

  • 運行時重新啟動中,系統服務器死掉並重新啟動;用戶看到設備返回啟動動畫。
  • 重新啟動時,內核已經崩潰;用戶會看到設備返回到 Google 啟動徽標。

要查找死鎖,請檢查 VM 跟踪部分以了解線程 A 等待線程 B 持有的東西的模式,而線程 B 又等待線程 A 持有的東西。

活動

Activity是一個應用程序組件,它提供用戶與之交互的屏幕,以執行諸如撥號、拍照、發送電子郵件等操作。從錯誤報告的角度來看, Activity是用戶可以做的單一的、專注的事情,這使得定位在崩潰期間成為焦點的活動非常重要。活動(通過 ActivityManager)運行流程,因此定位給定活動的所有流程停止和啟動也有助於故障排除。

查看重點活動

要查看重點活動的歷史記錄,請搜索am_focused_activity

查看過程開始

要查看進程啟動的歷史記錄,請搜索Start proc

設備是否抖動?

要確定設備是否在抖動,請在短時間內檢查am_proc_diedam_proc_start周圍的活動是否異常增加。

記憶

由於 Android 設備通常具有受限的物理內存,因此管理隨機存取內存 (RAM) 至關重要。錯誤報告包含幾個內存不足的指標以及提供內存快照的轉儲狀態。

識別內存不足

內存不足會導致系統崩潰,因為它會殺死一些進程以釋放內存但繼續啟動其他進程。要查看內存不足的確鑿證據,請檢查二進制事件日誌中am_proc_diedam_proc_start條目的集中度。

內存不足也會減慢任務切換並阻礙返回嘗試(因為用戶試圖返回的任務已被終止)。如果啟動器被殺死,它會在用戶觸摸主頁按鈕時重新啟動,並且日誌顯示啟動器重新加載其內容。

查看歷史指標

二進制事件日誌中的am_low_memory條目表示最後一個緩存進程已經死亡。在此之後,系統開始殺死服務。

查看抖動指標

系統抖動(分頁、直接回收等)的其他指標包括kswapdkworkermmcqd消耗週期。 (請記住,正在收集的錯誤報告可能會影響抖動指標。)

ANR 日誌可以提供類似的內存快照。

獲取內存快照

內存快照是一個轉儲狀態,列出了正在運行的 Java 和本機進程(有關詳細信息,請參閱查看總體內存分配)。請記住,快照僅給出特定時刻的狀態;在快照之前,系統可能處於更好(或更差)的狀態。

廣播

應用程序生成廣播以在當前應用程序內或向另一個應用程序發送事件。廣播接收器訂閱特定消息(通過過濾器),使它們能夠收聽和響應廣播。錯誤報告包含有關已發送廣播和未發送廣播的信息,以及偵聽特定廣播的所有接收器的轉儲系統。

查看歷史廣播

歷史廣播是那些已經發送的廣播,按時間倒序排列。

摘要部分是最近 300 次前台廣播和最近 300 次後台廣播的概述。

詳細信息部分包含最後 50 個前台廣播和最後 50 個後台廣播的完整信息,以及每個廣播的接收器。接收器具有:

  • BroadcastFilter條目在運行時註冊,並且只發送到已經運行的進程。
  • ResolveInfo條目是通過清單條目註冊的。如果每個ResolveInfo尚未運行,則 ActivityManager 會啟動該進程。

查看活動廣播

活動廣播是那些尚未發送的廣播。隊列中的大量數字意味著系統無法以足夠快的速度分派廣播以跟上。

查看廣播監聽器

要查看偵聽廣播的接收器列表,請檢查dumpsys activity broadcasts中的接收器解析器表。以下示例顯示了所有偵聽USER_PRESENT的接收器。

監控爭用

監視器爭用日誌有時可以指示實際的監視器爭用,但大多數情況下表明系統負載過大以至於一切都變慢了。您可能會在系統或事件日誌中看到由 ART 記錄的長監控事件。

在系統日誌中:

10-01 18:12:44.343 29761 29914 W art     : Long monitor contention event with owner method=void android.database.sqlite.SQLiteClosable.acquireReference() from SQLiteClosable.java:52 waiters=0 for 3.914s

在事件日誌中:

10-01 18:12:44.364 29761 29914 I dvm_lock_sample: [com.google.android.youtube,0,pool-3-thread-9,3914,ScheduledTaskMaster.java,138,SQLiteClosable.java,52,100]

後台編譯

編譯可能很昂貴並且會加載設備。

下載 Google Play 商店更新時,可能會在後台進行編譯。在這種情況下,來自 Google Play 商店應用程序 ( finsky ) 和installd的消息出現在dex2oat消息之前。

當應用程序加載尚未編譯的 dex 文件時,也可能在後台進行編譯。在這種情況下,您不會看到finskyinstalld日誌記錄。

敘述

建立問題的敘述(它是如何開始的,發生了什麼,系統如何反應)需要一個可靠的事件時間表。您可以使用錯誤報告中的信息跨多個日誌同步時間線並確定錯誤報告的確切時間戳。

同步時間線

錯誤報告反映了多個並行時間線:系統日誌、事件日誌、內核日誌以及用於廣播、電池統計信息等的多個專用時間線。不幸的是,通常使用不同的時間基準報告時間線。

系統和事件日誌時間戳與用戶位於同一時區(與大多數其他時間戳一樣)。例如,當用戶點擊主頁按鈕時,系統日誌報告:

10-03 17:19:52.939  1963  2071 I ActivityManager: START u0 {act=android.intent.action.MAIN cat=[android.intent.category.HOME] flg=0x10200000 cmp=com.google.android.googlequicksearchbox/com.google.android.launcher.GEL (has extras)} from uid 1000 on display 0

對於相同的操作,事件日誌報告:

10-03 17:19:54.279  1963  2071 I am_focused_activity: [0,com.google.android.googlequicksearchbox/com.google.android.launcher.GEL]

內核 ( dmesg ) 日誌使用不同的時基,以自引導加載程序完成後的秒數標記日誌項。要將此時間刻度註冊到其他時間刻度,請搜索暫停退出暫停進入消息:

<6>[201640.779997] PM: suspend exit 2015-10-03 19:11:06.646094058 UTC
…
<6>[201644.854315] PM: suspend entry 2015-10-03 19:11:10.720416452 UTC

因為內核日誌可能不包括掛起時的時間,所以您應該在掛起進入和退出消息之間分段註冊日誌。此外,內核日誌使用 UTC 時區,並且必須調整為用戶時區。

確定錯誤報告時間

要確定何時生成錯誤報告,首先檢查系統日誌 (Logcat) 中的dumpstate: begin

10-03 17:19:54.322 19398 19398 I dumpstate: begin

接下來,檢查Starting service 'bugreport'消息的內核日誌 ( dmesg ) 時間戳:

<5>[207064.285315] init: Starting service 'bugreport'...

向後工作以關聯這兩個事件,記住同步時間線中提到的注意事項。雖然在啟動錯誤報告後發生了很多事情,但大多數活動並不是很有用,因為獲取錯誤報告的行為會大量加載系統。

力量

事件日誌包含屏幕電源狀態,其中 0 為屏幕關閉,1 為屏幕開啟,2 為鍵盤保護完成。

錯誤報告還包含有關喚醒鎖的統計信息,這是應用程序開發人員用來指示他們的應用程序需要讓設備保持開啟的機制。 (有關喚醒鎖的詳細信息,請參閱PowerManager.WakeLockKeep the CPU on 。)

聚合的喚醒鎖定持續時間統計信息跟踪喚醒鎖定實際負責保持設備喚醒的時間,包括屏幕打開的時間。此外,如果同時持有多個喚醒鎖,則喚醒鎖持續時間將分佈在這些喚醒鎖上。

如需更多關於電源狀態可視化的幫助,請使用Battery Historian ,這是一種使用 Android 錯誤報告文件分析電池消耗者的 Google 開源工具。

套餐

DUMP OF SERVICE package部分包含應用程序版本(和其他有用信息)。

流程

Bug 報告包含大量進程數據,包括啟動和停止時間、運行時長、關聯服務、 oom_adj分數等。有關 Android 如何管理進程的詳細信息,請參閱進程和線程

確定流程運行時間

procstats部分包含有關進程和相關服務已運行多長時間的完整統計信息。如需快速、易於閱讀的摘要,請搜索AGGREGATED OVER以查看過去 3 小時或 24 小時的數據,然後搜索Summary:以查看進程列表、這些進程在不同優先級下運行的時間以及它們的 RAM使用格式為 min-average-max PSS/min-average-max USS。

為什麼一個進程正在運行?

dumpsys activity processes部分列出了所有當前正在運行的進程,按oom_adj分數排序(Android 通過為進程分配oom_adj值來指示進程重要性,該值可以由 ActivityManager 動態更新)。輸出類似於內存快照的輸出,但包含有關導致進程運行的原因的附加信息。在下面的示例中,粗體條目表示gms.persistent進程以vis (可見)優先級運行,因為系統進程綁定到其NetworkLocationService

掃描

使用以下步驟來識別執行過多藍牙低功耗 (BLE) 掃描的應用程序:

  • 查找BluetoothLeScanner的日誌消息:
    $ grep 'BluetoothLeScanner' ~/downloads/bugreport.txt
    07-28 15:55:19.090 24840 24851 D BluetoothLeScanner: onClientRegistered() - status=0 clientIf=5
    
  • 在日誌消息中找到 PID。在這個例子中,“24840”和“24851”是PID(進程ID)和TID(線程ID)。
  • 找到與 PID 關聯的應用程序:
    PID #24840: ProcessRecord{4fe996a 24840:com.badapp/u0a105}
    

    在此示例中,包名稱為com.badapp

  • 在 Google Play 上查找包名稱以確定負責的應用程序: https ://play.google.com/store/apps/details?id=com.badapp。

注意:對於運行 Android 7.0 的設備,系統會收集 BLE 掃描數據並將這些活動與啟動應用程序相關聯。有關詳細信息,請參閱低功耗 (LE) 和藍牙掃描