Lettura di segnalazioni di bug

I bug sono una realtà in qualsiasi tipo di sviluppo e le segnalazioni di bug sono fondamentali per identificare e risolvere i problemi. Tutte le versioni di Android supportano l'acquisizione di segnalazioni di bug con Android Debug Bridge (adb) ; Le versioni Android 4.2 e successive supportano un'opzione sviluppatore per l'acquisizione di segnalazioni di bug e la condivisione tramite e-mail, Drive, ecc.

Le segnalazioni di bug di Android contengono dati dumpsys , dumpstate e logcat in formato testo (.txt), consentendoti di cercare facilmente contenuti specifici. Le sezioni seguenti descrivono in dettaglio i componenti delle segnalazioni di bug, descrivono i problemi comuni e forniscono suggerimenti utili e comandi grep per trovare i log associati a tali bug. La maggior parte delle sezioni include anche esempi per il comando grep e l'output e/o l'output di dumpsys .

Logcat

Il log logcat è un dump basato su stringhe di tutte le informazioni logcat . La parte di sistema è riservata al framework e ha una cronologia più lunga di quella principale che contiene tutto il resto. Ogni riga inizia in genere con timestamp UID PID TID log-level , anche se l' UID potrebbe non essere elencato nelle versioni precedenti di Android.

Visualizzazione del registro eventi

Questo registro contiene rappresentazioni di stringa di messaggi di registro in formato binario. È meno rumoroso del logcat ma anche un po' più difficile da leggere. Durante la visualizzazione dei registri eventi, è possibile cercare in questa sezione un ID processo specifico (PID) per vedere cosa sta facendo un processo. Il formato di base è: timestamp PID TID log-level log-tag tag-values .

I livelli di registro includono quanto segue:

  • V: prolisso
  • D: debug
  • Io: informazione
  • V: avviso
  • E: errore

Per altri utili tag del registro eventi, fare riferimento a /services/core/java/com/android/server/EventLogTags.logtags .

ANR e deadlock

I bugreport possono aiutarti a identificare la causa degli errori ANR (Application Not Responding) e degli eventi deadlock.

Identificazione delle app che non rispondono

Quando un'applicazione non risponde entro un certo tempo, in genere a causa di un thread principale bloccato o occupato, il sistema interrompe il processo e scarica lo stack in /data/anr . Per scoprire il colpevole dietro un ANR, grep for am_anr nel registro eventi binario.

Puoi anche grep per ANR in registro logcat , che contiene ulteriori informazioni su cosa stava usando la CPU al momento dell'ANR.

Trovare tracce di stack

Spesso puoi trovare tracce di stack che corrispondono a un ANR. Assicurati che il timestamp e il PID nelle tracce della VM corrispondano all'ANR che stai esaminando, quindi controlla il thread principale del processo. Tieni a mente:

  • Il thread principale ti dice solo cosa stava facendo il thread al momento dell'ANR, che può corrispondere o meno alla vera causa dell'ANR. (Lo stack nella segnalazione di bug potrebbe essere innocente; qualcos'altro potrebbe essere rimasto bloccato per molto tempo, ma non abbastanza a lungo per ANR, prima di sbloccarsi.)
  • Potrebbe esistere più di un set di tracce dello stack ( VM TRACES JUST NOW e VM TRACES AT LAST ANR ). Assicurati di visualizzare la sezione corretta.

Trovare deadlock

I deadlock spesso appaiono per la prima volta come ANR perché i thread si bloccano. Se il deadlock colpisce il server di sistema, il watchdog alla fine lo interromperà, portando a una voce nel registro simile a: WATCHDOG KILLING SYSTEM PROCESS . Dal punto di vista dell'utente, il dispositivo si riavvia, anche se tecnicamente si tratta di un riavvio di runtime piuttosto che di un vero riavvio.

  • In un riavvio di runtime , il server di sistema si spegne e viene riavviato; l'utente vede il dispositivo tornare all'animazione di avvio.
  • In un riavvio , il kernel è andato in crash; l'utente vede il dispositivo tornare al logo di avvio di Google.

Per trovare deadlock, controlla le sezioni di traccia VM per un modello di thread A in attesa di qualcosa contenuto nel thread B, che a sua volta è in attesa di qualcosa contenuto nel thread A.

Attività

Un'attività è un componente dell'applicazione che fornisce una schermata con cui gli utenti interagiscono per eseguire operazioni come comporre un numero, scattare una foto, inviare un'e-mail, ecc. Dal punto di vista della segnalazione di bug, un'attività è un'attività singola e mirata che un utente può fare , il che rende molto importante individuare l'attività che era a fuoco durante un arresto anomalo. Le attività (tramite ActivityManager) eseguono processi, quindi anche l'individuazione di tutti gli arresti e gli avvii dei processi per una determinata attività può aiutare la risoluzione dei problemi.

Visualizzazione di attività mirate

Per visualizzare una cronologia delle attività focalizzate, cerca am_focused_activity .

Viene avviato il processo di visualizzazione

Per visualizzare una cronologia degli inizi del processo, cercare Start proc .

Il dispositivo sta battendo?

Per determinare se il dispositivo sta thrashing , controlla un aumento anomalo dell'attività intorno a am_proc_died e am_proc_start in un breve lasso di tempo.

Memoria

Poiché i dispositivi Android hanno spesso una memoria fisica limitata, la gestione della memoria ad accesso casuale (RAM) è fondamentale. Le segnalazioni di bug contengono diversi indicatori di memoria insufficiente e uno stato di dump che fornisce un'istantanea della memoria.

Identificazione di memoria insufficiente

La memoria insufficiente può causare il thrash del sistema poiché uccide alcuni processi per liberare memoria ma continua ad avviare altri processi. Per visualizzare prove corroboranti di memoria insufficiente, verificare le concentrazioni delle voci am_proc_died e am_proc_start nel registro eventi binario.

La memoria insufficiente può anche rallentare il cambio di attività e ostacolare i tentativi di restituzione (perché l'attività a cui l'utente stava tentando di tornare è stata interrotta). Se il programma di avvio è stato interrotto, si riavvia quando l'utente tocca il pulsante Home e i registri mostrano che il programma di avvio ricarica il suo contenuto.

Visualizzazione degli indicatori storici

La voce am_low_memory nel registro eventi binario indica che l'ultimo processo memorizzato nella cache è terminato. Dopodiché, il sistema inizia a terminare i servizi.

Visualizzazione degli indicatori di battito

Altri indicatori di thrashing del sistema (paging, recupero diretto, ecc.) includono i cicli di consumo kswapd , kworker e mmcqd . (Tieni presente che la segnalazione di bug raccolta può influenzare gli indicatori di thrashing.)

I registri ANR possono fornire uno snapshot di memoria simile.

Ottenere uno snapshot di memoria

L'istantanea della memoria è uno stato di dump che elenca Java in esecuzione e i processi nativi (per i dettagli, fare riferimento a Visualizzazione delle allocazioni di memoria complessive ). Tieni presente che l'istantanea fornisce solo lo stato in un momento specifico; il sistema potrebbe essere in una forma migliore (o peggiore) prima dell'istantanea.

Trasmissioni

Le applicazioni generano trasmissioni per inviare eventi all'interno dell'applicazione corrente oa un'altra applicazione. I ricevitori di trasmissioni si iscrivono a messaggi specifici (tramite filtri), consentendo loro di ascoltare e rispondere a una trasmissione. Le segnalazioni di bug contengono informazioni sulle trasmissioni inviate e sulle trasmissioni non inviate, nonché un dumpsys di tutti i ricevitori che ascoltano una trasmissione specifica.

Visualizzazione delle trasmissioni storiche

Le trasmissioni storiche sono quelle già inviate, elencate in ordine cronologico inverso.

La sezione di riepilogo è una panoramica delle ultime 300 trasmissioni in primo piano e delle ultime 300 trasmissioni in background.

La sezione dei dettagli contiene informazioni complete per le ultime 50 trasmissioni in primo piano e le ultime 50 trasmissioni in background, nonché i ricevitori per ciascuna trasmissione. Ricevitori che hanno:

  • Le voci BroadcastFilter vengono registrate in fase di esecuzione e inviate solo ai processi già in esecuzione.
  • Le voci ResolveInfo vengono registrate tramite le voci manifest. ActivityManager avvia il processo per ogni ResolveInfo se non è già in esecuzione.

Visualizzazione delle trasmissioni attive

Le trasmissioni attive sono quelle che devono ancora essere inviate. Un numero elevato in coda significa che il sistema non può inviare le trasmissioni abbastanza velocemente da tenere il passo.

Visualizzazione degli ascoltatori delle trasmissioni

Per visualizzare un elenco di ricevitori in ascolto di una trasmissione, controllare la tabella del risolutore dei ricevitori nelle dumpsys activity broadcasts . L'esempio seguente mostra tutti i ricevitori in ascolto per USER_PRESENT .

Monitorare la contesa

La registrazione del conflitto di monitoraggio a volte può indicare un conflitto di monitoraggio effettivo, ma nella maggior parte dei casi indica che il sistema è così caricato che tutto è rallentato. È possibile che vengano visualizzati eventi di monitoraggio lunghi registrati da ART nel sistema o nel registro eventi.

Nel registro di sistema:

10-01 18:12:44.343 29761 29914 W art     : Long monitor contention event with owner method=void android.database.sqlite.SQLiteClosable.acquireReference() from SQLiteClosable.java:52 waiters=0 for 3.914s

Nel registro eventi:

10-01 18:12:44.364 29761 29914 I dvm_lock_sample: [com.google.android.youtube,0,pool-3-thread-9,3914,ScheduledTaskMaster.java,138,SQLiteClosable.java,52,100]

Compilazione in background

La compilazione può essere costosa e caricare il dispositivo.

La compilazione potrebbe verificarsi in background durante il download degli aggiornamenti del Google Play Store. In questo caso, i messaggi dell'app Google Play Store ( finsky ) e installd vengono visualizzati prima dei messaggi dex2oat .

La compilazione potrebbe verificarsi anche in background quando un'applicazione sta caricando un file dex che non è stato ancora compilato. In questo caso, non vedrai la registrazione finsky o installd .

Narrativa

Stabilire la narrazione di un problema (come è iniziato, cosa è successo, come ha reagito il sistema) richiede una solida sequenza temporale degli eventi. È possibile utilizzare le informazioni nella segnalazione di bug per sincronizzare le linee temporali su più registri e determinare il timestamp esatto della segnalazione di bug.

Sincronizzazione delle linee temporali

Una segnalazione di bug riflette più linee temporali parallele: registro di sistema, registro eventi, registro del kernel e più linee temporali specializzate per trasmissioni, statistiche della batteria, ecc. Sfortunatamente, le linee temporali vengono spesso segnalate utilizzando basi temporali diverse.

I timestamp del sistema e del registro eventi si trovano nello stesso fuso orario dell'utente (come la maggior parte degli altri timestamp). Ad esempio, quando l'utente tocca il pulsante Home, il registro di sistema riporta:

10-03 17:19:52.939  1963  2071 I ActivityManager: START u0 {act=android.intent.action.MAIN cat=[android.intent.category.HOME] flg=0x10200000 cmp=com.google.android.googlequicksearchbox/com.google.android.launcher.GEL (has extras)} from uid 1000 on display 0

Per la stessa azione, il registro eventi riporta:

10-03 17:19:54.279  1963  2071 I am_focused_activity: [0,com.google.android.googlequicksearchbox/com.google.android.launcher.GEL]

I registri del kernel ( dmesg ) utilizzano una base di tempo diversa, contrassegnando gli elementi del registro con i secondi dal completamento del bootloader. Per registrare questa scala temporale su altre scale temporali, cerca sospendi uscita e sospendi messaggi di ingresso :

<6>[201640.779997] PM: suspend exit 2015-10-03 19:11:06.646094058 UTC
…
<6>[201644.854315] PM: suspend entry 2015-10-03 19:11:10.720416452 UTC

Poiché i registri del kernel potrebbero non includere il tempo durante la sospensione, è necessario registrare il registro a tratti tra i messaggi di ingresso e di uscita di sospensione. Inoltre, i registri del kernel utilizzano il fuso orario UTC e devono essere adattati al fuso orario dell'utente.

Identificazione del tempo della segnalazione di bug

Per determinare quando è stato eseguito un bugreport, controlla prima il registro di sistema (Logcat) per il dumpstate: begin :

10-03 17:19:54.322 19398 19398 I dumpstate: begin

Quindi, controlla i timestamp del registro del kernel ( dmesg ) per il messaggio Starting service 'bugreport' :

<5>[207064.285315] init: Starting service 'bugreport'...

Lavora a ritroso per correlare i due eventi, tenendo presente le avvertenze menzionate in Sincronizzazione delle linee temporali . Sebbene succedano molte cose dopo l'avvio del bugreport, la maggior parte dell'attività non è molto utile poiché l'atto di prendere il bugreport carica sostanzialmente il sistema.

Potenza

Il registro eventi contiene lo stato di alimentazione dello schermo, dove 0 è lo schermo spento, 1 è lo schermo acceso e 2 è per la protezione della tastiera completata.

Le segnalazioni di bug contengono anche statistiche sui wakelock, un meccanismo utilizzato dagli sviluppatori di applicazioni per indicare che la loro applicazione deve mantenere il dispositivo acceso. (Per i dettagli sui wakelock, fare riferimento a PowerManager.WakeLock e Keep the CPU on .)

Le statistiche aggregate sulla durata del wakelock tengono traccia solo del tempo in cui un wakelock è effettivamente responsabile di mantenere il dispositivo attivo e non includono il tempo con lo schermo acceso. Inoltre, se più wakelock vengono mantenuti contemporaneamente, il tempo di durata del wakelock viene distribuito tra quei wakelock.

Per ulteriore assistenza sulla visualizzazione dello stato di alimentazione, utilizza Battery Historian , uno strumento open source di Google per analizzare i consumi della batteria utilizzando i file di segnalazione bug di Android.

Pacchi

La sezione DUMP OF SERVICE package contiene le versioni dell'applicazione (e altre informazioni utili).

Processi

Le segnalazioni di bug contengono un'enorme quantità di dati per i processi, inclusi tempo di inizio e fine, durata del runtime, servizi associati, punteggio oom_adj e così via. Per i dettagli su come Android gestisce i processi, fare riferimento a Processi e thread .

Determinazione del tempo di esecuzione del processo

La sezione procstats contiene statistiche complete sulla durata dell'esecuzione dei processi e dei servizi associati. Per un riepilogo rapido e leggibile dall'uomo, cerca AGGREGATED OVER per visualizzare i dati delle ultime tre o 24 ore, quindi cerca Summary: per visualizzare l'elenco dei processi, per quanto tempo tali processi sono stati eseguiti con varie priorità e la relativa RAM utilizzo formattato come min-media-max PSS/min-media-max USS.

Perché un processo è in esecuzione?

La sezione dumpsys activity processes elenca tutti i processi attualmente in esecuzione ordinati per punteggio oom_adj (Android indica l'importanza del processo assegnando al processo un valore oom_adj , che può essere aggiornato dinamicamente da ActivityManager). L'output è simile a quello di uno snapshot di memoria, ma include informazioni aggiuntive su ciò che sta causando l'esecuzione del processo. Nell'esempio seguente, le voci in grassetto indicano che il processo gms.persistent è in esecuzione con priorità vis (visibile) perché il processo di sistema è associato al relativo NetworkLocationService .

Scansioni

Utilizzare i seguenti passaggi per identificare le applicazioni che eseguono scansioni Bluetooth Low Energy (BLE) eccessive:

  • Trova i messaggi di registro per BluetoothLeScanner :
    $ grep 'BluetoothLeScanner' ~/downloads/bugreport.txt
    07-28 15:55:19.090 24840 24851 D BluetoothLeScanner: onClientRegistered() - status=0 clientIf=5
    
  • Individuare il PID nei messaggi di registro. In questo esempio, "24840" e "24851" sono PID (ID processo) e TID (ID thread).
  • Individuare l'applicazione associata al PID:
    PID #24840: ProcessRecord{4fe996a 24840:com.badapp/u0a105}
    

    In questo esempio, il nome del pacchetto è com.badapp .

  • Cerca il nome del pacchetto su Google Play per identificare l'applicazione responsabile: https://play.google.com/store/apps/details?id=com.badapp .

Nota : per i dispositivi con Android 7.0, il sistema raccoglie i dati per le scansioni BLE e associa queste attività all'applicazione di avvio. Per i dettagli, vedere Scansioni a basso consumo (LE) e Bluetooth .