Linee guida per gli OEM per l'implementazione del ROI

Android 15 introduce un processo standardizzato per integrare le configurazioni utente delle regioni di interesse (RoI) nel framework di codifica video di Android. Questa funzionalità consente una migliore qualità di compressione per i ROI offrendo API pubbliche per integrare e analizzare le configurazioni utente nell'encoder video.

Implementazione

I fornitori di SoC e gli OEM possono controllare il supporto del ROI per la codifica video con il FEATURE_Roi flag. Se l'opzione FEATURE_Roi non è attivata, il comportamento del codificatore video non cambia.

Modifiche al framework video

Questa sezione descrive nel dettaglio le modifiche al framework video necessarie per implementare questa funzionalità.

Chiavi in Codec2

In Android 15, la mappa dei parametri di quantizzazione (QP_map) e la configurazione rettangolare (rect) sono definiti come tipi di configurazione ROI. Inoltre, in Codec2 (C2) vengono introdotte due chiavi per supportare questi nuovi tipi. L'utilizzo di entrambe le chiavi è lo stesso delle API pubbliche. All'interno del loop dei frame del codificatore, la configurazione viene regolata dinamicamente durante la fase di esecuzione, prima che il buffer di input venga messo in coda, come descritto di seguito:

  • In uno scenario sticky, se non viene fornita alcuna configurazione ROI per il frame corrente, il codificatore utilizza la stessa configurazione del frame precedente.

  • In uno scenario dinamico, i tipi di configurazione del ROI possono cambiare dinamicamente.

Le nuove chiavi in C2 sono descritte nelle sezioni seguenti.

kParamIndexQpOffsetMapBuffer

La chiave kParamIndexQpOffsetMapBuffer indica la mappa qp-offset per un frame. Il suo valore viene impostato utilizzando il parametro di input PARAMETER_KEY_QP_OFFSET_MAP di setParameters.

kParamIndexQpOffsetMapBuffer è un array di byte in C2InfoBuffer, con i seguenti attributi:

  • Lunghezza: il numero di blocchi 16 x 16 in un frame.

  • Valore: ogni valore dell'array è l'offset QP di un blocco 16x16, nella regione -51~51. Il QP dell'unità di codifica più grande (LCU) target viene calcolato dal controllo della frequenza dell'encoder più l'offset. Se il risultato calcolato supera la regione 0-51, il valore viene troncato a 0-51.

    • Se 0: nessun offset QP, il QP viene deciso dal controllo della frequenza originale.
    • Se diverso da zero: QP è il controllo della frequenza originale più l'offset.
    • Se il valore è negativo: la qualità video viene migliorata nell'unità LCU di destinazione.
    • Se positivo: la qualità video diminuisce nell'unità LCU target.
  • Utilizzo: l'utente deve configurare questa chiave come blocchi 16 x 16. Il codificatore adegua la configurazione alle dimensioni reali dell'LCU mediando i valori dei blocchi 16 x 16 nell'LCU.

C2_PARAMKEY_QP_OFFSET_RECTS

La chiave C2_PARAMKEY_QP_OFFSET_RECTS (impostata su coding.qp-offset-rects imposta il ROI su QpOffset-Rects. Il relativo valore viene impostato utilizzando il parametro di input PARAMETER_KEY_QP_OFFSET_RECTS di setParameters.

Per supportare questa chiave, viene introdotta la seguente struttura C2QpOffsetRectStruct:

struct C2QpOffsetRectStruct : C2Rect {
  int32_t qpOffset;

  DEFINE_AND_DESCRIBE_C2STRUCT(QpOffsetRect)
  C2FIELD(width, "width")
  C2FIELD(height, "height")
  C2FIELD(left, "left")
  C2FIELD(top, "top")
  C2FIELD(qpOffset, "qp-offset")
}

Dove:

  • top e left: le coordinate dell'ROI, in forma rettangolare. Il ROI viene allungato in modo da allinearsi ai confini delle LCU. Il valore rappresenta l'angolo in alto a sinistra di ogni pixel, in modo che ((0,0), (16, 16)) definisce un blocco completo di 16 x 16.

  • qpOffset: ogni valore dell'array rappresenta l'offset QP dell'arearect di destinazione. La sua definizione e il suo utilizzo sono gli stessi del valore kParamIndexQpOffsetMapBuffer.

Algoritmo di mappatura

La tabella seguente mostra la mappatura delle chiavi pubbliche al framework video:

Chiavi pubbliche o API Mappatura nel framework video
PARAMETER_KEY_QP_OFFSET_MAP Il valore viene passato a kParamIndexQpOffsetMapBuffer come istanza di C2InfoBuffer.
PARAMETER_KEY_QP_OFFSET_RECTS Il valore viene convertito da String a Struct C2QpOffsetRectStruct e passato a C2_PARAMKEY_QP_OFFSET_RECTS.

Gestione degli errori

L'implementazione OEM deve gestire i seguenti casi di errore:

Caso di errore Esempio Prescrizioni d'uso
Per attivare il ROI vengono utilizzate sia la chiave del fornitore sia la chiave standardizzata. L'utente chiama sia setFeatureEnabled(FEATURE_ROI) sia la chiave del fornitore per attivare il ROI. Il ROI deve essere attivato.
L'offset QP è compreso nell'intervallo, ma non è supportato dai fornitori di SoC. L'utente imposta l'offset QP su 12, ma il SoC supporta solo l'offset QP fino a 10. L'intervallo di offset QP supportato viene lasciato come best effort. Il valore viene limitato all'intervallo supportato dal SoC.
Più configurazioni ROI (che si tratti di una chiave standardizzata o di una chiave specifica del fornitore) sono impostate su un singolo frame. L'utente utilizza sia la chiave standardizzata sia la chiave del fornitore per il frame 1. Se disponibile, il framework conserva la prima configurazione rect standardizzata, la prima configurazione QP_map standardizzata o entrambe. In ogni categoria, il framework invia al SoC una sola configurazione standardizzata e, se questa è disponibile, l'implementazione del SoC deve ignorare le configurazioni del fornitore. Se vengono inviate più configurazioni al SoC, il fornitore del SoC deve conservare una sola configurazione ROI e ignorare le altre configurazioni.

Le configurazioni vengono conservate in questo ordine di priorità:

  1. Standardizzata rect
  2. Standardizzata QP_map
  3. Fornitore rect
  4. Fornitore QP_map