Implementierung von DMABUF- und GPU-Arbeitsspeichererfassung in Android 12

Auf dieser Seite werden die verschiedenen Verbesserungen der Arbeitsspeicherbilanzierung Android 12

DMA-BUF-Statistiken in sysfs

In Android 11 und Android 12 kann debugfs nicht in Nutzer-Builds bereitgestellt werden. Daher wurden DMA-BUF-Statistiken in Android 12 dem Dateinamen sysfs im Verzeichnis /sys/kernel/dmabuf/buffers hinzugefügt.

Pfad Beschreibung
/sys/kernel/dmabuf/buffers Das Verzeichnis /sys/kernel/dmabuf/buffers enthält einen Snapshot des internen Status jedes DMA-BUF. /sys/kernel/dmabuf/buffers/<inode_number> enthält die Statistiken für den DMA-BUF mit der eindeutigen Inode-Nummer <inode_number>.
/sys/kernel/dmabuf/buffers/<inode_number>/exporter_name Diese schreibgeschützte Datei enthält den Namen des DMA-BUF-Exporteurs.
/sys/kernel/dmabuf/buffers/<inode_number>/size Diese schreibgeschützte Datei gibt die Größe des DMA-BUF in Byte an.

Die libdmabufinfo Die API parst die DMA-BUF-Statistiken von sysfs, um Statistiken pro Exporter und pro Zwischenspeicher bereitzustellen.

Kerneltreiber, die DMA-BUFs exportieren, müssen das exp_name-Feld von struct dma_buf_export_info korrekt auf den Namen des Exporteurs festlegen, bevor sie die dma_buf_export() API aufrufen, um einen DMA-BUF zu erstellen. Dies ist erforderlich, damit libdmabufinfo und das dmabuf_dump-Tool Statistiken pro Exporteure ableiten können, werden im Fehlerbericht aufgeführt.

Den dmabuf_dump Tool wurde geändert, um diese Informationen mit dem neuen Argument -b auszugeben.

Statistiken für das DMA-BUF-Heap-Framework

ION in GKI 2.0 wird zugunsten des DMA-BUF-Heap-Frameworks eingestellt, das Teil des Upstream-Linux-Kernels ist.

Die folgenden globalen ION-Statistiken werden in Android 11 erfasst:

  • Gesamtgröße der von jedem ION-Heap exportierten DMA-BUFs
  • Gesamtgröße des nicht verwendeten vorab zugewiesenen Arbeitsspeichers, der von jedem ION-Heap gespeichert wird

In Android 11 ist keine Benutzeroberfläche verfügbar, um Heap-Statistiken pro ION anzuzeigen.

In der folgenden Tabelle werden die ION-Statistikschnittstellen mit ihren Gegenstücken für Geräte verglichen, die das DMA-BUF-Heap-Framework in Android 12 verwenden.

Android 11 oder Geräte mit ION-Unterstützung in Android 12 Geräte, die mit DMA-BUF-Heaps in Android 12 auf den Markt gekommen sind
ION-Statistiken pro Heap Keine Aus DMA-BUF-sysfs-Statistiken geparst
Gesamtgröße der exportierten DMA-BUFs /sys/kernel/ion/total_heap_size_kb
(Beinhaltet nicht die Größe der DMA-BUFs, die von Nicht-ION-Exportern exportiert wurden)
Aus DMA-BUF-sysfs-Statistiken geparst
(umfasst die Größe aller exportierten DMA-BUFs).
Nach Heaps zusammengefasster Arbeitsspeicher insgesamt /sys/kernel/ion/total_pool_size_kb /sys/kernel/dma_heap/total_pool_size_kb

Genauigkeit der Berechnung des verlorenen RAM verbessern

Bisher wurde der verlorene RAM so berechnet:

final long lostRAM = memInfo.getTotalSizeKb() – (totalPss – totalSwapPss)

memInfo.getFreeSizeKb()memInfo.getCachedSizeKb()

kernelUsedmemInfo.getZramTotalSizeKb();

Die Komponente totalPss enthielt die GPU-Arbeitsspeichernutzung (zurückgegeben vom Memtrack HALs getMemory() . Die Komponente kernelUsed enthielt die gesamte DMA-BUF-Arbeitsspeichernutzung. Bei Android-Geräten stammte der GPU-Speicher jedoch aus folgenden Quellen:

  • Direkte Zuweisungen durch den GPU-Treiber über die Zuordnung für physische Seiten
  • DMA-BUFs, die dem GPU-Adressraum zugeordnet sind

Daher wurden DMA-BUFs, die im GPU-Adressraum arbeitsspeicherzugeordnet waren, bei der Berechnung des verlorenen RAM doppelt abgezogen. In Android 12 wird eine Lösung implementiert, mit der die Größe von DMA-BUFs berechnet wird, die in den GPU-Adressraum zugeordnet sind. Das bedeutet, dass sie nur einmal bei der Berechnung des verlorenen RAM berücksichtigt wird.

Die Lösung im Detail:

  • Wenn die Memtrack HAL API getMemory() mit PID 0 aufgerufen wird, muss sie den gesamten globalen GPU-privaten Arbeitsspeicher für MemtrackType::GL und MemtrackRecord::FLAG_SMAPS_UNACCOUNTED melden.
  • getMemory() darf nicht fehlschlagen, wenn es mit PID 0 für einen anderen MemtrackType als GL aufgerufen wird. Stattdessen muss 0 zurückgegeben werden.
  • Die in Android 12 hinzugefügte Lösung GPU-Arbeitsspeicher-Tracepoint/eBPF berücksichtigt den gesamten GPU-Arbeitsspeicher. Wenn Sie den gesamten privaten GPU-Arbeitsspeicher vom gesamten GPU-Arbeitsspeicher abziehen, Größe von DMA-BUFs, die dem GPU-Adressbereich zugeordnet sind. Der Wert kann dann verwendet werden, um die Genauigkeit der Berechnungen für verlorenen RAM zu verbessern, indem die GPU-Speichernutzung korrekt berücksichtigt wird.
  • Der private GPU-Arbeitsspeicher ist in totalPss in den meisten Memtrack-HALs enthalten Implementierungen und muss daher vor dem Entfernen aus lostRAM dedupliziert werden.

Die implementierte Lösung wird im nächsten Abschnitt beschrieben.

Memtrack-Variabilität aus verlorenem RAM entfernen

Da Memtrack-HAL-Implementierungen je nach Partner variieren können, die in totalPSS aus dem HAL enthalten sind, ist nicht immer konsistent. Um die Variabilität aus lostRAM zu entfernen, wird der in MemtrackType::GRAPHICS und MemtrackType::GL berücksichtigte Arbeitsspeicher während der Berechnung von lostRAM aus totalPss entfernt.

MemtrackType::GRAPHICS Arbeitsspeicher wurde aus totalPss entfernt und ersetzt durch totalExportedDmabuf-Speicher in der Berechnung lostRAM in ActivityManagerService.java wie unten dargestellt:

final long totalExportedDmabuf = Debug.getDmabufTotalExportedKb();

. . .

final long dmabufUnmapped = totalExportedDmabuf - dmabufMapped;

. . .

// Account unmapped dmabufs as part of the kernel memory allocations
kernelUsed += dmabufUnmapped;

// Replace Memtrack HAL reported Graphics category with mapped dmabufs
totalPss -= totalMemtrackGraphics;
totalPss += dmabufMapped;

Der MemtrackType::GL-Arbeitsspeicher wird aus totalPss entfernt und durch den privaten GPU-Arbeitsspeicher (gpuPrivateUsage) in der lostRAM-Berechnung in ActivityManagerService.java ersetzt, wie unten dargestellt:

final long gpuUsage = Debug.getGpuTotalUsageKb();

. . .

final long gpuPrivateUsage = Debug.getGpuPrivateMemoryKb();

. . .

// Replace the Memtrack HAL-reported GL category with private GPU allocations.
// Count it as part of the kernel memory allocations.
totalPss -= totalMemtrackGl;
kernelUsed += gpuPrivateUsage;

Aktualisierte Berechnung des verlorenen Arbeitsspeichers

Sowohl der gesamte private GPU-Arbeitsspeicher als auch der gesamte exportierte DMA-Pufferspeicher sind in kernelUsed + totalPss enthalten, der von lostRAM entfernt wird. Dadurch werden sowohl Doppelzählungen als auch die Memtrack-Variabilität bei der Berechnung des verlorenen RAM eliminiert.

final long lostRAM = memInfo.getTotalSizeKb() - (totalPss - totalSwapPss)
- memInfo.getFreeSizeKb() - memInfo.getCachedSizeKb()
- kernelUsed - memInfo.getZramTotalSizeKb();

Zertifizierungsstufe

Bei VTS-Tests wird die Regel erzwungen, dass Geräte, die mit Android 12 und einer Linux-Kernelversion von 5.4 oder höher gestartet werden, die API getGpuDeviceInfo() unterstützen.

Eine neue Memtrack HAL API getGpuDeviceInfo() muss Informationen zum verwendeten GPU-Gerät zurückgeben.

Dies sorgt für eine bessere Speicherbilanz und Einblick in den DMA-Zwischenspeicher und die GPU. Arbeitsspeichernutzung. Implementieren Sie die memtrack-AIDL-HAL für eine bessere Erfassung von verlorenem RAM und Speicher. Diese Funktion ist unabhängig von Google-Diensten.

Implementierung

Diese Funktion hängt von der AIDL Memtrack HAL ab. Eine Anleitung zur Implementierung in Android 12 ist im Code als Kommentar enthalten.

Alle HIDL HALs werden in zukünftigen Releases in AIDL konvertiert.

Die folgenden APIs wurden core/java/android/os/Debug.java hinzugefügt:

   /**
     * Return total memory size in kilobytes for exported DMA-BUFs or -1 if
     * the DMA-BUF sysfs stats at /sys/kernel/dmabuf/buffers could not be read.
     *
     * @hide
     */
    public static native long getDmabufTotalExportedKb();

   /**
     * Return memory size in kilobytes allocated for DMA-BUF heap pools or -1 if
     * /sys/kernel/dma_heap/total_pools_kb could not be read.
     *
     * @hide
     */
    public static native long getDmabufHeapPoolsSizeKb();

Integrieren Sie die Tracepoints in Ihre GPU, damit Ihre Version wie beabsichtigt funktioniert. und implementieren Sie die AIDL memtrack HAL getMemory() API, damit den globalen gesamten privaten GPU-Arbeitsspeicher beim Aufruf mit PID 0 für MemtrackType::GL und MemtrackRecord::FLAG_SMAPS_UNACCOUNTED.