Od 27 marca 2025 r. zalecamy używanie android-latest-release zamiast aosp-main do kompilowania i wspołtworzenia AOSP. Więcej informacji znajdziesz w artykule o zmianach w AOSP.

Ta strona została przetłumaczona przez Cloud Translation API.

Wdrożenie wysokiej jakości dźwięku przestrzennego i śledzenia ruchów głowy

Android 13 wprowadza obsługę dźwięku przestrzennego, udostępniając interfejsy API, które pozwalają deweloperom aplikacji sprawdzić, czy obecna kombinacja implementacji telefonu, podłączonych słuchawek i ustawień użytkownika umożliwia odtwarzanie dźwięku wielokanałowego w sposób immersyjny.

Producenci urządzeń oryginalnych mogą zapewnić efekt dźwięku przestrzennego ze śledzeniem ruchów głowy z wymaganym poziomem wydajności i opóźnienia, korzystając z nowej architektury dźwięku i integracji z ramówką czujników. Protokół HID określa, jak podłączyć urządzenie do śledzenia ruchów głowy przez Bluetooth i uzyskać do niego dostęp jako do urządzenia HID za pomocą interfejsu czujników Androida. Więcej wymagań i informacji o weryfikacji znajdziesz w sekcji Dźwięk przestrzenny i śledzenie ruchów głowy.

Wytyczne na tej stronie dotyczą rozwiązania do dźwięku przestrzennego, które korzysta z nowych interfejsów API dźwięku przestrzennego i architektury dźwiękowej na telefonie z Androidem w wersji 13 lub nowszej oraz z obsługiwanymi słuchawkami ze czujnikiem śledzenia ruchów głowy.

Wytyczne dotyczące implementacji dynamicznych i statycznych trybów dźwięku przestrzennego

Statyczny dźwięk przestrzenny nie wymaga śledzenia ruchów głowy, więc nie trzeba korzystać z konkretnych funkcji zestawu słuchawkowego. Wszystkie przewodowe i bezprzewodowe zestawy słuchawkowe mogą obsługiwać statyczny dźwięk przestrzenny.

Implementacja interfejsu API

Producenci OEM muszą zaimplementować klasę Spatializer wprowadzoną w Androidzie 12. Implementacja musi przejść testy CTS wprowadzone dla klasy Spatializer.

Solidna implementacja interfejsu API zapewnia deweloperom aplikacji, zwłaszcza usług przesyłania strumieniowego multimediów, spójne działanie w całym ekosystemie oraz wybór najlepszych treści zgodnie z możliwościami urządzenia, bieżącym kontekstem renderowania i wyborami użytkownika.

Interfejs użytkownika

Po zaimplementowaniu klasy Spatializer sprawdź, czy interfejs użytkownika zachowuje się w taki sposób:

Po sparowaniu zestawu słuchawkowego obsługującego dźwięk przestrzenny w ustawieniach urządzenia Bluetooth dla tego zestawu słuchawkowego pojawi się przełącznik Dźwięk przestrzenny:

Rysunek 1. Ustawienie dźwięku przestrzennego.
Ustawienia są dostępne, gdy zestaw słuchawkowy jest odłączony.
Domyślny stan dźwięku przestrzennego po początkowym sparowaniu zestawu słuchawkowego to włączony.
Wybrany przez użytkownika stan (włączony lub wyłączony) pozostaje niezmieniony po ponownym uruchomieniu telefonu lub po rozłączeniu i ponownym sparowaniu zestawu słuchawkowego.

Działanie

Formaty audio

Gdy włączony jest dźwięk przestrzenny, a urządzenie do renderowania to zestaw słuchawkowy przewodowy lub Bluetooth, te formaty audio MUSZĄ być renderowane przez efekt przestrzenny:

AAC, 5.1-kanałowe
surowy PCM, 5.1 kanałów

Aby zapewnić użytkownikom lepsze wrażenia, zdecydowanie zalecamy obsługę tych formatów i konfiguracji kanałów:

Dolby Digital Plus
5.1.2, 7.1, 7.1.2, 7.1.4

odtwarzanie treści stereo,

Treści stereo nie mogą być renderowane za pomocą mechanizmu efektu przestrzennego, nawet jeśli dźwięk przestrzenny jest włączony. Jeśli implementacja umożliwia przestrzenne odtwarzanie treści stereo, musi zawierać niestandardowy interfejs użytkownika, który umożliwia łatwe włączanie i wyłączanie tej funkcji. Gdy dźwięk przestrzenny jest włączony, użytkownik musi mieć możliwość przełączania się między odtwarzaniem treści wielokanałowych z dźwiękiem przestrzennym a treściami stereo bez dźwięku przestrzennego bez konieczności wprowadzania zmian w ustawieniach użytkownika lub ponownego łączenia lub konfigurowania zestawu słuchawkowego. Przejście między treściami z dźwiękiem przestrzennym a treściami stereo musi odbywać się z minimalnym zakłóceniem dźwięku.

Przejścia między przypadkami użycia i współbieżność

W szczególnych przypadkach:

Powiadomienia muszą być zmiksowane z dźwiękiem przestrzennym w taki sam sposób jak dźwięk nieprzestrzenny.
Dźwięki dzwonka muszą być zmiksowane z dźwiękiem przestrzennym. Jednak domyślnie mechanizm skupienia dźwięku wstrzymuje treści dźwięku przestrzennego, gdy włącza się dzwonek.
Podczas odbierania połączenia, nawiązywania połączenia lub przeprowadzania wideokonferencji odtwarzanie dźwięku przestrzennego musi zostać wstrzymane. Po zakończeniu połączenia odtwarzanie dźwięku przestrzennego musi zostać wznowione z tymi samymi ustawieniami. Konfiguracja ścieżki audio w celu przełączenia z trybu dźwięku przestrzennego na tryb konwersacyjny musi przebiegać szybko i płynnie, aby nie wpływać na jakość połączenia.

Renderowanie przez głośniki

Nie jest wymagane wsparcie dla dźwięku przestrzennego w głośnikach (tzw. tryb transauralny).

Wskazówki dotyczące implementacji śledzenia ruchów głowy

Ta sekcja dotyczy dynamicznego dźwięku przestrzennego, który ma określone wymagania dotyczące zestawu słuchawkowego.

Interfejs użytkownika

Po zaimplementowaniu i sparowaniu słuchawek obsługujących dźwięk przestrzenny sprawdź, czy interfejs użytkownika zachowuje się w ten sposób:

W ustawieniach urządzenia Bluetooth, gdy włączone jest ustawienie Dźwięk przestrzenny dla zestawu słuchawkowego, w sekcji Dźwięk przestrzenny pojawia się ustawienie Śledzenie ruchów głowy:

Rysunek 2. Dźwięk przestrzenny i ustawienie śledzenia ruchów głowy.
Ustawienie śledzenia ruchów głowy jest NIEWIDOCZNE, gdy dźwięk przestrzenny jest wyłączony.
Domyślny stan śledzenia ruchów głowy po początkowym sparowaniu zestawu słuchawkowego to włączony.
Wybrany przez użytkownika stan (włączony lub wyłączony) musi być zachowany po ponownym uruchomieniu telefonu lub po rozłączeniu i ponownym sparowaniu słuchawek.

Działanie

Raportowanie pozycji głowy

Informacje o pozycji głowy w układzie współrzędnych x, y i z, wysyłane z zestawu słuchawkowego na urządzenie z Androidem, muszą szybko i precyzyjnie odzwierciedlać ruchy głowy użytkownika.
Raportowanie pozycji głowy przez połączenie Bluetooth musi być zgodne z protokołem zdefiniowanym w HID.
Słuchawki muszą wysyłać informacje o śledzeniu ruchów głowy do telefonu z Androidem tylko wtedy, gdy użytkownik włączy śledzenie ruchów głowy w interfejsie ustawień urządzenia Bluetooth.

Wydajność

Opóźnienie

Opóźnienie śledzenia ruchów głowy to czas od ruchu głowy zarejestrowanego przez jednostkę pomiarową inercyjną (IMU) do wykrycia zmiany dźwięku spowodowanej przez ten ruch przez przetworniki słuchawek. Opóźnienie śledzenia ruchów głowy nie może przekraczać 150 ms.

Odsetek raportowania pozycji głowy

Gdy śledzenie ruchów głowy jest aktywne, zestaw słuchawkowy musi przekazywać informacje o pozycji głowy co około 20 ms. Aby uniknąć aktywacji logiki wykrywania nieaktualnych danych na telefonie podczas jittera transmisji Bluetooth, maksymalny czas między dwoma aktualizacjami nie może przekraczać 40 ms.

Optymalizacja zużycia energii

Aby zoptymalizować zużycie energii, zalecamy, aby implementacja używała mechanizmów przełączania kodeków Bluetooth i wyboru trybu opóźnienia udostępnianych przez interfejsy audio HAL i Bluetooth audio HAL.

Implementacje AOSP dotyczącego interfejsu API i poziomu Bluetooth obsługują już sygnały umożliwiające sterowanie przełączaniem kodeków. Jeśli implementacja OEM używa głównego interfejsu HAL do obsługi audio Bluetooth (tzw. tryb odciążenia kodeka), OEM musi zadbać o to, aby ten interfejs przekierowywał sygnały między interfejsem HAL audio a zbiorem Bluetooth.

Przełączanie kodeków

Gdy dynamiczny dźwięk przestrzenny i śledzenie ruchów głowy są włączone, używaj kodeka o niskiej latencji, takiego jak Opus. Podczas odtwarzania treści audio bez dźwięku przestrzennego używaj kodeka o niskim poborze mocy, takiego jak Advanced Audio Coding (AAC).

Podczas przełączania kodeków przestrzegaj tych zasad:

Śledź tylko aktywność w tych strumieniowych wyjściach HAL dźwięku:
- Specjalne dane wyjściowe procesora dźwięku przestrzennego
- strumienie mediów, takie jak głębokie buforowanie lub odtwarzanie skompresowanych danych.

Gdy wszystkie odpowiednie strumienie są nieaktywne i rozpoczyna się strumień z procesorem dźwięku przestrzennego, uruchom strumień Bluetooth z parametrem isLowLatency ustawionym na true, aby określić kodek o niskiej latencji.
Gdy wszystkie odpowiednie strumienie są nieaktywne, a strumień Bluetooth rozpoczyna się, uruchom strumień Bluetooth z ustawionym parametrem isLowLatency = false, aby określić kodek o niskim poborze mocy.
Jeśli strumień multimediów jest aktywny i rozpoczyna się strumień z przestrzennym dźwiękiem, uruchom ponownie strumień Bluetooth z ustawionym parametrem isLowLatency = true.

Zestaw słuchawkowy musi obsługiwać dekodery o niskiej latencji i małej mocy oraz implementować standardowy protokół wyboru kodeka.

Dostosowywanie trybu niskiego opóźnienia

Dostosowanie trybu opóźnienia następuje, gdy wybrany jest kodek o niskim opóźnieniu.

W zależności od tego, czy śledzenie ruchów głowy jest włączone, czy wyłączone, korekta trybu opóźnienia używa dostępnych mechanizmów do zmniejszenia lub zwiększenia opóźnienia, aby osiągnąć najlepszy kompromis między opóźnieniem, mocą i jakością dźwięku. Gdy włączony jest dźwięk przestrzenny i monitorowanie ruchów głowy, wybierany jest tryb o niskiej latencji. Gdy dźwięk przestrzenny jest włączony, a śledzenie ruchów głowy jest wyłączone, wybrany jest tryb bez opóźnień. Korekta opóźnienia zapewnia znaczne oszczędności energii i zwiększa niezawodność połączenia audio Bluetooth, gdy wymagany jest tylko dźwięk przestrzenny statyczny. Najczęstszym mechanizmem korekcji opóźnienia jest zmniejszenie lub zwiększenie rozmiaru bufora jittera w słuchawkach Bluetooth.

Aby dostosować opóźnienia w przypadku dźwięku LE, zapoznaj się z artykułem Śledzenie ruchów głowy w przypadku dźwięku LE.

Wdrożenie wysokiej jakości dźwięku przestrzennego i śledzenia ruchów głowy Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

Wytyczne dotyczące implementacji dynamicznych i statycznych trybów dźwięku przestrzennego

Implementacja interfejsu API

Interfejs użytkownika

Działanie

Formaty audio

odtwarzanie treści stereo,

Przejścia między przypadkami użycia i współbieżność

Renderowanie przez głośniki

Wskazówki dotyczące implementacji śledzenia ruchów głowy

Interfejs użytkownika

Działanie

Raportowanie pozycji głowy

Wydajność

Opóźnienie

Odsetek raportowania pozycji głowy

Optymalizacja zużycia energii

Przełączanie kodeków

Dostosowywanie trybu niskiego opóźnienia

Wdrożenie wysokiej jakości dźwięku przestrzennego i śledzenia ruchów głowy