Interfejs API usługi interakcji głosowej zapewnia abstrakcję różnych potencjalnych aplikacji sterowania głosem. Implementacje można tworzyć zgodnie ze wskazówkami opisanymi w artykule o programowaniu aplikacji. Treść tego przewodnika po integracji opisuje, jak zintegrować te aplikacje z konkretnego obrazu systemu operacyjnego Android Automotive (AAOS).
Terminologia
W tym przewodniku używamy tych terminów:
- Dane wspomagające. Po rozpoczęciu sesji interakcji głosowej
system może rejestrować wyświetlenia i zrzuty ekranu oraz przekazywać
do sesji. Aplikacje mogą udostępniać dodatkowe informacje, implementując interfejsy
Activity#onProvideAssistData()
iActivity#onProvideAssistContent()
. - Tryb mówienia (PTT). Przycisk sterowania głosem, zwykle na kierownicy.
- RecognitionService (RS). Usługa rozpoznawania głosu używana przez aplikacje za pomocą interfejsu API
SpeechRecognizer
. VIA muszą zawierać zarównoVoiceInteractionService
, jak iRecognitionService
. - Dotknij, by rozmawiać (TTT). Przycisk sterowania głosem (zwykle w ramach interfejsu systemu). W Androidzie jest to też nazywane gesturem asystenta.
VoiceInteractionService
. Uproszczona usługa systemowa zaimplementowana przez programistę VIA. Wybrana usługa jest powiązana z usługą systemową podczas uruchamiania i jest zawsze uruchomiona.- VoiceInteractionSession (VIS). Ta klasa zawiera logikę biznesową dotyczącą interakcji z użytkownikiem. Odpowiada za zaprezentowanie użytkownikowi stan interakcji głosowej, obsługi żądań VoiceInteractor i odbierania danych wspomagających i zrzutów ekranu.
- VoiceInteractionSessionService (VSS). Usługa będąca częścią VIA, odpowiedzialna za obsługę sesji interakcji głosowej. Ta usługa jest powiązana
z usługi systemowej Androida podczas interakcji głosowej z użytkownikiem. Cała logika biznesowa tej sesji jest zaimplementowana w klasie
VoiceSession
. Ta usługa jest gwarantowana tylko podczas sesji głosowej z jednym użytkownikiem. - Aplikacja Interakcja głosowa (VIA). Zaprojektowana aplikacja na Androida
służy do sterowania głosem (nazywanym asystentem). Te aplikacje mogą
można rozpoznać po umieszczeniu w pliku manifestu elementu
VoiceInteractionService
. W systemie można jednocześnie wybrać tylko jedną z tych aplikacji jako domyślną. Tylko aplikacja domyślna będzie utrzymywać połączenie (powiązana z usługą systemową) i będzie odbiornikiem zdarzeń Push-To-Talk (PTT) lub Tap-To-Talk (TTT).
Obowiązki
Tabela przedstawia obowiązki każdej ze stron.
producenci samochodów (OEM), | AOSP | Deweloperzy aplikacji |
---|---|---|
|
|
|
Wymagania dotyczące UX
Producenci urządzeń oryginalnych ponoszą ostateczną odpowiedzialność za zapewnienie klientom dobrych wrażeń. Producenci OEM muszą zadbać o to, aby wszystkie wstępnie zainstalowane usługi interakcji głosowej spełniały wymagania opisane w wstępnie zainstalowanych asystentach: wskazówki dotyczące UX.
Podstawowe funkcje Asystenta
Aplikacja do interakcji głosowej w samochodach (VIA) wykonuje te czynności:
- [MUSISZ] Reagować na aktywatory interakcji głosowych obsługiwane przez system (PTT, TTT).
- [MUSISZ] wyświetlać wizualizację postępów (np. słuchanie, przetwarzania i realizowania zamówień).
- [MUSZĄ] Użyć głosu lub dźwięków, aby pokazać, że użytkownik zrozumie i zakończy rozmowę. żądań.
- [MUSISZ] używać jako modułu rozpoznawania mowy w innych aplikacjach (zobacz Speechrozpoznar API).
- [SHOULD] Odpowiedź na słowo-klucz.
- [MAJ] Wyświetla działanie związane z ustawieniami, w którym użytkownicy mogą skonfigurować ten interfejs VIA (na przykład uprawnienia, konfigurację słowa-klucza i logowanie).
- [MAY] Obsługa danych pomocy (
Intent#ACTION_ASSIST
) - [MAJ] Obsługa interakcji głosowych z klawiaturą (ekran blokady).
Komponenty
Ogólnie rzecz biorąc, aplikacja do interakcji głosowej wchodzi w interakcje z tymi podmiotami:
Rysunek 1. Użytkownicy, którzy wykonali interakcję głosową
Szczegóły:
VoiceInteractionManagerService
Ta usługa systemowa jest odpowiedzialna za zarządzanie domyślnym interfejsem VIA i udostępnianie jego działania pozostałym użytkownikom systemu.RecognitionService
Ta usługa udostępnia rozpoznawanie mowy możliwości innych aplikacji w systemie.SoundTrigger
Implementuje zarządzanie słowami kluczowymi dostępne w VIA przy użyciu funkcji AlwaysOnHotwordDetector.MediaRecorder
Zapewnia dostęp do wejścia audio wykrywanie słowa-klucza (w przypadku korzystania z procesora) i rozpoznawania mowy.PhoneWindowManager
/CarInputService
. Te które odpowiadają między innymi za obsługę kluczowych zdarzeń, PTT na VIA przy użyciu:VoiceInteractionManagerService
.User
Użytkownik wchodzi w interakcję z interfejsem VIA za pomocą reguł (PTT, TTT, słowo-klucz) lub interfejsu Voice Plate.- CarService, Notifications, Media, Telephony, ContactsProvider itd. Usługi i aplikacje używane przez VoiceInteractionSession do wykonywać polecenia użytkownika.
Pojęcia związane z motoryzacją
AAOS różni się od Androida pod tym względem:
- Poza zwykłymi funkcjami Asystenta AAOS VIA może sterować pojazdem (na przykład ogrzewania/wentylacji/klimatyzacji, foteli i oświetlenia wnętrza). Te funkcje można zintegrować przy użyciu interfejsu API CarpropertyManager (więcej informacji znajdziesz w artykule Przeczytaj właściwości pojazdu), dostawcy OEM prawidłowo skonfigurowali dostęp zgodnie z opisem w Dodawanie uprawnień z podwyższonymi uprawnieniami –
- Dostosowywanie i spójność są ważniejsze w branży motoryzacyjnej niż na innym formacie. Aby dowiedzieć się więcej o wdrażaniu tych wytycznych, zapoznaj się z artykułem Dostosowywanie.