Android 10 meningkatkan pengalaman pengguna yang memerlukan lebih dari satu perekaman audio aktif untuk terjadi secara bersamaan, misalnya, jika pengguna ingin mengontrol panggilan VoIP atau perekam video dengan perintah suara yang disediakan oleh layanan aksesibilitas.
Framework audio menerapkan kebijakan yang hanya mengizinkan aplikasi dengan hak istimewa tertentu untuk merekam secara bersamaan dengan aplikasi reguler.
Kebijakan serentak diterapkan dengan membisukan audio yang direkam, bukan dengan mencegah aplikasi memulai perekaman. Hal ini memungkinkan framework secara dinamis mengatasi perubahan jumlah dan jenis kasus penggunaan perekaman aktif, tanpa mencegah aplikasi mulai merekam jika dapat memulihkan akses penuh ke mikrofon setelah aplikasi lain selesai merekam.
Konsekuensinya untuk HAL audio dan subsistem audio adalah keduanya harus mendukung beberapa streaming input aktif secara bersamaan, meskipun dalam beberapa kasus, hanya satu streaming yang menyediakan audio non-bisu ke klien aktif.
Persyaratan CDD
Lihat CDD untuk mengetahui persyaratan dukungan pengambilan serentak.
Merekam situasi dari HAL audio
Skenario pengambilan serentak dapat menghasilkan situasi yang berbeda dalam hal jumlah streaming input aktif, pemilihan perangkat input, atau konfigurasi prapemrosesan.
Serentak dapat terjadi antara hal berikut:
- Beberapa aliran input dari prosesor aplikasi (AP)
- Streaming input dan panggilan suara
- Streaming input dan DSP audio yang menerapkan deteksi frasa pengaktif daya rendah
Aktivitas serentak aliran input AP
File konfigurasi kebijakan audio audio_policy_configuration.xml
digunakan oleh framework
audio untuk menentukan jumlah streaming input yang dapat dibuka dan aktif secara bersamaan.
Minimal, HAL audio harus mendukung setidaknya satu instance dari setiap profil
input (mixPort
dari peran sink
) yang tercantum dalam file konfigurasi
yang terbuka dan aktif.
Pemilihan perangkat
Saat beberapa klien aktif dilampirkan ke aliran input HAL yang sama, framework akan memilih perangkat yang sesuai untuk aliran input ini berdasarkan prioritas kasus penggunaan.
Jika beberapa aliran input aktif, setiap aliran dapat memiliki pemilihan perangkat yang berbeda.
Jika teknologi tersebut kompatibel, sebaiknya HAL dan subsistem audio mengizinkan streaming yang berbeda untuk diambil dari perangkat yang berbeda, seperti headset Bluetooth dan mikrofon bawaan.
Jika ada inkompatibilitas (misalnya, dua perangkat memiliki antarmuka audio digital atau backend yang sama), HAL audio harus memilih streaming mana yang mengontrol pemilihan perangkat.
Dalam hal ini:
- Status yang dihasilkan harus konsisten dan menawarkan pemilihan perangkat yang sama saat skenario yang sama diulang.
- Saat status serentak berakhir, streaming aktif yang tersisa harus dirutekan ke perangkat yang awalnya diminta di streaming ini.
Jika urutan prioritas ditentukan oleh HAL audio di antara kasus penggunaan aktif, ikuti urutan yang sama seperti
yang ditemukan di source_priority()
di
frameworks/av/services/audiopolicy/common/include/policy.h
Pemilihan pra-pemrosesan
Framework audio dapat meminta prapemrosesan pada aliran input menggunakan
metode HAL addEffect()
atau removeEffect()
.
Untuk prapemrosesan pada streaming input tertentu, framework audio hanya mengaktifkan konfigurasi yang sesuai dengan kasus penggunaan aktif prioritas tertinggi di streaming input. Namun, mungkin ada beberapa tumpang-tindih selama aktivasi dan penonaktifan kasus penggunaan, yang menyebabkan dua proses aktif serentak (misalnya, dua instance echo canceller) berjalan di aliran input yang sama. Dalam hal ini, implementasi HAL memilih permintaan mana yang diterima; implementasi ini melacak permintaan aktif dan memulihkan status yang benar saat salah satu proses dinonaktifkan.
Saat beberapa aliran pengambilan aktif secara bersamaan, permintaan prapemrosesan yang berbeda mungkin berjalan di aliran yang berbeda.
Implementasi subsistem audio dan HAL harus memungkinkan prapemrosesan yang berbeda diterapkan ke streaming yang berbeda, meskipun keduanya menggunakan perangkat input yang sama. Artinya, prapemrosesan harus diterapkan setelah melakukan demux streaming dari sumber pengambilan utama.
Jika tidak memungkinkan karena alasan teknis pada subsistem audio tertentu, HAL audio harus menerapkan aturan prioritas yang mirip dengan yang tercantum dalam Pemilihan perangkat.
Panggilan suara dan perekaman serentak dari AP
Perekaman dari AP dapat terjadi saat panggilan suara aktif. Situasi ini bukanlah hal baru di Android 10 dan tidak terkait langsung dengan fitur pengambilan serentak, tetapi sebaiknya sebutkan panduan untuk skenario ini.
Dua jenis pengambilan yang berbeda dari AP diperlukan selama panggilan.
Merekam RX dan TX panggilan
Merekam RX dan TX panggilan dipicu oleh penggunaan sumber audio
AudioSource.VOICE_UPLINK
atau AudioSource.VOICE_DOWNLINK
, dan/atau perangkat
AudioDevice.IN_TELEPHONY_RX
.
HAL audio harus diekspos di profil input (mixPort
dari peran sink
)
dengan rute yang tersedia dari perangkat AudioDevice.IN_TELEPHONY_RX
.
Saat panggilan terhubung (mode audio adalah AudioMode.IN_CALL
), Anda seharusnya dapat
memiliki setidaknya satu streaming pengambilan aktif dari perangkat AudioDevice.IN_TELEPHONY_RX
.
Merekam dari perangkat input saat panggilan aktif
Saat panggilan aktif (mode audio adalah AudioMode.IN_CALL
), Anda dapat
membuka dan mengaktifkan aliran input dari AP seperti yang ditentukan di bagian
Aktivitas serentak aliran input AP.
Namun, prioritas untuk pemilihan perangkat dan prapemrosesan harus selalu didorong oleh panggilan suara jika terjadi konflik dengan permintaan dari aliran input AP.
Perekaman serentak dari DSP dan AP
Jika subsistem audio berisi DSP yang mendukung konteks audio daya rendah atau fungsi deteksi
hotword, penerapannya harus mendukung pengambilan serentak dari AP dan DSP audio.
Hal ini mencakup pengambilan oleh DSP selama fase deteksi awal dan pengambilan oleh AP
dengan AudioSource.HOTWORD
setelah deteksi dipicu oleh DSP.
Hal ini akan tercermin oleh flag pengambilan serentak yang dilaporkan oleh HAL pemicu suara melalui
deskripsi implementasi: ISoundTriggerHw.Properties.concurrentCapture = true
.
HAL audio juga harus mengekspos dan memasukkan profil khusus untuk pengambilan kata panas yang diidentifikasi oleh
tanda AudioInputFlag.HW_HOTWORD
. Implementasi harus mendukung pembukaan dan
pengaktifan sejumlah streaming di profil ini setidaknya sama dengan jumlah model suara yang
dapat dimuat secara serentak oleh HAL pemicu suara.
Perekaman dari profil input ini dapat dilakukan saat profil input lainnya aktif.
Implikasi untuk penerapan Asisten
Persyaratan penggunaan data dan notifikasi pengguna
Karena penggunaan mikrofon serentak, jika disalahgunakan, dapat membocorkan data pribadi pengguna, kami memerlukan kondisi dan jaminan berikut untuk diterapkan ke aplikasi bawaan dengan hak istimewa yang meminta untuk memegang peran Asisten.
- Data yang dikumpulkan melalui mikrofon tidak boleh keluar dari perangkat kecuali jika pengguna berinteraksi dengan Asisten. Misalnya, setelah kata kunci dipicu.
- Aplikasi yang mendengarkan secara serentak harus memberikan isyarat visual kepada pengguna setelah kata panas terdeteksi. Hal ini membantu pengguna memahami bahwa percakapan lebih lanjut akan melalui aplikasi yang berbeda, seperti Asisten.
- Pengguna harus dapat menonaktifkan mikrofon atau pemicu Asisten.
- Saat rekaman audio disimpan, pengguna harus dapat mengakses, meninjau, dan menghapus rekaman kapan saja.
Peningkatan fungsi untuk Android 10
Asisten tidak saling memblokir
Di Android 9 atau yang lebih lama, jika ada dua Asisten yang selalu aktif di perangkat, hanya satu di antaranya yang dapat memproses kata kuncinya. Oleh karena itu, perlu beralih antara kedua Asisten. Di Android 10, Asisten default dapat mendengarkan secara serentak dengan Asisten lainnya. Hal ini menghasilkan pengalaman yang jauh lebih lancar bagi pengguna dengan kedua Asisten.
Aplikasi yang membuat mikrofon tetap aktif
Saat aplikasi seperti Shazam atau Waze menahan mikrofon terbuka, Asisten default masih dapat mendengarkan frasa pengaktif.
Untuk aplikasi Asisten non-default, tidak ada perubahan perilaku untuk Android 10.
Contoh implementasi HAL audio
Contoh implementasi HAL audio yang mematuhi panduan dalam dokumen ini dapat ditemukan di AOSP.