音訊術語

此音訊相關術語表包括廣泛使用的通用術語和 Android 特定術語。有關術語的規範定義,請參閱中央Android 平台術語表

通用術語

與音訊相關的通用術語具有常規含義。

數位音訊

數位音訊術語涉及使用以數位形式編碼的音訊訊號來處理聲音。有關詳細信息,請參閱數位音訊

交流3
杜比 (Dolby) 的音訊編解碼器。有關詳細信息,請參閱杜比數字
聲學
研究聲音的機械特性,例如設備上換能器(揚聲器、麥克風等)的物理放置如何影響感知的音訊品質。
衰減
小於或等於 1.0 的乘法因子,應用於音頻訊號以降低訊號電平。比較增益
發燒友
專注於卓越音樂再現體驗的人,特別是願意為音質做出大量權衡(費用、組件尺寸、房間設計等)的人。詳情請參閱發燒友
AVB
透過乙太網路即時傳輸數位音訊的標準。有關詳細信息,請參閱音視頻橋接
每個樣本位數或位元深度
每個樣本的資訊位數。
頻道
單一音訊資訊流,通常對應於一個錄製或播放位置。
縮混
減少聲道數量,例如從立體聲改為單聲道或從 5.1 改為立體聲。透過刪除通道、混合通道或更高級的訊號處理來實現。沒有衰減或限制的簡單混合可能會出現溢出和削波。與上混音相比。
DSD
直接流數字。基於脈衝密度調變的專有音訊編碼。脈衝編碼調變 (PCM) 將波形編碼為多位單獨音訊樣本的序列,而 DSD 以非常高的取樣率(沒有取樣的概念)將波形編碼為位元序列。 PCM 和 DSD 都透過獨立的序列表示多個通道。 DSD 更適合內容分發,而不是作為處理的內部表示,因為將傳統的數位訊號處理 (DSP) 演算法應用於 DSD 可能很困難。 DSD 用於超級音訊 CD (SACD)和 USB 的 DSD over PCM (DoP)。有關詳細信息,請參閱直接流數字
鴨子
當另一個流變成活動狀態時,暫時降低一個流的音量。例如,如果通知到達時正在播放音樂,則音樂會在通知播放時閃避。對比一下靜音
先進先出
先進先出。實現資料先進先出排隊的硬體模組或軟體資料結構。在音訊上下文中,儲存在佇列中的資料通常是音訊幀。 FIFO可以透過循環緩衝區來實現。
框架
一組樣本,每個通道一個,在某個時間點。
每個緩衝區的幀數
一次從一個模組傳遞到下一個模組的幀數。音訊 HAL 介面使用每個緩衝區幀的概念。
獲得
大於或等於 1.0 的乘法因子,應用於音頻訊號以增加訊號電平。與衰減相比。
高畫質音訊
高清晰度音訊。高解析度音訊的同義詞(但不同於英特爾高清晰度音訊)。
耳機
戴在耳朵上的揚聲器,沒有麥克風。與耳機比較。
耳機
附麥克風的耳機。與耳機相比。
赫茲
採樣率或幀率的單位。
高解析度音訊
具有比 CD 更高的位元深度和取樣率(44.1 kHz 下的立體聲 16 位元 PCM),且沒有有損資料壓縮。相當於高清音訊。有關詳細信息,請參閱高解析度音訊
交錯的
多通道數位音訊的表示形式,可在通道之間交替資料。例如,以交錯格式表示的立體聲數位音訊是左、右、左、右等。
潛伏
訊號通過系統時的時間延遲。
無損的
一種無損資料壓縮演算法,可在編碼和解碼過程中保持位元精度,其中先前編碼資料的解碼結果相當於原始資料。無損音訊內容分發格式的範例包括CDWAV內的 PCM 和FLAC 。創作過程可能會降低母版的位元深度或取樣率;保留母帶的解析度和位元精度的分發格式是高解析度音訊的主題。
有損的
一種有損資料壓縮演算法,嘗試在編碼和解碼過程中保留媒體最重要的特徵,其中解碼先前編碼資料的結果在感知上與原始資料相似但不相同。有損音訊壓縮演算法的範例包括 MP3 和 AAC。由於類比值來自連續域而數位值是離散的,因此 ADC 和 DAC 是關於幅度的有損轉換。另請參閱透明度
單核白血球增多症
一個通道。
多通道
請參閱環繞音效。嚴格來說,立體聲不僅僅是一個聲道,可以被認為是多聲道。然而,這種用法是令人困惑的,因此要避免。
沉默的
暫時強制音量為零,獨立於通常的音量控制。
超限
由於未能及時接受提供的數據而導致的聲音故障。詳細資訊請參閱緩衝區欠載。與欠載相比。
平移
將訊號定向到立體聲或多通道場內的所需位置。
相變材料
脈衝編碼調變。最常見的數位音訊低階編碼。音頻訊號以規則的間隔(稱為取樣率)進行取樣,然後根據位元深度量化為特定範圍內的離散值。例如,對於 16 位元 PCM,樣本值為 -32768 和 +32767 之間的整數。
坡道
逐漸增加或減少特定音訊參數的級別,例如音量或效果強度。暫停和恢復音樂時通常會套用音量斜坡,以避免難以聽到的過渡。
樣本
表示單一頻道在某個時間點的音訊值的數字。
取樣率或幀率
每秒的幀數。雖然幀速率更準確,但取樣率通常用於表示幀速率。
可聽化
使用聲音來表達回饋或訊息,例如觸摸聲和鍵盤聲。
聲壓級
聲壓級,聲壓的相對測量值。
立體聲
兩個通道。
立體聲擴寬
應用於立體聲訊號的效果可以使另一個立體聲訊號聽起來更飽滿、更豐富。此效果也可以應用於單聲道訊號,它是一種上混類型。
環繞聲
提高聽眾感知立體聲左右聲音位置的能力的技術。
透明度
有損資料壓縮的理想結果。如果有損資料轉換在人類主體看來與原始資料無法區分,則該轉換是透明的。有關詳細信息,請參閱透明度
欠載
由於未能及時提供所需數據而導致的聲音故障。詳細資訊請參閱緩衝區欠載。與超限相比。
上混音
增加聲道數量,例如從單聲道到立體聲或從立體聲到環繞聲。透過複製、平移或更先進的訊號處理來完成。與縮混相比。
美國空軍司令部
適用於低位元率應用的音訊編解碼器。有關詳細信息,請參閱統一語音和音訊編碼
虛擬化器
嘗試空間化音訊通道的效果,例如嘗試模擬更多揚聲器或給予聲音來源具有位置的錯覺。
體積
響度,音頻訊號的主觀強度。

設備間互連

設備間互連技術連接設備之間的音訊和視訊組件,並且在外部連接器處顯而易見。 HAL 實施者和最終使用者應該了解這些術語。

藍牙
短距離無線技術。有關音訊相關的藍牙設定檔藍牙協定的詳細信息,請參閱音樂的A2DP 、電話的SCO音訊/視訊遠端控製設定檔 (AVRCP)
顯示連接埠
由視訊電子標準協會 (VESA) 制定的數位顯示介面。
加密狗
適配器是一種小裝置,尤其是掛在另一台設備上的裝置。
火線
請參閱 IEEE 1394。
HDMI
高畫質多媒體介面。用於傳輸音訊和視訊資料的介面。對於行動設備,請使用 micro-HDMI(D 型)或 MHL 連接器。
IEEE 1394
IEEE 1394也稱為 FireWire,是一種用於音訊等即時低延遲應用的序列匯流排。
英特爾HDA
英特爾高清晰度音訊(不要與通用高清晰度音訊高解析度音訊混淆)。前面板連接器規格。有關詳細信息,請參閱英特爾高清晰度音訊
介面
介面將訊號從一種表示形式轉換為另一種表示形式。常見的介麵包括USB音訊介面和MIDI介面。
線路電平
線路電平是在音頻組件(而不是感測器)之間傳遞的類比音頻訊號的強度。
多態性HL
行動高清連結。行動音訊/視訊接口,通常透過微型 USB 連接器。
電話連接器
將裝置連接到有線耳機、耳麥或線路電平擴大機的迷你或超迷你組件。
超薄端口
從 micro-USB 到 HDMI 的轉接器。
S/PDIF
索尼/飛利浦數位介面格式。用於未壓縮 PCM 和 IEC 61937 的互連。有關詳細信息,請參閱S/PDIF 。 S/PDIF 是AES3的消費級變體。
霹靂
與 USB 和 HDMI 競爭的多媒體接口,用於連接高端外圍設備。詳情請參閱迅雷
托斯連結
TOSLINK是與S/PDIF一起使用的光纖音訊線。
USB
通用序列匯流排。有關詳細信息,請參閱USB

設備內互連

設備內互連技術連接給定設備內的內部音訊組件,並且在不拆卸設備的情況下不可見。 HAL 實現者可能需要了解這些,但最終用戶不需要。有關設備內互連的詳細信息,請參閱以下文章:

ALSA 晶片上系統 (ASoC)中,這些統稱為數位音訊介面(DAI)。

音訊訊號路徑

音訊訊號路徑術語涉及音訊資料從應用程式到換能器的訊號路徑,反之亦然。

類比數位轉換器
模數轉換器。將類比訊號(時間和幅度連續)轉換為數位訊號(時間和振幅離散)的模組。從概念上講,ADC 由週期性取樣維持器和量化器組成,但不一定要以這種方式實現。 ADC 之前通常有一個低通濾波器,以消除使用所需取樣率無法表示的任何高頻成分。詳細資訊請參閱類比數位轉換器
美聯社
應用處理器。行動裝置上的主要通用計算機。
編解碼器
編碼器-解碼器。將音訊訊號從一種表示形式編碼和/或解碼為另一種表示形式(通常是模擬到 PCM 或 PCM 到類比)的模組。嚴格來說,編解碼器是為同時進行編碼和解碼的模組保留的,但可以寬鬆地僅指其中之一。詳細資訊請參閱音訊編解碼器
數位類比轉換器
數位類比轉換器。將數位訊號(時間和幅度離散)轉換為類比訊號(時間和振幅連續)的模組。通常後接一個低通濾波器,以消除數位量化引入的高頻成分。詳細資訊請參閱數位類比轉換器
數位訊號處理器
數位訊號處理器。可選組件通常位於應用處理器之後(用於輸出)或應用處理器之前(用於輸入)。主要目的是減輕應用處理器的負載並以較低的功耗提供訊號處理功能。
專案資料管理
脈衝密度調製。用於以數位訊號表示類比訊號的調變形式,其中 1 與 0 的相對密度表示訊號電平。常用於數位類比轉換器。有關詳細信息,請參閱脈衝密度調變
脈寬調製
脈衝寬度調變。用於以數位訊號表示類比訊號的調變形式,其中數位脈衝的相對寬度表示訊號電平。常用於類比數位轉換器。有關詳細信息,請參閱脈衝寬度調變
感應器
將現實世界物理量的變化轉換為電訊號。在音訊中,物理量是聲壓,換能器是揚聲器和麥克風。詳細資訊請參閱感測器

取樣率轉換

取樣率轉換術語涉及從一種取樣率轉換為另一種取樣率的過程。

下採樣
重新採樣,其中接收器採樣率 < 來源採樣率。
奈奎斯特頻率
可以由給定取樣率 1/2 的離散化訊號表示的最大頻率成分。例如,人類的聽覺範圍延伸至大約 20 kHz,因此數位音訊訊號必須具有至少 40 kHz 的取樣率才能代表該範圍。實際上,常用的取樣率為 44.1 kHz 和 48 kHz,奈奎斯特頻率分別為 22.05 kHz 和 24 kHz。有關詳細信息,請參閱奈奎斯特頻率聽力範圍
重採樣器
取樣率轉換器的同義詞。
重採樣
轉換取樣率的過程。
取樣率轉換器
重新採樣的模組。
下沉
重採樣器的輸出。
來源
輸入到重採樣器。
上採樣
重新採樣,其中接收器採樣率 > 來源採樣率。

電話

原子能委員會
聲學迴聲消除是一種減少訊號迴聲的方法。詳情請參閱迴聲抑制與消除
非國大
主動雜訊控制是一種透過主動添加不必要的輔助訊號的反相來提高主訊號品質的方法。有關詳細信息,請參閱主動噪音控制
撥號器
提供電話使用者介面的應用程式。
碳酸氫根
聽力攜帶是一種 TTY 模式,其中訊息以文字形式發送並以語音形式接收。
側音
從本地麥克風到本地聽筒的聲音回饋。有關詳細信息,請參閱側音
時分雙工
聾人電信設備是一種專為聽力或語言障礙人士提供的電傳打字機 (TTY)。
電傳打字機
電傳打字機。通常與 TDD 互換使用。
UE
用戶設備。消費者電話設備。
通用行動通訊系統
通用行動電信系統。一種移動蜂窩系統。
壓控振盪器
語音攜帶是一種 TTY 模式,其中訊息以音訊形式發送並以文字形式接收。

Android 特定術語

Android 特定術語包括僅在 Android 音訊框架中使用的術語以及在 Android 中具有特殊含義的通用術語。

阿薩斯
高級 Linux 聲音架構。 Linux 的音訊框架也影響了其他系統。有關通用定義,請參閱ALSA 。在 Android 中,ALSA 指的是內核音訊框架和驅動程序,而不是使用者模式 API。另請參見tinyalsa
音訊設備
由 HAL 實作支援的音訊 I/O 端點。
音訊效果
輸出(後處理)效果和輸入(預處理)效果的API和實現框架。此 API 定義於android.media.audiofx.AudioEffect
音訊調頻器
Android 聲音伺服器實作。 AudioFlinger 在媒體伺服器進程中運作。有關通用定義,請參閱聲音伺服器
音訊焦點
用於管理多個獨立應用程式之間的音訊互動的 API 集。有關詳細信息,請參閱管理音訊焦點以及android.media.AudioManager與焦點相關的方法和常數。
音訊混音器
AudioFlinger 中的模組負責組合多個軌道並應用衰減(音量)和效果。有關通用定義,請參閱音頻混合(錄製的音樂) (將混音器視為硬體設備或軟體應用程序,而不是系統內的軟體模組)。
音訊政策
服務負責需要先做出策略決策的所有操作,例如開啟新的 I/O 流、變更後重新路由以及流捲管理。
錄音帶
主要的低階客戶端 API,用於從音訊輸入裝置(例​​如麥克風)接收資料。數據通常是PCM格式。此 API 定義於android.media.AudioRecord
音頻重採樣器
AudioFlinger中的模組負責取樣率轉換
音訊來源
常數枚舉,指示擷取音訊輸入所需的用例。詳情請參閱音訊來源。從 API 等級 21 及更高版本開始,首選音訊屬性
音軌
主要的低階客戶端 API,用於將資料傳送到音訊輸出裝置(例如揚聲器)。數據通常是PCM格式。此 API 定義於android.media.AudioTrack
音訊實用程式
用於 PCM 格式轉換、WAV 檔案 I/O 和非阻塞 FIFO等功能的音訊實用程式庫,在很大程度上獨立於 Android 平台。
客戶
通常是應用程式或應用程式用戶端。但是,AudioFlinger 用戶端可以是在媒體伺服器系統進程內運行的線程,例如播放由 MediaPlayer 物件解碼的媒體時。
哈爾
硬體抽象層。 HAL是Android中的通用術語;在音訊中,它是 AudioFlinger 和具有 C API 的核心裝置驅動程式之間的一層(取代了 C++ libaudio)。
快速捕捉
AudioFlinger 中的線程,將音訊資料傳送到較低延遲的快速軌道,並在配置為減少延遲時驅動輸入裝置。
快速混音器
AudioFlinger 中的線程,用於接收和混合來自較低延遲快軌的音訊數據,並在配置為減少延遲時驅動主輸出裝置。
快速通道
AudioTrack 或 AudioRecord 用戶端延遲較低,但在某些裝置和路由上功能較少。
媒體播放器
比 AudioTrack 更高層級的客戶端 API。播放編碼內容或包含多媒體音訊和視訊軌道的內容。
媒體紀錄
AudioFlinger 偵錯功能僅在自訂版本中可用。用於將音訊事件記錄到循環緩衝區,然後可以在需要時追溯轉儲它們。
媒體伺服器
Android系統進程,包含媒體相關的服務,包括AudioFlinger。
NBAIO
非阻塞音訊輸入/輸出。 AudioFlinger 連接埠的抽象。該術語可能會產生誤導,因為 NBAIO API 的某些實作支援阻塞。 NBAIO 的關鍵實作針對不同類型的管道。
普通攪拌機
AudioFlinger 中的執行緒為大多數功能齊全的 AudioTrack 用戶端提供服務。直接驅動輸出設備或透過管道將其子混音輸入 FastMixer。
OpenSL ES
Khronos Group的音訊 API 標準。自 API 等級 9 起的 Android 版本支援基於OpenSL ES 1.0.1子集的本機音訊 API。
專業音訊
功能標誌android.hardware.audio.pro的縮寫。這些要求記錄在 Android CDD 的第5.10 節專業音訊中。 android.hardware.audio.pro功能中的「pro」指的是可預測的即時效能水平,而不是目標用戶。
實時(名詞),實時(形容詞)

即時計算系統保證在規定的時限內回應相關事件。設備實現對即時運算的支援是滿足上述android.hardware.audio.pro功能要求的必要條件,但不是充分條件。

即時效能在音訊以外的其他領域也有好處,例如遊戲、圖形、相機、視訊、感測器處理、虛擬實境 (VR) 和擴增實境 (AR)。

靜音模式
使用者可設定的功能可將手機鈴聲和通知靜音,而不會影響媒體播放(音樂、影片、遊戲)或鬧鐘。
聲音池
比 AudioTrack 更高層級的客戶端 API。播放採樣的音訊剪輯。對於觸發 UI 回饋、遊戲聲音等很有用。此 API 定義於android.media.SoundPool
怯場
參見媒體
狀態佇列
AudioFlinger 中的模組負責同步執行緒之間的狀態。 NBAIO 用於傳遞數據,而 StateQueue 用於傳遞控制訊息。
策略
具有相似行為的一組流類型。由音訊策略服務使用。
流類型
表示音訊輸出用例的枚舉。音訊策略實現使用流類型以及其他參數來確定音量和路由決策。有關流類型的列表,請參閱android.media.AudioManager
三通水槽
請參閱音訊調試
蒂亞爾薩
ALSA 核心之上的小型使用者模式 API,具有 BSD 授權。推薦用於 HAL 實現。
音調產生器
比 AudioTrack 更高層級的客戶端 API。播放雙音多頻 (DTMF) 訊號。有關詳細信息,請參閱雙音多頻訊號android.media.ToneGenerator上的 API 定義。
追蹤
音頻流。由 AudioTrack 或 AudioRecord API 控制。
音量衰減曲線
對於給定輸出,從通用音量指數到特定衰減因子的裝置特定映射。
體積指數
表示所需的流相對體積的無單位整數。 android.media.AudioManager的音量相關 API 以音量索引而非絕對衰減因子進行操作。