音頻術語

此音頻相關術語表包括廣泛使用的通用術語和 Android 特定術語。有關術語的規範定義,請參閱中央Android 平台詞彙表

通用條款

與音頻相關的通用術語具有常規含義。

數字音頻

數字音頻術語涉及使用以數字形式編碼的音頻信號處理聲音。有關詳細信息,請參閱數字音頻

交流3
杜比的音頻編解碼器。有關詳細信息,請參閱杜比數字
聲學
研究聲音的機械特性,例如換能器(揚聲器、麥克風等)在設備上的物理放置如何影響感知的音頻質量。
衰減
乘法因子小於或等於 1.0,應用於音頻信號以降低信號電平。比較獲得
發燒友
關注卓越音樂再現體驗的人,特別願意為音質做出重大權衡(費用、組件尺寸、房間設計等)。有關詳細信息,請參閱發燒友
AVB
通過以太網實時傳輸數字音頻的標準。有關詳細信息,請參閱音視頻橋接
每個樣本的位數或位深度
每個樣本的信息位數。
渠道
單個音頻信息流,通常對應一個錄製或播放位置。
縮混
減少通道數,例如從立體聲到單聲道或從 5.1 到立體聲。通過丟棄通道、混合通道或更高級的信號處理來完成。沒有衰減或限制的簡單混合具有溢出和削波的可能性。與上混相比
渠務署
直接流數字。基於脈衝密度調製的專有音頻編碼。脈衝編碼調製 (PCM) 將波形編碼為多個比特的單個音頻樣本序列,而 DSD 以非常高的採樣率(沒有樣本的概念)將波形編碼為比特序列。 PCM 和 DSD 都通過獨立的序列表示多個通道。 DSD 比作為處理的內部表示更適合內容分發,因為將傳統的數字信號處理 (DSP) 算法應用於 DSD 可能很困難。 DSD 用於超級音頻 CD (SACD)和用於 USB 的 DSD over PCM (DoP)。有關詳細信息,請參閱Direct Stream Digital
當另一個流變得活躍時,暫時降低一個流的音量。例如,如果在通知到達時正在播放音樂,則在播放通知時音樂會迴避。與靜音相比
先進先出
先進先出。實現數據的先進先出排隊的硬件模塊或軟件數據結構。在音頻上下文中,存儲在隊列中的數據通常是音頻幀。 FIFO可以通過循環緩衝區來實現。
框架
一組樣本,每個通道一個,在某個時間點。
每個緩衝區的幀數
一次從一個模塊傳遞到下一個模塊的幀數。音頻 HAL 接口使用每個緩衝區的幀數的概念。
獲得
大於或等於 1.0 的乘法因子,應用於音頻信號以增加信號電平。與衰減相比
高清音頻
高清音頻。高分辨率音頻的同義詞(但不同於英特爾高清音頻)。
耳機
適合耳朵的揚聲器,沒有麥克風。與耳機相比。
耳機
帶麥克風的耳機。對比耳機。
赫茲
採樣率或幀率的單位。
高分辨率音頻
比 CD 具有更高的位深度和採樣率(44.1 kHz 的立體聲 16 位 PCM)並且沒有有損數據壓縮。相當於高清音頻。有關詳細信息,請參閱高分辨率音頻
交錯的
在通道之間交替數據的多通道數字音頻的表示。例如,以交錯格式表示的立體聲數字音頻是左、右、左、右等。
潛伏
信號通過系統時的時間延遲。
無損
一種無損數據壓縮算法,可在編碼和解碼過程中保持位精度,其中對先前編碼數據的解碼結果與原始數據等效。無損音頻內容分發格式的示例包括CDWAV中的 PCM 和FLAC 。創作過程可能會降低版的位深度或採樣率;保留母帶分辨率和位精度的分發格式是高分辨率音頻的主題。
有損
一種有損數據壓縮算法,它試圖在編碼和解碼過程中保留媒體最重要的特徵,其中對先前編碼數據的解碼結果在感知上與原始數據相似但不相同。有損音頻壓縮算法的示例包括 MP3 和 AAC。由於模擬值來自連續域而數字值是離散的,因此 ADC 和 DAC 是關於幅度的有損轉換。另請參閱透明度
單核細胞增多症
一個頻道。
多通道
查看環繞聲。嚴格來說,立體聲不止一個聲道,可以認為是多聲道;但是,這種用法令人困惑,因此可以避免。
沉默的
暫時強制音量為零,獨立於通常的音量控制。
超限
由於未能在足夠的時間內接受提供的數據而導致的聲音故障。有關詳細信息,請參閱緩衝區不足。與underrun 相比
平移
將信號定向到立體聲或多聲道場中的所需位置。
PCM
脈衝編碼調製。最常見的數字音頻低級編碼。音頻信號以固定間隔(稱為採樣率)進行採樣,然後根據位深度量化為特定範圍內的離散值。例如,對於 16 位 PCM,樣本值是介於 -32768 和 +32767 之間的整數。
坡道
逐漸增加或減少特定音頻參數的電平,例如音量或效果的強度。暫停和恢復音樂時通常會應用音量漸變,以避免出現硬聲過渡。
樣本
表示單個通道在某個時間點的音頻值的數字。
採樣率或幀率
每秒幀數。雖然幀速率更準確,但採樣率通常用於表示幀速率。
聲化
使用聲音來表達反饋或信息,例如觸摸聲音和鍵盤聲音。
聲壓級
聲壓級,聲壓的相對測量。
立體聲
兩個頻道。
立體加寬
應用於立體聲信號的效果,使另一個立體聲信號聽起來更飽滿、更豐富。該效果也可以應用於單聲道信號,它是一種上混。
環繞聲
提高收聽者感知立體聲左右之外的聲音位置的能力的技術。
透明度
有損數據壓縮的理想結果。如果人類主體在感知上無法將有損數據轉換與原始數據區分開來,則有損數據轉換是透明的。有關詳細信息,請參閱透明度
欠載
由於未能在足夠的時間內提供所需數據而導致的聲音故障。有關詳細信息,請參閱緩衝區不足。比較溢出
上混
增加聲道數,例如從單聲道到立體聲或從立體聲到環繞聲。通過複製、平移或更高級的信號處理來完成。與縮混相比
美國空軍司令部
用於低比特率應用的音頻編解碼器。有關詳細信息,請參閱統一語音和音頻編碼
虛擬器
嘗試空間化音頻通道的效果,例如嘗試模擬更多揚聲器或給出聲源具有位置的錯覺。
體積
響度,音頻信號的主觀強度。

設備間互連

設備間互連技術連接設備之間的音頻和視頻組件,並且在外部連接器處很容易看到。 HAL 實施者和最終用戶應了解這些條款。

藍牙
短距離無線技術。有關音頻相關的藍牙配置文件藍牙協議的詳細信息,請參閱音樂的A2DP 、電話的SCO音頻/視頻遠程控製配置文件 (AVRCP)
顯示端口
視頻電子標準協會 (VESA) 的數字顯示接口。
加密狗
加密狗是一種小工具,尤其是掛在另一台設備上的小工具。
火線
見 IEEE 1394。
HDMI
高清多媒體接口。用於傳輸音頻和視頻數據的接口。對於移動設備,使用微型 HDMI(D 型)或 MHL 連接器。
IEEE 1394
IEEE 1394 ,也稱為 FireWire,是一種用於實時低延遲應用(如音頻)的串行總線。
英特爾 HDA
英特爾高清音頻(不要與通用高清音頻高分辨率音頻混淆)。前面板連接器規範。有關詳細信息,請參閱英特爾高保真音頻
界面
接口將信號從一種表示形式轉換為另一種表示形式。常用接口包括USB音頻接口和MIDI接口。
線級
線路電平是在音頻組件而不是換能器之間傳遞的模擬音頻信號的強度。
MHL
移動高清鏈接。移動音頻/視頻接口,通常通過微型 USB 連接器。
電話連接器
將設備連接到有線耳機、耳機或線路電平放大器的迷你或超迷你組件。
纖薄端口
從微型 USB 到 HDMI 的適配器。
S/PDIF
索尼/飛利浦數字接口格式。未壓縮 PCM 和 IEC 61937 的互連。有關詳細信息,請參閱S/PDIF 。 S/PDIF 是AES3的消費級變體。
霹靂
在連接高端外圍設備方面與 USB 和 HDMI 競爭的多媒體接口。有關詳細信息,請參閱迅雷
TOSLINK
TOSLINK是一種與S/PDIF一起使用的光纖音頻電纜。
USB
通用串行總線。有關詳細信息,請參閱USB

設備內互連

設備內互連技術連接給定設備內的內部音頻組件,並且在不拆卸設備的情況下是不可見的。 HAL 實施者可能需要知道這些,但最終用戶不需要。設備內互聯的詳細介紹請參考以下文章:

ALSA 片上系統 (ASoC)中,這些統稱為數字音頻接口(DAI)。

音頻信號路徑

音頻信號路徑術語與音頻數據從應用程序到換能器的信號路徑有關,反之亦然。

ADC
模數轉換器。將模擬信號(時間和幅度連續)轉換為數字信號(時間和幅度離散)的模塊。從概念上講,ADC 由一個週期性採樣保持和一個量化器組成,儘管它不必以這種方式實現。 ADC 之前通常有一個低通濾波器,以去除使用所需採樣率無法表示的任何高頻分量。有關詳細信息,請參閱模數轉換器
美聯社
應用處理器。移動設備上的主要通用計算機。
編解碼器
編碼器-解碼器。將音頻信號從一種表示編碼和/或解碼為另一種表示的模塊(通常是模擬到 PCM 或 PCM 到模擬)。嚴格來說,編解碼器是為既編碼又解碼的模塊保留的,但可以鬆散地用於僅指其中之一。有關詳細信息,請參閱音頻編解碼器
數模轉換器
數模轉換器。將數字信號(時間和幅度離散)轉換為模擬信號(時間和幅度連續)的模塊。通常後跟一個低通濾波器以去除由數字量化引入的高頻分量。有關詳細信息,請參閱數模轉換器
數字信號處理器
數字信號處理器。可選組件通常位於應用處理器之後(用於輸出)或應用處理器之前(用於輸入)。主要目的是減輕應用處理器的負載並以較低的功耗提供信號處理功能。
PDM
脈衝密度調製。用於用數字信號表示模擬信號的調製形式,其中 1s 與 0s 的相對密度表示信號電平。通常由數模轉換器使用。有關詳細信息,請參閱脈衝密度調製
脈寬調製
脈衝寬度調製。用於以數字信號表示模擬信號的調製形式,其中數字脈衝的相對寬度表示信號電平。通常由模數轉換器使用。有關詳細信息,請參閱脈衝寬度調製
傳感器
將物理真實世界量的變化轉換為電信號。在音頻中,物理量是聲壓,換能器是揚聲器和麥克風。有關詳細信息,請參閱傳感器

採樣率轉換

採樣率轉換術語涉及從一種採樣率轉換為另一種採樣率的過程。

下採樣
重採樣,其中接收器採樣率 < 源採樣率。
奈奎斯特頻率
可以用給定採樣率的 1/2 的離散化信號表示的最大頻率分量。例如,人類的聽覺範圍擴展到大約 20 kHz,因此數字音頻信號必須具有至少 40 kHz 的採樣率才能表示該範圍。在實踐中,通常使用 44.1 kHz 和 48 kHz 的採樣率,奈奎斯特頻率分別為 22.05 kHz 和 24 kHz。有關詳細信息,請參閱奈奎斯特頻率聽力範圍
重採樣器
採樣率轉換器的同義詞。
重採樣
轉換採樣率的過程。
採樣率轉換器
重新採樣的模塊。
下沉
重採樣器的輸出。
資源
重採樣器的輸入。
上採樣
重新採樣,其中接收器採樣率 > 源採樣率。

電話

AEC
聲學迴聲消除是一種減少信號迴聲的方法。有關詳細信息,請參閱迴聲抑制和消除
非國大
主動噪聲控制是一種通過主動添加不需要的輔助信號的反相來提高主信號質量的方法。有關詳細信息,請參閱主動噪聲控制
撥號器
為電話提供用戶界面的應用程序。
碳酸氫鈉
Hearing Carry-Over 是一種 TTY 模式,其中消息以文本形式發送並以語音形式接收。
側音
從本地麥克風到本地聽筒的聲音反饋。有關詳細信息,請參閱側音
TDD
聾人電信設備是一種特殊的電傳打字機 (TTY),適用於聽力或語言受損的人。
TTY
電傳打字機。通常與 TDD 互換使用。
用戶設備
用戶設備。消費者電話設備。
UMTS
通用移動電信系統。一種移動蜂窩系統。
壓控振盪器
Voice Carry-Over 是一種 TTY 模式,其中消息以音頻形式發送並以文本形式接收。

Android 特定條款

Android 特定術語包括僅在 Android 音頻框架中使用的術語和在 Android 中具有特殊含義的通用術語。

肌萎縮側索硬化症
高級 Linux 聲音架構。 Linux 的音頻框架,它也影響了其他系統。有關通用定義,請參閱ALSA 。在 Android 中,ALSA 指的是內核音頻框架和驅動程序,而不是用戶模式 API。另見tinyalsa
音頻設備
由 HAL 實現支持的音頻 I/O 端點。
音效
用於輸出(後處理)效果和輸入(預處理)效果的 API 和實現框架。 API 在android.media.audiofx.AudioEffect中定義。
AudioFlinger
Android 聲音服務器實現。 AudioFlinger 在 mediaserver 進程中運行。有關通用定義,請參閱聲音服務器
音頻焦點
一組用於管理跨多個獨立應用程序的音頻交互的 API。詳情請參閱管理音頻焦點以及android.media.AudioManager的焦點相關方法和常量。
混音器
AudioFlinger 中的模塊負責組合多個音軌並應用衰減(音量)和效果。對於一般定義,請參閱音頻混合(錄製的音樂) (將混音器討論為硬件設備或軟件應用程序,而不是系統內的軟件模塊)。
音頻政策
負責需要首先做出策略決策的所有操作的服務,例如打開新的 I/O 流、更改後重新路由和流捲管理。
錄音帶
用於從音頻輸入設備(例如麥克風)接收數據的主要低級客戶端 API。數據通常是 PCM 格式。 API 在android.media.AudioRecord中定義。
音頻重採樣器
AudioFlinger 中負責採樣率轉換的模塊。
音源
表示捕獲音頻輸入的所需用例的常量枚舉。有關詳細信息,請參閱音頻源。從 API 級別 21 及更高級別開始,首選音頻屬性
音軌
用於將數據發送到音頻輸出設備(如揚聲器)的主要低級客戶端 API。數據通常為 PCM 格式。 API 在android.media.AudioTrack中定義。
音頻工具
用於 PCM 格式轉換、WAV 文件 I/O 和非阻塞 FIFO等功能的音頻實用程序庫,它在很大程度上獨立於 Android 平台。
客戶
通常是應用程序或應用程序客戶端。但是,AudioFlinger 客戶端可以是在 mediaserver 系統進程中運行的線程,例如在播放由 MediaPlayer 對象解碼的媒體時。
哈爾
硬件抽象層。 HAL是Android中的通用術語;在音頻中,它是 AudioFlinger 和內核設備驅動程序之間的一個層,帶有一個 C API(它取代了 C++ libaudio)。
快速捕獲
AudioFlinger 中的線程將音頻數據發送到較低延遲的快速軌道,並在配置為減少延遲時驅動輸入設備。
快速混合器
AudioFlinger 中的線程,用於接收和混合來自較低延遲快速軌道的音頻數據,並在配置為減少延遲時驅動主輸出設備。
快車道
AudioTrack 或 AudioRecord 客戶端具有較低的延遲,但在某些設備和路由上的功能較少。
媒體播放器
比 AudioTrack 更高級別的客戶端 API。播放編碼內容或包含多媒體音頻和視頻軌道的內容。
媒體日誌
AudioFlinger 調試功能僅在自定義版本中可用。用於將音頻事件記錄到循環緩衝區,然後可以在需要時追溯轉儲。
媒體服務器
包含媒體相關服務的Android系統進程,包括AudioFlinger。
NBAIO
非阻塞音頻輸入/輸出。 AudioFlinger 端口的抽象。該術語可能會產生誤導,因為 NBAIO API 的某些實現支持阻塞。 NBAIO 的關鍵實現是針對不同類型的管道。
普通攪拌機
AudioFlinger 中的線程,為大多數功能齊全的 AudioTrack 客戶端提供服務。直接驅動輸出設備或通過管道將其子混音輸入 FastMixer。
OpenSL ES
The Khronos Group 的音頻 API 標準。自 API 級別 9 起的 Android 版本支持基於OpenSL ES 1.0.1子集的本機音頻 API。
專業音頻
功能標誌android.hardware.audio.pro的縮寫。 Android CDD 的第5.10 節專業音頻中記錄了這些要求。特性android.hardware.audio.pro中的“pro”指的是可預測的實時性能水平,而不是目標用戶。
即時的

實時計算系統保證在要求的時限內對相關事件做出響應。對實時計算的設備實現支持是滿足上述android.hardware.audio.pro功能要求的必要但不充分的先決條件。

實時性能在音頻之外的其他領域也有好處,例如游戲、圖形、相機、視頻、傳感器處理、虛擬現實 (VR) 和增強現實 (AR)。

靜音模式
用戶可設置的功能可將電話鈴聲和通知靜音,而不影響媒體播放(音樂、視頻、遊戲)或鬧鐘。
聲池
比 AudioTrack 更高級別的客戶端 API。播放採樣的音頻剪輯。用於觸發 UI 反饋、遊戲聲音等。API 定義在android.media.SoundPool中。
怯場
請參閱媒體
狀態隊列
AudioFlinger 中的模塊負責在線程之間同步狀態。 NBAIO 用於傳遞數據,而 StateQueue 用於傳遞控制信息。
戰略
具有相似行為的流類型組。由音頻策略服務使用。
流類型
表示音頻輸出用例的枚舉。音頻策略實現使用流類型以及其他參數來確定音量和路由決策。有關流類型的列表,請參閱android.media.AudioManager
三通水槽
請參閱音頻調試
蒂亞爾薩
具有 BSD 許可證的 ALSA 內核之上的小型用戶模式 API。推薦用於 HAL 實現。
音調發生器
比 AudioTrack 更高級別的客戶端 API。播放雙音多頻 (DTMF) 信號。詳情請參考android.media.ToneGeneratorDual-tone 多頻信令和 API 定義。
追踪
音頻流。由 AudioTrack 或 AudioRecord API 控制。
音量衰減曲線
從通用體積指數到給定輸出的特定衰減因子的設備特定映射。
體積指數
表示流的所需相對體積的無單位整數。 android.media.AudioManager的音量相關 API 以音量指數而不是絕對衰減因子運行。