オーディオ用語

このオーディオ関連の用語集では、広く使用される一般的な用語および Android 固有の用語について説明します。

一般的な用語

慣習的な意味合いを持つ、一般的なオーディオ関連の用語です。

デジタル オーディオ

デジタル オーディオとは、デジタル形式でエンコードされたオーディオ信号による音声処理を指します。詳しくは、デジタル オーディオをご覧ください。

音響
デバイス上のトランスデューサ(スピーカー、マイクなど)の物理的な配置が、人の耳に届く音質にどのように影響するかなどといった、音の機械的な特性。
減衰
信号レベルを下げるためにオーディオ信号に対して適用される 1.0 以下の乗法係数。対照的なものとして、ゲインがあります。
オーディオマニア
よい音の追求を趣味とする人々のこと。特に、よりよい音質を実現するためにかかる費用や設置する機器の規模、部屋の設計などを惜しまない愛好家を指します。詳しくは、オーディオマニアをご覧ください。
サンプルあたりのビット数またはビット深度
1 つのサンプルあたりの情報のビット数。
チャンネル
オーディオ情報の単一のストリームで、通常は録音または再生の入出力の単位を指す。
ダウンミックス
ステレオからモノラルへ、または 5.1 チャンネルからステレオへといったように、チャンネルの数を減らす作業のこと。チャンネルのドロップ、チャンネルのミキシング、またはより高度な信号処理によって行います。減衰または制限を設定せずにダウンミックスを行うと、オーバーフローやクリッピングが発生する可能性があります。対照的なものとして、アップミックスがあります。
DSD
ダイレクト ストリーム デジタルの略。パルス密度変調に基づく独自のオーディオ エンコーディング。パルス符号変調(PCM)は複数ビットの個別のオーディオ サンプルのシーケンスとして波形をエンコードしますが、DSD は非常に高いサンプルレートで(サンプリングの概念なしで)ビットのシーケンスとして波形をエンコードします。PCM と DSD は、どちらも独立したシーケンスによって複数のチャンネルを表します。従来のデジタル信号処理(DSP)アルゴリズムを DSD に適用することは困難であるため、DSD は処理の内部表現よりもコンテンツ配信に適しています。DSD は、Super Audio CD(SACD)および USB の DSM over PCM(DoP)に使用されます。詳しくは、ダイレクト ストリーム デジタルをご覧ください。
ダッキング
別のストリームがアクティブになった際に、ストリームの音量を一時的に小さくすること。たとえば、音楽を再生している際に通知を受け取った場合などには、通知音の再生中に音楽がダッキングされます。対照的なものとしてミュートがあります。
FIFO
ファイフォ(先入れ先出し)の略。データのファイフォ(先入れ先出し)によるキューイングを実装するハードウェア モジュールまたはソフトウェアのデータ構造。オーディオ関連の場合、キューに格納されるデータは通常オーディオ フレームです。FIFO は、リングバッファで実装されます。
フレーム
ある時点での 1 つのチャンネルに対する 1 つのサンプルのセット。
バッファあたりのフレーム数
あるモジュールから次のモジュールに一度に渡されるフレームの数。オーディオ HAL インターフェースでは、バッファごとのフレームという概念が用いられます。
ゲイン
信号レベルを上げるためにオーディオ信号に対して適用される 1.0 以上の乗法係数。対照的なものとして、減衰があります。
HD オーディオ
高音質オーディオ。ハイ レゾリューション オーディオと同義ですが、インテル ハイデフィニション オーディオとは異なります。
Hz(ヘルツ)
サンプルレートまたはフレームレートの単位。
ハイ レゾリューション オーディオ
CD(44.1 kHz のステレオ 16 ビット PCM)よりも大きなビット深度とサンプルレートを持つ、非可逆データ圧縮なしのオーディオ形式。HD オーディオと同等です。詳しくは、ハイ レゾリューション オーディオをご覧ください。
レイテンシ
信号がシステムを通過する際の時間の遅延。
ロスレス
エンコードおよびデコード全体でビット精度を維持するロスレス データ圧縮アルゴリズムのことを指し、エンコードされたデータのデコード結果は元のデータと同等となります。ロスレス オーディオ コンテンツの配信形式の例としては、CDWAV 内の PCM、および FLAC があります。オーサリング プロセスにより、ビット深度またはサンプルレートがマスターのビット深度またはサンプルレートから減少する可能性があります。なお、マスターの解像度とビット精度を維持する配信フォーマットの使用は、ハイ レゾリューション オーディオの主要な要件です。
損失
エンコーディング時とデコーディング時に、メディアの最も重要な特徴を維持しようとする非可逆圧縮アルゴリズム。エンコードされたデータのデコード結果は、元のデータと知覚的に類似していながらも同一にはなりません。非可逆音声圧縮アルゴリズムの例としては、MP3 や AAC があります。アナログ値は連続信号であり、デジタル値は離散信号であるため、ADC と DAC は振幅に関して損失が多い変換方法です。関連項目として、透明性についてもご覧ください。
モノラル
単一のチャンネル。
マルチチャンネル
サラウンド音声をご覧ください。厳密に言えば、ステレオも 1 つ以上のチャンネルであるため、マルチチャンネルと見なすことができます。ただし、混乱を招くためこのようには呼びません。
ミュート
通常の音量調節を使わず、一時的に音量をゼロにします。
オーバーラン
一定の時間内に、提供されたデータが受け入れられなかったために聞こえるグリッチ。詳しくは、バッファ アンダーランをご覧ください。対照的なものとして、アンダーランがあります。
パンニング
ステレオまたはマルチチャンネル フィールド内の目的の位置に信号を送ります。
PCM
パルス符号変調。デジタル オーディオにおいて、最も一般的かつ低水準のエンコード。オーディオ信号は、サンプルレートと呼ばれる一定の間隔でサンプリングされ、ビット深度に応じて特定の範囲内の離散値に量子化されます。たとえば、16 ビット PCM の場合、サンプル値は-32768 から +32767 までの整数です。
ランプ
音量やエフェクトの強さなど、特定のオーディオ パラメータのレベルを徐々に上げたり下げたりします。音量のランプは、一般的に音楽の一時停止および再開時に適用され、耳に聞こえる極端なトランジションを回避します。
サンプル
ある時点での単一チャンネルのオーディオ値を表す数値。
サンプルレートまたはフレームレート
1 秒あたりのフレーム数。フレームレートと呼ぶほうがより正確ですが、一般にはフレームレートをサンプルレートと呼びます。
ソニフィケーション
タッチ サウンドやキーボード サウンドなど、フィードバックまたはなんらかの情報を表すためにサウンドを使用すること。
ステレオ
2 つのチャンネル。
ステレオ ワイドニング
より深く豊かなサウンドのステレオ信号を作成するためにステレオ信号に適用するオーディオ効果。エフェクトは、アップミックスの一種であるモノラル信号にも適用できます。
サラウンド音声
リスナーが、ステレオ サウンドの左右だけでなく前後などからも音の位置を認識できるようにするための技術。
透過性
非可逆データ圧縮の理想的な結果。非可逆のデータ変換を行っても、リスナーが知覚的に元のデータと変換後の音を区別できない場合、これは透過的であると言えます。詳しくは、透過性をご覧ください。
アンダーラン
一定の時間内に必要なデータを提供できなかったために聞こえるグリッチ。詳しくは、バッファ アンダーランをご覧ください。対照的なものとして、オーバーランがあります。
アップミキシング
モノラルからステレオへ、またはステレオからサラウンド サウンドへといったように、チャンネルの数を増やす作業。複製、パンニング、またはより高度な信号処理によって行います。対照的なものとして、ダウンミックスがあります。
バーチャライザー
より多くのスピーカーをシミュレートしたり、音源の位置を錯覚させたりするなど、オーディオ チャンネルを空間化するためのオーディオ効果。
音量
音量、あるいはオーディオ信号の主観的な強さ。

デバイス間相互接続

デバイス間相互接続技術により、デバイス間でオーディオおよびビデオ コンポーネントを接続します。これは、外部コネクタで簡単に確認できます。HAL の実装者およびエンドユーザーは、この用語を知っておく必要があります。

Bluetooth
短距離無線技術の一種です。オーディオ関連の Bluetooth プロファイルBluetooth プロトコルについて詳しくは、音楽用の A2DP、電話用の SCO、およびオーディオ / ビデオ リモート コントロール プロファイル(AVRCP)をご覧ください。
DisplayPort
Video Electronics Standards Association(VESA)が定めるデジタル ディスプレイのインターフェース。
ドングル
ドングルとは小さなガジェットのことで、特に別のデバイスに装着するタイプのものを指します。
FireWire
IEEE 1394 をご覧ください。
HDMI
高精細度マルチメディア インターフェース。オーディオ データおよびビデオ データを転送するためのインターフェースです。モバイル デバイスの場合、micro-HDMI(タイプ D)または MHL コネクタが使用されます。
IEEE 1394
IEEE 1394 はオーディオなどのリアルタイムの低遅延アプリケーションに使用されるシリアル バスです。FireWire とも呼ばれます。
Intel HDA
Intel High Definition Audio(一般的なハイ レゾリューション オーディオまたは高音質オーディオと混同しないようにする必要があります)。前面パネルのコネクタの仕様。詳しくは、Intel High Definition Audio をご覧ください。
インターフェース
特定の表現から別の表現に信号を変換するのがインターフェースです。代表的なインターフェースとして、USB オーディオ インターフェースや MIDI インターフェースがあります。
ラインレベル
ラインレベルとは、変換器間ではなく、オーディオ コンポーネント間を通過するアナログ オーディオ信号の強度のことです。
MHL
モバイル ハイデフィニション リンク。主にマイクロ USB コネクタを介したモバイル オーディオ / ビデオ インターフェース。
フォンコネクタ
デバイスを有線ヘッドフォン、ヘッドセット、またはラインレベル アンプに接続するミニまたはサブミニ コンポーネント。
SlimPort
micro-USB から HDMI へのアダプター。
S/PDIF
Sony/Philips デジタル インターフェース フォーマット。非圧縮 PCM の相互接続。詳しくは、S/PDIF をご覧ください。S/PDIF は、AES3 の民間向け派生規格です。
Thunderbolt
高性能な周辺機器への接続を行うための、USB および HDMI と競合するマルチメディア インターフェース。詳しくは、Thunderbolt をご覧ください。
TOSLINK
TOSLINK とは、S/PDIF で使用される光オーディオ ケーブルです。
USB
ユニバーサル シリアル バスの略。詳しくは、USB をご覧ください。

デバイス内相互接続

デバイス内相互接続技術は、特定のデバイスに内蔵のオーディオ コンポーネントを接続するものです。これは、デバイスを分解しない限りエンドユーザーの目には触れません。HAL の実装者はこれらを認識している必要がありますが、エンドユーザーには必要ありません。デバイス内の相互接続について詳しくは、次の記事をご覧ください。

ALSA System on Chip(ASoC)では、これらは総称してデジタル オーディオ インターフェース(DAI)と呼ばれます。

オーディオ信号パス

オーディオ信号パスとは、オーディオ データがアプリケーションからトランスデューサへ、またはその逆にたどる信号パスを指します。

ADC
アナログ - デジタル変換器。アナログ信号(時間と振幅が連続)をデジタル信号(時間と振幅が離散)に変換するモジュール。ADC は、概念的には一定間隔のサンプリングとホールドおよびそれに続く量子化で構成されますが、必ずしもこのように実装する必要はありません。通常、ADC の前にはローパス フィルタが配置され、目的のサンプルレートで表現できない高周波成分を除去します。詳しくは、アナログ - デジタル変換器をご覧ください。
AP
アプリケーション プロセッサ。モバイル デバイス上のメインの汎用コンピュータ。
コーデック
コーダー - デコーダ。ある特定の表現から別の表現へオーディオ信号をエンコードおよび / またはデコードするモジュール(通常、アナログから PCM、または PCM からアナログ)。厳密に言えば、コーデックとはエンコードとデコードを行うモジュールに対する呼称ですが、このうちの片方だけを指すものとして使用されることもあります。詳しくは、オーディオ コーデックをご覧ください。
DAC
デジタル - アナログ変換器。デジタル信号(時間と振幅が離散)をアナログ信号(時間と振幅が連続)に変換するモジュール。通常、デジタル量子化によって発生した高周波成分を除去するローパス フィルタがその後に続きます。詳しくは、デジタル - アナログ変換器をご覧ください。
DSP
デジタル シグナル プロセッサ。通常、アプリケーション プロセッサの後(出力用)またはアプリケーション プロセッサの前(入力用)に配置されます。主な目的として、アプリケーションプロセッサの負荷を軽減し、信号処理機能を低負荷で提供することがあげられます。
PDM
パルス密度変調。アナログ信号をデジタル信号で表現するために使用される変調の形式で、相対密度 1 または 0 により信号レベルを表します。デジタル - アナログ変換器で一般的に使用される変調形式です。詳しくは、パルス密度変調をご覧ください。
PWM
パルス幅変調。アナログ信号をデジタル信号で表現するために使用される変調の形式で、デジタル パルスの相対幅が信号レベルを表します。アナログ - デジタル変換器で一般的に使用される変調形式です。詳しくは、パルス幅変調をご覧ください。
トランスデューサ
現実世界の物理量の変化を電気信号に変換します。オーディオ関連においては物理量とは音圧のことで、トランスデューサはスピーカーやマイクを指します。詳しくは、トランスデューサをご覧ください。

サンプルレート変換

サンプルレート変換とは、あるサンプルレートから別のサンプルレートに変換する処理を指します。

ダウンサンプリング
シンク サンプルレートをソース サンプルレートよりも小さくする再サンプリングのこと。
ナイキスト周波数
特定のサンプルレートの 1/2 で離散化された信号で表すことができる最大周波数成分。たとえば、人間の可聴域の上限は約 20 kHz であるため、その範囲の音を表現するには、デジタル オーディオ信号のサンプルレートを最低でも 40 kHz とする必要があります。一般的に使用されるサンプルレートは 44.1 kHz と 48 kHz で、ナイキスト周波数はそれぞれ 22.05 kHz と 24 kHz となります。詳しくは、ナイキスト周波数および可聴域をご覧ください。
リサンプラー
サンプルレート変換と同義。
リサンプリング
サンプルレートを変換する処理。
サンプルレート コンバーター
リサンプリングを行うモジュール。
シンク
リサンプラーの出力。
ソース
リサンプラーへの入力。
アップサンプリング
シンク サンプルレートをソース サンプルレートよりも大きくする再サンプリングのこと。

Android 固有の用語

Android 固有の用語には、Android 音声フレームワークのみで使用される用語や、Android 関連として使用する場合に特別な意味合いを持つ一般的な用語があります。

ALSA
Advanced Linux Sound Architecture の略。他のシステムにも影響を与えた Linux 用のオーディオ フレームワークです。一般的な定義について詳しくは、ALSA をご覧ください。Android では、ALSA はユーザー モード API を指すものではなく、カーネル オーディオ フレームワークとドライバを意味します。関連項目: tinyalsa
オーディオ機器
HAL が実装されたオーディオ I/O エンドポイント。
AudioEffect
出力(後処理)効果および入力(前処理)効果のための API および実装フレームワーク。この API は、android.media.audiofx.AudioEffect に定義されています。
AudioFlinger
Android サウンド サーバーの実装。AudioFlinger は、mediaserver プロセス内で動作します。一般的な定義については、サウンド サーバーをご覧ください。
音声フォーカス
複数の独立したアプリ間での音声操作を管理する一連の API。詳しくは、音声フォーカスの管理および android.media.AudioManager のフォーカス関連のメソッドと定数をご覧ください。
AudioMixer
複数のトラックを結合し、減衰(音量)や効果を適用する AudioFlinger のモジュール。一般的な定義については、Audio mixing(recorded music)をご覧ください(システム内のソフトウェア モジュールではなく、ハードウェア デバイスまたはソフトウェア アプリケーションとしてミキサーを説明しています)。
オーディオ ポリシー
新しい I/O ストリームの開始、変更後の再ルーティング、ストリームのボリューム管理など、最初にポリシー決定を行う必要のあるすべての操作を行うサービス。
AudioRecord
マイクなどのオーディオ入力デバイスからデータを受信するためのプライマリ ローレベル クライアント API。通常、このデータは PCM 形式です。API は、android.media.AudioRecord で定義されています。
AudioResampler
サンプルレート変換を行う AudioFlinger のモジュール。
オーディオ ソース
オーディオ入力をキャプチャするための適切なユースケースを示す定数の列挙型。詳しくは、オーディオ ソースをご覧ください。API レベル 21 以降では、オーディオ属性を使用することをおすすめします。
音声トラック
スピーカーなどのオーディオ出力デバイスにデータを送信するためのプライマリ ローレベル クライアント API。通常、このデータは PCM 形式です。API は、android.media.AudioTrack に定義されています。
audio_utils
Android プラットフォームにはほとんど依存しない、PCM 形式変換、WAV ファイル I/O および非ブロッキング FIFO などの機能用のオーディオ ユーティリティ ライブラリ。
クライアント
通常、アプリケーションまたはアプリ クライアントを指します。ただし、AudioFlinger クライアントは、MediaPlayer オブジェクトによってデコードされたメディアを再生するといった場合に、mediaserver システム プロセス内で実行されるスレッドであることがあります。
HAL
Hardware Abstraction Layer。HAL は Android の一般的な用語で、オーディオ関連として使われる場合は、(C++ libaudio に置き換わる)C API を備えた AudioFlinger とカーネル デバイス ドライバの間のレイヤーを意味します。
FastCapture
レイテンシを低減するように構成されている場合に、オーディオ データを低遅延の高速トラックに送信して入力デバイスを動作させる、AudioFlinger 内のスレッド。
FastMixer
レイテンシを低減するように構成されている場合に、低遅延の高速トラックからオーディオ データを受信およびミキシングしてプライマリ出力デバイスを動作させる、AudioFlinger 内のスレッド。
Fast Track
遅延は発生しにくいものの、一部のデバイスとルートで機能が限られる AudioTrack または AudioRecord クライアント。
MediaPlayer
AudioTrack よりも高水準のクライアント API。エンコードされたコンテンツ、またはマルチメディアの音声トラックや動画トラックを含むコンテンツを再生します。
media.log
カスタム ビルドのみで使用できる AudioFlinger デバッグ機能。必要に応じて時間を遡ってダンプ可能なオーディオ バッファへのオーディオ イベントのロギングに使用されます。
メディアサーバー
AudioFlinger などのメディア関連サービスを含む Android システム プロセス。
NBAIO
ノンブロッキング オーディオ入出力。AudioFlinger ポートの抽象化のことですが、この用語は、NBAIO API の一部の実装ではブロッキングをサポートしているため、誤解を招く可能性があります。主な NBAIO の実装はパイプの種類に応じて異なります。
ノーマル ミキサー
ほぼ全機能の AudioTrack クライアントを提供する、AudioFlinger 内のスレッド。出力デバイスを直接動作させるか、サブミックスをパイプ経由で FastMixer に送ります。
OpenSL ES
クロノス グループによるオーディオ API 標準。API バージョン 9 以降の Android は、OpenSL ES 1.0.1 のサブセットに基づくネイティブ オーディオ API をサポートしています。
マナーモード
メディアの再生(音楽、ビデオ、ゲーム)、またはアラームに影響を与えずに電話の着信音と通知をミュートするユーザー設定可能な機能です。
SoundPool
AudioTrack よりも高水準のクライアント API。サンプリングされた音声クリップを再生するもので、UI フィードバック、ゲームサウンドなどのトリガーとして利用できます。この API は android.media.SoundPool で定義されます。
Stagefright
メディアをご覧ください。
StateQueue
スレッド間で状態を同期させる AudioFlinger 内のモジュール。NBAIO はデータの受け渡しに使用され、StateQueue は制御情報の受け渡しに使用されます。
ストラテジー
同様の動作を行うストリーム タイプのグループ。オーディオ ポリシー サービスで使用されます。
ストリーム タイプ
オーディオ出力のユースケースを表す列挙型。オーディオ ポリシーの実装では、ストリーム タイプおよび他のパラメータを使用して、音量とルーティングを決定します。ストリーム タイプの一覧については、android.media.AudioManager をご覧ください。
ティー シンク
オーディオのデバッグをご覧ください。
tinyalsa
BSD ライセンスを備えた ALSA カーネルの上の小規模なユーザー モード API。HAL の実装に推奨されます。
ToneGenerator
AudioTrack よりも高水準のクライアント API。デュアルトーン マルチ周波数(DTMF)信号を再生します。詳しくは、DTMF および android.media.ToneGenerator の API の定義をご覧ください。
トラック
音声ストリーム。AudioTrack API または AudioRecord API によって制御されます。
音量減衰カーブ
特定の出力の汎用ボリューム レベルから特定の減衰係数へのデバイス固有のマッピング。
ボリューム レベル
ストリームの任意の相対ボリュームを表す、単位のない整数。android.media.AudioManager のボリューム関連の API は、絶対減衰係数ではなくボリューム レベルで動作します。