音频术语

使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

此音频相关术语表包括广泛使用的通用术语和 Android 专用术语。有关术语的规范定义,请参阅中央Android 平台词汇表

通用条款

与音频相关的通用术语具有约定俗成的含义。

数字音频

数字音频术语涉及使用以数字形式编码的音频信号来处理声音。有关详细信息,请参阅数字音频

AC3
杜比的音频编解码器。有关详细信息,请参阅杜比数字
声学
研究声音的机械特性,例如换能器(扬声器、麦克风等)在设备上的物理放置如何影响感知的音频质量。
衰减
小于或等于 1.0 的乘法因子,应用于音频信号以降低信号电平。比较有收获
发烧友
关注卓越音乐再现体验的人,特别愿意为音质做出实质性权衡(费用、组件尺寸、房间设计等)。详情请参考发烧友
AVB
通过以太网实时传输数字音频的标准。详情请参考音视频桥接
每个样本的位数或位深度
每个样本的信息位数。
渠道
单个音频信息流,通常对应于一个记录或播放位置。
缩混
减少声道数量,例如从立体声到单声道或从 5.1 到立体声。通过丢弃通道、混合通道或更高级的信号处理来实现。没有衰减或限制的简单混合有可能产生溢出和削波。与上混相比
渠务署
直接流数字。基于脉冲密度调制的专有音频编码。脉冲编码调制 (PCM) 将波形编码为多个比特的单个音频样本序列,而 DSD 将波形编码为具有非常高采样率(没有样本概念)的比特序列。 PCM 和 DSD 都以独立序列表示多个声道。 DSD 比作为处理的内部表示更适合内容分发,因为很难将传统的数字信号处理 (DSP) 算法应用于 DSD。 DSD 用于Super Audio CD (SACD)和用于 USB 的 DSD over PCM (DoP)。有关详细信息,请参阅Direct Stream Digital
当另一个流变为活动状态时,暂时减少一个流的音量。例如,如果通知到达时音乐正在播放,则音乐会在通知播放时闪避。比较静音
先进先出
先进先出。实现数据先进先出排队的硬件模块或软件数据结构。在音频上下文中,存储在队列中的数据通常是音频帧。 FIFO 可以通过循环缓冲区来实现。
框架
一组样本,每个通道一个,在一个时间点。
每个缓冲区的帧数
一次从一个模块传递到下一个模块的帧数。音频 HAL 接口使用每个缓冲区帧数的概念。
获得
乘法因子大于或等于 1.0,应用于音频信号以提高信号电平。比较衰减
高清音频
高清音频。高分辨率音频的同义词(但不同于英特尔高清晰度音频)。
耳机
适合耳朵的扬声器,没有麦克风。与耳机对比。
耳机
带麦克风的耳机。对比一下耳机。
赫兹
采样率或帧率的单位。
高分辨率音频
具有比 CD 更大的位深度和采样率的表示(44.1 kHz 的立体声 16 位 PCM)并且没有有损数据压缩。相当于高清音频。有关详细信息,请参阅高分辨率音频
交错的
多声道数字音频的一种表示形式,它在声道之间交替显示数据。例如,以交错格式表示的立体声数字音频是左、右、左、右等。
潜伏
信号通过系统时的时间延迟。
无损的
一种无损数据压缩算法,可在编码和解码过程中保持位精度,其中解码先前编码数据的结果等同于原始数据。无损音频内容分发格式的示例包括CDWAV中的 PCM 和FLAC 。创作过程可能会降低版的位深度或采样率;保留母版分辨率和位精度的分发格式是高分辨率音频的主题。
有损的
一种有损数据压缩算法,它试图在编码和解码过程中保留媒体最重要的特征,其中解码先前编码数据的结果在感知上与原始数据相似但不完全相同。有损音频压缩算法的示例包括 MP3 和 AAC。由于模拟值来自连续域而数字值是离散的,因此 ADC 和 DAC 是幅度方面的有损转换。另见透明度
单核细胞增多症
一个频道。
多通道
查看环绕声。严格来说,立体声是多声道的,可以认为是多声道;但是,这种用法令人困惑,因此应避免使用。
沉默的
暂时强制音量为零,独立于通常的音量控制。
超越
由于未能及时接受提供的数据而引起的声音故障。有关详细信息,请参阅缓冲区欠载。与欠载相比
平移
将信号定向到立体声或多声道场内的所需位置。
相变调制器
脉冲编码调制。最常见的数字音频低级编码。音频信号以固定间隔(称为采样率)进行采样,然后根据位深度量化为特定范围内的离散值。例如,对于 16 位 PCM,样本值是介于 -32768 和 +32767 之间的整数。
坡道
逐渐增加或减少特定音频参数的级别,例如效果的音量或强度。暂停和恢复音乐时通常会应用音量斜坡,以避免出现难以听清的过渡。
样本
表示某个时间点单个通道的音频值的数字。
采样率或帧率
每秒帧数。虽然帧速率更准确,但通常使用采样率来表示帧速率。
可听化
使用声音来表达反馈或信息,例如触摸声音和键盘声音。
声压级
声压级,声压的相对测量值。
立体声
两个频道。
立体声加宽
应用于立体声信号的效果器可使另一个立体声信号听起来更饱满、更丰富。该效果也可以应用于单声道信号,它是一种上混。
环绕声
提高听众感知声音位置的能力的技术,超出立体声左右。
透明度
有损数据压缩的理想结果。如果人类主体在感知上无法将有损数据转换与原始数据区分开来,则有损数据转换是透明的。有关详细信息,请参阅透明度
欠载
由于未能及时提供所需数据而引起的声音故障。有关详细信息,请参阅缓冲区欠载。比较overrun
混音
增加声道数量,例如从单声道到立体声或从立体声到环绕声。通过复制、平移或更高级的信号处理来完成。与缩混相比
美国航空航天局
用于低比特率应用程序的音频编解码器。有关详细信息,请参阅统一语音和音频编码
虚拟器
尝试将音频通道空间化的效果,例如尝试模拟更多扬声器或给人一种声源具有位置的错觉。
体积
响度,音频信号的主观强度。

设备间互连

设备间互连技术连接设备之间的音频和视频组件,并且在外部连接器处很容易看到。 HAL 实施者和最终用户应该了解这些术语。

蓝牙
短距离无线技术。有关音频相关的蓝牙配置文件蓝牙协议的详细信息,请参阅音乐的A2DP 、电话的SCO音频/视频远程控制配置文件 (AVRCP)
显示端口
视频电子标准协会 (VESA) 的数字显示接口。
加密狗
加密狗是一种小工具,尤其是挂在另一台设备上的小工具。
火线
参见 IEEE 1394。
HDMI
高清多媒体接口。用于传输音频和视频数据的接口。对于移动设备,使用微型 HDMI(D 型)或 MHL 连接器。
IEEE 1394
IEEE 1394 ,也称为 FireWire,是一种串行总线,用于实时低延迟应用程序,例如音频。
英特尔HDA
Intel 高保真音频(不要与通用高保真音频高分辨率音频混淆)。前面板连接器规范。有关详细信息,请参阅英特尔高保真音频
界面
接口将信号从一种表示形式转换为另一种表示形式。常用接口包括USB音频接口和MIDI接口。
线路电平
线路电平是在音频组件(而非换能器)之间传递的模拟音频信号的强度。
MHL
手机高清链接。移动音频/视频接口,通常通过微型 USB 连接器。
电话连接器
将设备连接到有线耳机、耳机或线路电平放大器的迷你或超迷你组件。
苗条端口
从微型 USB 到 HDMI 的适配器。
数字音频接口
Sony/Philips 数字接口格式。用于未压缩 PCM 和 IEC 61937 的互连。有关详细信息,请参阅S/PDIF 。 S/PDIF 是AES3的消费级变体。
霹雳
与 USB 和 HDMI 竞争连接高端外围设备的多媒体接口。有关详细信息,请参阅Thunderbolt
TOSLINK
TOSLINK是与S/PDIF一起使用的光纤音频电缆。
USB
通用串行总线。有关详细信息,请参阅USB

设备内互连

设备内互连技术连接给定设备内的内部音频组件,并且在不拆卸设备的情况下是不可见的。 HAL 实施者可能需要知道这些,但最终用户不需要。设备内互联的详细介绍,请参考以下文章:

ALSA 片上系统 (ASoC)中,这些统称为数字音频接口(DAI)。

音频信号路径

音频信号路径术语涉及音频数据从应用程序到换能器的信号路径,反之亦然。

模数转换器
模数转换器。将模拟信号(时间和幅度连续)转换为数字信号(时间和幅度离散)的模块。从概念上讲,ADC 由一个周期性的采样保持器和一个量化器组成,尽管它不一定要以这种方式实现。 ADC 之前通常有一个低通滤波器,以去除无法使用所需采样率表示的任何高频分量。有关详细信息,请参阅模数转换器
美联社
应用程序处理器。移动设备上的主要通用计算机。
编解码器
编码器-解码器。将音频信号从一种表示形式编码和/或解码为另一种表示形式(通常是模拟到 PCM 或 PCM 到模拟)的模块。严格来说,编解码器是为同时进行编码和解码的模块保留的,但可以松散地用于指代其中一个。有关详细信息,请参阅音频编解码器
解码器
数模转换器。将数字信号(时间和幅度离散)转换为模拟信号(时间和幅度连续)的模块。通常后跟一个低通滤波器,以去除数字量化引入的高频分量。详情请参考数模转换器
数字信号处理器
数字信号处理器。可选组件通常位于应用程序处理器之后(用于输出)或应用程序处理器之前(用于输入)。主要目的是卸载应用处理器并以较低的功耗成本提供信号处理功能。
产品数据管理
脉冲密度调制。用于通过数字信号表示模拟信号的调制形式,其中 1 与 0 的相对密度表示信号电平。常用于数模转换器。有关详细信息,请参阅脉冲密度调制
脉宽调制
脉冲宽度调制。用于通过数字信号表示模拟信号的调制形式,其中数字脉冲的相对宽度表示信号电平。常用于模数转换器。有关详细信息,请参阅脉宽调制
传感器
将现实世界物理量的变化转换为电信号。在音频中,物理量是声压,换能器是扬声器和麦克风。有关详细信息,请参阅换能

采样率转换

采样率转换术语涉及从一种采样率转换为另一种采样率的过程。

下采样
重新采样,其中接收器采样率 < 源采样率。
奈奎斯特频率
在给定采样率的 1/2 下,离散化信号可以表示的最大频率分量。例如,人类的听力范围扩展到大约 20 kHz,因此数字音频信号必须具有至少 40 kHz 的采样率才能代表该范围。在实践中,通常使用 44.1 kHz 和 48 kHz 的采样率,奈奎斯特频率分别为 22.05 kHz 和 24 kHz。有关详细信息,请参阅奈奎斯特频率听力范围
重采样器
采样率转换器的同义词。
重采样
转换采样率的过程。
采样率转换器
重新采样的模块。
下沉
重采样器的输出。
资源
输入到重采样器。
上采样
重新采样,其中接收器采样率 > 源采样率。

电话

建筑工程委员会
声学回声消除是一种减少信号回声的方法。有关详细信息,请参阅回声抑制和消除
非国大
主动噪声控制是一种通过主动添加不需要的次要信号的倒数来提高主要信号质量的方法。有关详细信息,请参阅有源噪声控制
拨号器
提供电话用户界面的应用程序。
碳酸钙
Hearing Carry-Over 是一种 TTY 模式,消息以文本形式发送,以语音形式接收。
侧音
从本地麦克风到本地听筒的声音反馈。有关详细信息,请参阅侧音
测试驱动开发
聋人电讯设备是一种特殊的电传打字机 (TTY),适用于听力或语言受损的人。
电传
电传打字机。通常与 TDD 互换使用。
UE
用户设备。消费者电话设备。
UMTS
通用移动通信系统。一种移动蜂窝系统。
压控振荡器
Voice Carry-Over 是一种 TTY 模式,消息以音频形式发送,以文本形式接收。

Android 专用条款

Android 特定术语包括仅在 Android 音频框架中使用的术语和在 Android 中具有特殊含义的通用术语。

阿尔萨
高级 Linux 声音架构。 Linux 的音频框架也影响了其他系统。有关通用定义,请参阅ALSA 。在 Android 中,ALSA 是指内核音频框架和驱动程序,而不是用户模式 ​​API。另请参见tinyalsa
音频设备
由 HAL 实现支持的音频 I/O 端点。
音效
输出(后处理)效果和输入(预处理)效果的API和实现框架。 API 在android.media.audiofx.AudioEffect中定义。
AudioFlinger
Android声音服务器实现。 AudioFlinger 在媒体服务器进程中运行。有关通用定义,请参阅声音服务器
音频焦点
用于管理跨多个独立应用程序的音频交互的 API 集。详情参见管理音频焦点android.media.AudioManager的焦点相关方法和常量。
混音器
AudioFlinger 中的模块负责组合多个音轨并应用衰减(音量)和效果。有关通用定义,请参阅音频混合(录制的音乐) (将混音器讨论为硬件设备或软件应用程序,而不是系统中的软件模块)。
音频政策
服务负责所有需要首先做出策略决策的操作,例如打开新的 I/O 流、更改后的重新路由和流量管理。
录音带
用于从麦克风等音频输入设备接收数据的主要低级客户端 API。数据通常是 PCM 格式。 API 在android.media.AudioRecord中定义。
音频重采样器
AudioFlinger 中负责采样率转换的模块。
音源
指示捕获音频输入的所需用例的常量枚举。有关详细信息,请参阅音频源。从 API 级别 21 及更高版本开始,首选音频属性
音轨
用于将数据发送到音频输出设备(如扬声器)的主要低级客户端 API。数据通常为 PCM 格式。 API 在android.media.AudioTrack中定义。
audio_utils
用于 PCM 格式转换、WAV 文件 I/O 和非阻塞 FIFO等功能的音频实用程序库,它在很大程度上独立于 Android 平台。
客户
通常是应用程序或应用程序客户端。但是,AudioFlinger 客户端可以是在媒体服务器系统进程中运行的线程,例如在播放由 MediaPlayer 对象解码的媒体时。
哈尔
硬件抽象层。 HAL是Android中的通用术语;在音频中,它是 AudioFlinger 和带有 C API 的内核设备驱动程序之间的一层(它取代了 C++ libaudio)。
快速捕捉
AudioFlinger 中的线程将音频数据发送到延迟较低的快速轨道,并在配置为减少延迟时驱动输入设备。
快速混合器
AudioFlinger 中的线程接收和混合来自低延迟快速轨道的音频数据,并在配置为减少延迟时驱动主输出设备。
快速通道
AudioTrack 或 AudioRecord 客户端延迟较低,但在某些设备和路由上功能较少。
媒体播放器
比 AudioTrack 更高级别的客户端 API。播放编码内容或包含多媒体音频和视频轨道的内容。
媒体日志
AudioFlinger 调试功能仅在自定义版本中可用。用于将音频事件记录到循环缓冲区,然后可以在需要时追溯转储。
媒体服务器
包含媒体相关服务的Android系统进程,包括AudioFlinger。
NBAIO
非阻塞音频输入/输出。 AudioFlinger 端口的抽象。该术语可能会产生误导,因为 NBAIO API 的某些实现支持阻塞。 NBAIO 的关键实现是针对不同类型的管道。
普通搅拌机
AudioFlinger 中的线程,为大多数功能齐全的 AudioTrack 客户端提供服务。直接驱动输出设备或通过管道将其子混音送入 FastMixer。
OpenSL ES
The Khronos Group制定的音频 API 标准。 API 级别 9 之后的 Android 版本支持基于OpenSL ES 1.0.1子集的本机音频 API。
专业音频
功能标志android.hardware.audio.pro的缩写。这些要求记录在 Android CDD 的第5.10 节专业音频中。特性android.hardware.audio.pro中的“pro”指的是可预测的实时性能水平,而不是目标用户。
即时的

实时计算系统保证在规定的时限内响应相关事件。对实时计算的设备实现支持是满足上述android.hardware.audio.pro功能要求的必要但不充分的先决条件。

实时性能在音频以外的其他领域也有好处,例如游戏、图形、相机、视频、传感器处理、虚拟现实 (VR) 和增强现实 (AR)。

静音模式
用户可设置的功能可在不影响媒体播放(音乐、视频、游戏)或闹钟的情况下使电话铃声和通知静音。
音池
比 AudioTrack 更高级别的客户端 API。播放采样音频剪辑。用于触发 UI 反馈、游戏声音等。API 在android.media.SoundPool中定义。
怯场
请参阅媒体
状态队列
AudioFlinger 中的模块负责同步线程间的状态。 NBAIO 用于传递数据,而 StateQueue 用于传递控制信息。
战略
具有相似行为的流类型组。由音频策略服务使用。
流类型
表示音频输出用例的枚举。音频策略实现使用流类型以及其他参数来确定音量和路由决策。有关流类型的列表,请参阅android.media.AudioManager
三通水槽
请参阅音频调试
蒂亚尔萨
具有 BSD 许可证的 ALSA 内核之上的小型用户模式 ​​API。推荐用于 HAL 实现。
音调发生器
比 AudioTrack 更高级别的客户端 API。播放双音多频 (DTMF) 信号。有关详细信息,请参阅双音多频信令android.media.ToneGenerator中的 API 定义。
追踪
音频流。由 AudioTrack 或 AudioRecord API 控制。
体积衰减曲线
从通用体积指数到给定输出的特定衰减因子的特定于设备的映射。
体积指数
表示流的所需相对体积的无单位整数。 android.media.AudioManager的音量相关 API 在音量指数而不是绝对衰减因子中运行。