Terminologia de áudio

Este glossário de terminologia relacionada ao áudio inclui termos genéricos amplamente usados e termos específicos do Android. Consulte o Glossário da Plataforma Android para ver as definições canônicas dos termos.

Termos genéricos

Termos genéricos relacionados ao áudio têm significados convencionais.

Áudio digital

Os termos de áudio digital se referem ao processamento de som usando sinais de áudio codificados em formato digital. Para mais detalhes, consulte Áudio digital.

AC-3
Um codec de áudio da Dolby. Para mais detalhes, consulte Dolby Digital.
acústica
Estudo das propriedades mecânicas do som, como a forma como a colocação física de transdutores (por exemplo, alto-falantes, microfones) em um dispositivo afeta a qualidade de áudio percebida.
atenuação
Fator multiplicativo menor ou igual a 1,0, aplicado a um sinal de áudio para diminuir o nível do sinal. Compare com ganho.
audiófilo
Pessoa preocupada com uma experiência de reprodução de música superior, especialmente disposta a fazer trocas substanciais (por exemplo, despesas, tamanho do componente, design do ambiente) para a qualidade do som. Para mais detalhes, consulte Audiophile.
AVB
Um padrão para transmissão em tempo real de áudio digital por Ethernet. Para mais detalhes, consulte Ponte de áudio e vídeo.
bits por amostra ou profundidade de bits
Número de bits de informação por amostra.
canal
Fluxo único de informações de áudio, geralmente correspondente a um local de gravação ou reprodução.
redução de mixagem
Diminuir o número de canais, por exemplo, de estéreo para mono ou de 5.1 para estéreo. Isso é feito ao excluir canais, misturar canais ou fazer um processamento de sinal mais avançado. A mistura simples sem atenuação ou limitação tem o potencial de overflow e clipping. Compare com a mistura para cima.
DSD
Stream digital direto. Codificação de áudio proprietária baseada na modulação de densidade de pulso. Enquanto a modulação por código de pulso (PCM) codifica uma forma de onda como uma sequência de amostras de áudio individuais de vários bits, o DSD codifica uma forma de onda como uma sequência de bits em uma taxa de amostragem muito alta (sem o conceito de amostras). O PCM e o DSD representam vários canais por sequências independentes. O DSD é mais adequado para a distribuição de conteúdo do que como uma representação interna para processamento, já que pode ser difícil aplicar algoritmos tradicionais de processamento de sinais digitais (DSP) ao DSD. O DSD é usado em Super Audio CD (SACD) e em DSD sobre PCM (DoP) para USB. Para mais detalhes, consulte Direct Stream Digital.
pato
Reduza temporariamente o volume de um stream quando outro stream ficar ativo. Por exemplo, se uma música estiver tocando quando uma notificação chegar, ela será reduzida enquanto a notificação é reproduzida. Compare com silenciar.
PEPS
Primeiro a entrar, primeiro a sair. Módulo de hardware ou estrutura de dados de software que implementa a fila de dados FIFO. Em um contexto de áudio, os dados armazenados na fila são geralmente frames de áudio. A FIFO pode ser implementada por um buffer circular.
o enquadramento
Conjunto de amostras, uma por canal, em um determinado momento.
frames por buffer
Número de frames transmitidos de um módulo para o próximo de uma só vez. A interface HAL de áudio usa o conceito de frames por buffer.
ganho
Fator multiplicativo maior ou igual a 1,0, aplicado a um sinal de áudio para aumentar o nível do sinal. Compare com a atenuação.
Áudio HD
Áudio de alta definição. Sinônimo de áudio de alta resolução (mas diferente do Intel High Definition Audio).
fones de ouvido
Alto-falantes que se encaixam sobre as orelhas, sem microfone. Compare com o fone de ouvido.
fone de ouvido
Fones de ouvido com microfone. Compare com fones de ouvido.
Hz
Unidades para taxa de amostragem ou taxa de frames.
áudio de alta resolução
Representação com maior profundidade de bits e taxa de amostragem do que os CDs (PCM estéreo de 16 bits a 44,1 kHz) e sem compactação de dados com perda. Equivalente a áudio HD. Para mais detalhes, consulte áudio de alta resolução.
intercalada
Uma representação de áudio digital multicanal que alterna dados entre os canais. Por exemplo, o áudio digital estéreo expresso em formato intercalado alterna esquerda, direita, esquerda, direita.
latência
Atraso de tempo quando um sinal passa por um sistema.
sem perdas
Um algoritmo de compactação de dados sem perdas que preserva a precisão de bits em toda a codificação e decodificação, em que o resultado da decodificação de dados codificados anteriormente é equivalente aos dados originais. Exemplos de formatos de distribuição de conteúdo de áudio sem perdas incluem CDs, PCM em WAV e FLAC. O processo de criação pode reduzir a profundidade de bits ou a taxa de amostragem dos masters. Os formatos de distribuição que preservam a resolução e a precisão de bits dos masters são o assunto do áudio de alta resolução.
com perda
Um algoritmo de compressão de dados com perda que tenta preservar os recursos mais importantes da mídia em toda a codificação e decodificação, em que o resultado da decodificação de dados codificados anteriormente é perceptualmente semelhante aos dados originais, mas não idêntico. Exemplos de algoritmos de compactação de áudio com perdas incluem MP3 e AAC. Como os valores analógicos vêm de um domínio contínuo e os valores digitais são discretos, o ADC e o DAC são conversões com perda em relação à amplitude. Consulte também transparência.
mono
Um canal.
multicanal
Consulte som surround. Em termos estritos, estéreo é mais de um canal e pode ser considerado multicanal. No entanto, esse uso é confuso e, portanto, evitado.
Desativar som
Força temporariamente o volume a ser zero, independente dos controles de volume habituais. Compare com duck.
estouro
Erro audível causado por falha na aceitação dos dados fornecidos em tempo suficiente. Para mais detalhes, consulte Buffer underrun. Compare com underrun.
panorâmica
Direcionar um sinal para uma posição desejada em um campo estéreo ou multicanal.
PCM
Modulação de código de pulso. A codificação de baixo nível mais comum de áudio digital. O sinal de áudio é amostrado em um intervalo regular, chamado de taxa de amostragem, e, em seguida, quantizado para valores discretos em um determinado intervalo, dependendo da profundidade de bits. Por exemplo, para PCM de 16 bits, os valores de amostra são números inteiros entre -32768 e +32767.
rampa
Aumente ou diminua gradualmente o nível de um parâmetro de áudio específico, como o volume ou a intensidade de um efeito. Uma rampa de volume é comumente aplicada ao pausar e retomar a música para evitar uma transição audível difícil.
amostra
Número que representa o valor de áudio de um único canal em um determinado momento.
taxa de amostragem ou taxa de frames
Número de frames por segundo. Embora a taxa de frames seja mais precisa, a taxa de amostragem é usada convencionalmente para indicar a taxa de frames.
sonificação
Uso de som para expressar feedback ou informações, como sons de toque e sons de teclado.
SPL
Nível de pressão sonora, uma medição relativa da pressão sonora.
estéreo
Dois canais. Comparar com multicanal.
ampliação estéreo
Efeito aplicado a um sinal estéreo para criar outro sinal estéreo que soe mais completo e rico. O efeito também pode ser aplicado a um sinal mono, em que é um tipo de upmix.
som surround
Técnica para aumentar a capacidade de um ouvinte de perceber a posição do som além do estéreo esquerdo e direito.
transparência
Resultado ideal da compactação de dados com perdas. A conversão de dados com perdas é transparente se não puder ser distinguida do original por um sujeito humano. Para detalhes, consulte Transparência.
underrun
Erro do Audible causado por falha na entrega dos dados necessários em tempo suficiente. Para mais detalhes, consulte Buffer underrun. Compare com overrun.
Upmix
Aumentar o número de canais, por exemplo, de mono para estéreo ou de estéreo para som surround. É feito por duplicação, panorâmica ou processamento de sinal mais avançado. Compare com a mistura para baixo.
USAC
Codificação unificada de fala e áudio. Um codec de áudio para apps de taxa de bits baixa. Para mais detalhes, consulte Codificação de áudio e fala unificada.
virtualizador
Efeito que tenta espacializar canais de áudio, como tentar simular mais alto-falantes ou dar a ilusão de que as fontes de som têm posição.
volume
Volume, a intensidade subjetiva de um sinal de áudio.

Interconexão entre dispositivos

As tecnologias de interconexão entre dispositivos conectam componentes de áudio e vídeo entre dispositivos e são facilmente visíveis nos conectores externos. O implementador e o usuário final do HAL precisam estar cientes desses termos.

Bluetooth
Tecnologia sem fio de curto alcance. Para detalhes sobre os perfis de Bluetooth e os protocolos de Bluetooth relacionados ao áudio, consulte A2DP para música, SCO para telefonia e Perfil de controle remoto de áudio/vídeo (AVRCP).
DisplayPort
Interface de exibição digital da Video Electronics Standards Association (VESA).
dongle
Um pequeno gadget, especialmente aquele que fica pendurado em outro dispositivo. Para mais detalhes, consulte Dongle.
FireWire
Consulte IEEE 1394.
HDMI
Interface multimídia de alta definição. Interface para transferir dados de áudio e vídeo. Para dispositivos móveis, é usado um conector micro-HDMI (tipo D) ou MHL.
IEEE 1394
Um barramento serial usado para apps de baixa latência em tempo real, como áudio. Também chamado de FireWire. Para mais detalhes, consulte IEEE 1394.
Intel HDA
Intel High Definition Audio (não confunda com áudio de alta definição ou áudio de alta resolução genéricos). Especificação de um conector do painel frontal. Para mais detalhes, consulte Áudio de alta definição da Intel.
interface
Uma interface converte um sinal de uma representação para outra. As interfaces comuns incluem uma interface de áudio USB e uma interface MIDI.
nível da linha
A intensidade de um sinal de áudio analógico que passa entre os componentes de áudio, não transdutores. Para mais detalhes, consulte Nível da linha.
MHL
Mobile High-Definition Link. Interface de áudio e vídeo para dispositivos móveis, geralmente por meio de um conector micro-USB.
conector do smartphone
Componente mini ou submini que conecta um dispositivo a fones de ouvido com fio, headset ou amplificador de nível de linha.
SlimPort
Adaptador de micro USB para HDMI.
S/PDIF
Formato de interface digital Sony/Philips. Interconexão para PCM descompactado e IEC 61937. Para mais detalhes, consulte S/PDIF. O S/PDIF é a variante de nível de consumidor do AES3.
Thunderbolt
Interface multimídia que compete com USB e HDMI para conexão com periféricos de última geração. Para mais detalhes, consulte Thunderbolt.
TOSLINK
Um cabo de áudio óptico usado com S/PDIF. Para mais detalhes, consulte TOSLINK.
USB
Universal Serial Bus. Para mais detalhes, consulte USB.

Interconexão intradispositivo

As tecnologias de interconexão intradispositivo conectam componentes de áudio internos em um determinado dispositivo e não são visíveis sem desmontar o dispositivo. O implementador do HAL precisa estar ciente disso, mas o usuário final não. Para detalhes sobre interconexões intradispositivo, consulte os seguintes artigos:

No system on chip (ASoC) do ALSA, elas são chamadas coletivamente de interfaces de áudio digital (DAIs).

Caminho do sinal de áudio

Os termos do caminho do sinal de áudio se referem ao caminho que os dados de áudio seguem de um app para o transdutor ou do transdutor para um app.

ADC
Conversor analógico-digital. Módulo que converte um sinal analógico (contínuo em tempo e amplitude) em um sinal digital (discreto em tempo e amplitude). Conceitualmente, um ADC consiste em uma amostragem periódica seguida por um quantizador, embora não precise ser implementado dessa maneira. Um ADC é geralmente precedido por um filtro passa-baixa para remover componentes de alta frequência que não podem ser representados usando a taxa de amostragem desejada. Para mais detalhes, consulte Conversor analógico-digital.
AP
Processador de apps. Principal computador de uso geral em um dispositivo móvel.
codec
Codificador-decodificador. Módulo que codifica e decodifica um sinal de áudio de uma representação para outra (normalmente analógico para PCM ou PCM para analógico). Em termos rigorosos, o codec é reservado para módulos que codificam e decodificam, mas pode ser usado de forma vaga para se referir a apenas um deles. Para mais detalhes, consulte Codec de áudio.
DAC
Conversor digital-analógico. Módulo que converte um sinal digital (discreto em tempo e amplitude) em um sinal analógico (contínuo em tempo e amplitude). Geralmente seguido por um filtro passa-baixa para remover componentes de alta frequência introduzidos pela quantização digital. Para mais detalhes, consulte Conversor digital-analógico.
DSP
Processador de sinais digitais. Componente opcional normalmente localizado após o processador do app (para saída) ou antes do processador do app (para entrada). O objetivo principal é descarregar o processador do app e oferecer recursos de processamento de sinal com um custo de energia menor.
PDM
Modulação de densidade de pulso. Forma de modulação usada para representar um sinal analógico por um sinal digital, em que a densidade relativa de 1s em relação a 0s indica o nível do sinal. É comumente usado por conversores digitais-analógicos. Para mais detalhes, consulte Modulação por densidade de pulso.
PWM
Modulação por largura de pulso. Forma de modulação usada para representar um sinal analógico por um sinal digital, em que a largura relativa de um pulso digital indica o nível do sinal. É comumente usado por conversores analógico-digital. Para mais detalhes, consulte Modulação por largura de pulso.
transdutor
Converte variações em quantidades físicas reais em sinais elétricos. No áudio, a quantidade física é a pressão do som, e os transdutores são o alto-falante e o microfone. Para mais detalhes, consulte Transdutor.

Conversão de taxa de amostragem

Os termos de conversão de taxa de amostragem se referem ao processo de conversão de uma taxa de amostragem para outra.

reduzir a amostra
Reamostragem, em que a taxa de amostragem do sink é menor que a taxa de amostragem da fonte.
Frequência de Nyquist
Componente de frequência máxima que pode ser representado por um sinal discretizado em 1/2 de uma determinada taxa de amostragem. Por exemplo, o alcance da audição humana se estende até aproximadamente 20 kHz. Portanto, um sinal de áudio digital precisa ter uma taxa de amostragem de pelo menos 40 kHz para representar esse alcance. Na prática, as taxas de amostragem de 44,1 kHz e 48 kHz são comumente usadas, com frequências de Nyquist de 22,05 kHz e 24 kHz, respectivamente. Para mais detalhes, consulte Frequência de Nyquist e Faixa de audição.
resampler
Sinônimo de conversor de taxa de amostragem.
Reamostragem
Processo de conversão da taxa de amostragem.
conversor de taxa de amostragem
Módulo que faz a reamostragem.
pia
Saída de um resampler.
fonte
Entrada para um resampler.
aumentar a amostra
Reamostragem, em que a taxa de amostragem do sink é maior que a taxa de amostragem da origem.

Telefonia

AEC
Cancelamento de eco acústico. Uma forma de reduzir o eco de um sinal. Para mais detalhes, consulte Supressão e cancelamento de eco.
cancelamento de ruído
Controle ativo de ruído. Uma forma de melhorar a qualidade de um sinal principal adicionando ativamente o inverso de um sinal secundário indesejado. Para mais detalhes, consulte Controle de ruído ativo.
discador
O app que fornece a interface do usuário para telefonia.
HCO
Transferência de audição. Um modo TTY em que uma mensagem é enviada como texto e recebida como fala.
ruído ambiente
Feedback sonoro do microfone local para o fone de ouvido local. Para mais detalhes, consulte Sidetone.
TDD
Dispositivo de telecomunicações para o surdo. Um tipo específico de teleimpressora (TTY) para pessoas com deficiência auditiva ou de fala.
TTD
Teleimpressora. Muitas vezes usado como sinônimo de TDD.
UE
Equipamento do usuário. O dispositivo de telefone do consumidor.
UMTS
Universal Mobile Telecommunications System. Um tipo de sistema celular móvel.
VCO
Transferência de voz. Um modo TTY em que uma mensagem é enviada como áudio e recebida como texto.

Termos específicos do Android

Os termos específicos do Android incluem termos usados apenas no framework de áudio do Android e termos genéricos que têm um significado especial no Android.

ALSA
Advanced Linux Sound Architecture. Um framework de áudio para Linux que também influenciou outros sistemas. Para uma definição genérica, consulte ALSA. No Android, o ALSA se refere ao framework de áudio e drivers do kernel, e não à classe do modo de usuário. Consulte também TinyALSA.
dispositivo de áudio
Endpoint de E/S de áudio com suporte de uma implementação da HAL.
AudioEffect, AudioEffect
Framework e classe de implementação para efeitos de saída (pós-processamento) e de entrada (pré-processamento). A classe é definida em android.media.audiofx.AudioEffect.
AudioFlinger
Implementação do servidor de som do Android. O AudioFlinger é executado no processo mediaserver. Para uma definição genérica, consulte Servidor de som.
foco de áudio
Conjunto de APIs para gerenciar interações de áudio em vários apps independentes. Para saber mais, consulte Como processar mudanças na saída de áudio e os métodos e constantes relacionados ao foco de android.media.AudioManager.
AudioMixer
Módulo no AudioFlinger responsável por combinar várias faixas e aplicar atenuação (volume) e efeitos. Para uma definição genérica, consulte Mixagem de áudio (música gravada), que discute um mixer como um dispositivo de hardware ou um app de software, em vez de um módulo de software em um sistema.
política de áudio
Serviço responsável por todas as ações que exigem uma decisão de política primeiro, como abrir um novo fluxo de E/S, redirecionar após uma mudança e gerenciar o volume do fluxo.
AudioRecord
Classe de cliente de baixo nível primária para receber dados de um dispositivo de entrada de áudio, como um microfone. Os dados geralmente são no formato PCM. A classe é definida em android.media.AudioRecord.
AudioResampler
Módulo no AudioFlinger responsável pela conversão de taxa de amostragem.
fonte de áudio, AudioSource
Uma enumeração de constantes que indica o caso de uso desejado para capturar entrada de áudio. A classe é definida em android.media.MediaRecorder.AudioSource. A partir do nível 21 da API e versões mais recentes, os atributos de áudio são preferidos.
AudioTrack
Classe de cliente de nível baixo primária para enviar dados a um dispositivo de saída de áudio, como um alto-falante. Os dados geralmente estão no formato PCM. A classe é definida em android.media.AudioTrack.
audio_utils
Biblioteca de utilitários de áudio para recursos como conversão de formato PCM, E/S de arquivos WAV e FIFO não bloqueante, que é praticamente independente da plataforma Android.
cliente
Geralmente, um app ou cliente de app. No entanto, um cliente do AudioFlinger pode ser uma linha de execução em execução no processo do sistema do MediaServer, como ao reproduzir mídia decodificada por um objeto MediaPlayer.
HAL
Camada de abstração de hardware. HAL é um termo genérico no Android. No áudio, é uma camada entre o AudioFlinger e o driver de dispositivo do kernel com uma API C, que substitui o libaudio C++.
Captura rápida
Thread no AudioFlinger que envia dados de áudio para faixas rápidas de latência mais baixa e controla o dispositivo de entrada quando configurado para latência reduzida.
FastMixer
Thread no AudioFlinger que recebe e mistura dados de áudio de faixas rápidas de baixa latência e aciona o dispositivo de saída principal quando configurado para reduzir a latência.
via rápida
AudioTrack ou cliente AudioRecord com latência mais baixa, mas menos recursos em alguns dispositivos e rotas.
MediaPlayer
Classe de cliente de nível mais alto que AudioTrack. Reproduz conteúdo codificado ou conteúdo que inclui faixas de áudio e vídeo multimídia. A classe é definida em android.media.MediaPlayer.
media.log
O recurso de depuração do AudioFlinger está disponível apenas em builds personalizados. Usado para registrar eventos de áudio em um buffer circular, em que os eventos podem ser descartados retroativamente quando necessário.
mediaserver
Processo do sistema Android que contém serviços relacionados à mídia, incluindo o AudioFlinger.
NBAIO
Entrada e saída de áudio não bloqueantes. Abstração para portas do AudioFlinger. O termo pode ser enganoso, já que algumas implementações da API NBAIO oferecem suporte ao bloqueio. As implementações principais do NBAIO são para diferentes tipos de pipes.
Mixer normal
Fila no AudioFlinger que atende aos clientes AudioTrack com mais recursos. Direciona diretamente um dispositivo de saída ou alimenta o submix no FastMixer usando um pipe.
OpenSL ES
Padrão de API de áudio do Khronos Group. As versões do Android com o nível 9 da API e versões mais recentes oferecem suporte a uma API de áudio nativa baseada em um subconjunto do OpenSL ES 1.0.1.
áudio profissional
Abreviatura da flag de recurso android.hardware.audio.pro. Os requisitos estão documentados na seção 5.10 Áudio profissional do CDD do Android. O pro no recurso android.hardware.audio.pro se refere ao nível de desempenho previsível em tempo real, não ao usuário pretendido.
tempo real (substantivo), em tempo real (adjetivo)

Os sistemas de computação em tempo real garantem uma resposta a eventos relevantes dentro de um limite de tempo necessário. O suporte à implementação de dispositivos para computação em tempo real é um pré-requisito necessário, mas insuficiente para atender aos requisitos do recurso android.hardware.audio.pro descrito em áudio profissional.

O desempenho em tempo real também tem benefícios em outros campos além do áudio, como jogos, gráficos, câmera, vídeo, processamento de sensores, realidade virtual (RV) e realidade aumentada (RA).

modo silencioso
Recurso configurável pelo usuário para silenciar o toque e as notificações do smartphone sem afetar a reprodução de mídia (música, vídeos, jogos) ou alarmes.
SoundPool
Classe de cliente de nível mais alto que AudioTrack. Toca clipes de áudio sampleados. Útil para acionar elementos como feedback da interface e sons do jogo. A classe é definida em android.media.SoundPool.
Stagefright
Um mecanismo de reprodução de mídia. Consulte Mídia.
StateQueue
Módulo no AudioFlinger responsável por sincronizar o estado entre as linhas de execução. Enquanto o NBAIO é usado para transmitir dados, o StateQueue é usado para transmitir informações de controle.
de estratégia
Grupo de tipos de transmissão com comportamento semelhante. Usado pelo serviço de política de áudio.
tipo de transmissão
Enumeração
que expressa um caso de uso para saída de áudio. A implementação da política de áudio usa o tipo de stream, junto com outros parâmetros, para determinar as decisões de volume e roteamento. Para conferir uma lista de tipos de transmissão, consulte android.media.AudioManager.
coletor
Consulte Depuração de áudio.
TinyALSA, tinyalsa
O TinyALSA é uma pequena API no modo de usuário acima do kernel ALSA com licença BSD. tinyalsa é o nome de um pacote na biblioteca TinyALSA. A biblioteca é recomendada para implementações do HAL.
ToneGenerator
Classe de cliente de nível mais alto que AudioTrack. Toca sinais de frequência dupla (DTMF, na sigla em inglês). Para mais detalhes, consulte Sinalização de frequência dual e de tons múltiplos e a definição de classe em android.media.ToneGenerator.
faixa
Stream de áudio. Controlado pela classe AudioTrack ou AudioRecord.
curva de atenuação de volume
Mapeamento específico do dispositivo de um índice de volume genérico para um fator de atenuação específico para uma determinada saída.
índice de volume
Número inteiro sem unidade que expressa o volume relativo desejado de um stream. Os elementos da API relacionados ao volume de android.media.AudioManager operam em índices de volume, e não em fatores de atenuação absolutos.