A partir de 27 de março de 2025, recomendamos usar android-latest-release em vez de aosp-main para criar e contribuir com o AOSP. Para mais informações, consulte Mudanças no AOSP.

Esta página foi traduzida pela API Cloud Translation.

Terminologia de áudio

Este glossário de terminologia relacionada ao áudio inclui termos genéricos amplamente usados e termos específicos do Android. Consulte o Glossário da Plataforma Android para ver as definições canônicas dos termos.

Termos genéricos

Termos genéricos relacionados ao áudio têm significados convencionais.

Áudio digital

Os termos de áudio digital se referem ao processamento de som usando sinais de áudio codificados em formato digital. Para mais detalhes, consulte Áudio digital.

AC-3: Um codec de áudio da Dolby. Para mais detalhes, consulte Dolby Digital.
acústica: Estudo das propriedades mecânicas do som, como a forma como a colocação física de transdutores (por exemplo, alto-falantes, microfones) em um dispositivo afeta a qualidade de áudio percebida.
atenuação: Fator multiplicativo menor ou igual a 1,0, aplicado a um sinal de áudio para diminuir o nível do sinal. Compare com ganho.
audiófilo: Pessoa preocupada com uma experiência de reprodução de música superior, especialmente disposta a fazer trocas substanciais (por exemplo, despesas, tamanho do componente, design do ambiente) para a qualidade do som. Para mais detalhes, consulte Audiophile.
AVB: Um padrão para transmissão em tempo real de áudio digital por Ethernet. Para mais detalhes, consulte Ponte de áudio e vídeo.
bits por amostra ou profundidade de bits: Número de bits de informação por amostra.
canal: Fluxo único de informações de áudio, geralmente correspondente a um local de gravação ou reprodução.
redução de mixagem: Diminuir o número de canais, por exemplo, de estéreo para mono ou de 5.1 para estéreo. Isso é feito ao excluir canais, misturar canais ou fazer um processamento de sinal mais avançado. A mistura simples sem atenuação ou limitação tem o potencial de overflow e clipping. Compare com a mistura para cima.
DSD: Stream digital direto. Codificação de áudio proprietária baseada na modulação de densidade de pulso. Enquanto a modulação por código de pulso (PCM) codifica uma forma de onda como uma sequência de amostras de áudio individuais de vários bits, o DSD codifica uma forma de onda como uma sequência de bits em uma taxa de amostragem muito alta (sem o conceito de amostras). O PCM e o DSD representam vários canais por sequências independentes. O DSD é mais adequado para a distribuição de conteúdo do que como uma representação interna para processamento, já que pode ser difícil aplicar algoritmos tradicionais de processamento de sinais digitais (DSP) ao DSD. O DSD é usado em Super Audio CD (SACD) e em DSD sobre PCM (DoP) para USB. Para mais detalhes, consulte Direct Stream Digital.
pato: Reduza temporariamente o volume de um stream quando outro stream ficar ativo. Por exemplo, se uma música estiver tocando quando uma notificação chegar, ela será reduzida enquanto a notificação é reproduzida. Compare com silenciar.
PEPS: Primeiro a entrar, primeiro a sair. Módulo de hardware ou estrutura de dados de software que implementa a fila de dados FIFO. Em um contexto de áudio, os dados armazenados na fila são geralmente frames de áudio. A FIFO pode ser implementada por um buffer circular.
o enquadramento: Conjunto de amostras, uma por canal, em um determinado momento.
frames por buffer: Número de frames transmitidos de um módulo para o próximo de uma só vez. A interface HAL de áudio usa o conceito de frames por buffer.
ganho: Fator multiplicativo maior ou igual a 1,0, aplicado a um sinal de áudio para aumentar o nível do sinal. Compare com a atenuação.
Áudio HD: Áudio de alta definição. Sinônimo de áudio de alta resolução (mas diferente do Intel High Definition Audio).
fones de ouvido: Alto-falantes que se encaixam sobre as orelhas, sem microfone. Compare com o fone de ouvido.
fone de ouvido: Fones de ouvido com microfone. Compare com fones de ouvido.
Hz: Unidades para taxa de amostragem ou taxa de frames.
áudio de alta resolução: Representação com maior profundidade de bits e taxa de amostragem do que os CDs (PCM estéreo de 16 bits a 44,1 kHz) e sem compactação de dados com perda. Equivalente a áudio HD. Para mais detalhes, consulte áudio de alta resolução.
intercalada: Uma representação de áudio digital multicanal que alterna dados entre os canais. Por exemplo, o áudio digital estéreo expresso em formato intercalado alterna esquerda, direita, esquerda, direita.
latência: Atraso de tempo quando um sinal passa por um sistema.
sem perdas: Um algoritmo de compactação de dados sem perdas que preserva a precisão de bits em toda a codificação e decodificação, em que o resultado da decodificação de dados codificados anteriormente é equivalente aos dados originais. Exemplos de formatos de distribuição de conteúdo de áudio sem perdas incluem CDs, PCM em WAV e FLAC. O processo de criação pode reduzir a profundidade de bits ou a taxa de amostragem dos masters. Os formatos de distribuição que preservam a resolução e a precisão de bits dos masters são o assunto do áudio de alta resolução.
com perda: Um algoritmo de compressão de dados com perda que tenta preservar os recursos mais importantes da mídia em toda a codificação e decodificação, em que o resultado da decodificação de dados codificados anteriormente é perceptualmente semelhante aos dados originais, mas não idêntico. Exemplos de algoritmos de compactação de áudio com perdas incluem MP3 e AAC. Como os valores analógicos vêm de um domínio contínuo e os valores digitais são discretos, o ADC e o DAC são conversões com perda em relação à amplitude. Consulte também transparência.
mono: Um canal.
multicanal: Consulte som surround. Em termos estritos, estéreo é mais de um canal e pode ser considerado multicanal. No entanto, esse uso é confuso e, portanto, evitado.
Desativar som: Força temporariamente o volume a ser zero, independente dos controles de volume habituais. Compare com duck.
estouro: Erro audível causado por falha na aceitação dos dados fornecidos em tempo suficiente. Para mais detalhes, consulte Buffer underrun. Compare com underrun.
panorâmica: Direcionar um sinal para uma posição desejada em um campo estéreo ou multicanal.
PCM: Modulação de código de pulso. A codificação de baixo nível mais comum de áudio digital. O sinal de áudio é amostrado em um intervalo regular, chamado de taxa de amostragem, e, em seguida, quantizado para valores discretos em um determinado intervalo, dependendo da profundidade de bits. Por exemplo, para PCM de 16 bits, os valores de amostra são números inteiros entre -32768 e +32767.
rampa: Aumente ou diminua gradualmente o nível de um parâmetro de áudio específico, como o volume ou a intensidade de um efeito. Uma rampa de volume é comumente aplicada ao pausar e retomar a música para evitar uma transição audível difícil.
amostra: Número que representa o valor de áudio de um único canal em um determinado momento.
taxa de amostragem ou taxa de frames: Número de frames por segundo. Embora a taxa de frames seja mais precisa, a taxa de amostragem é usada convencionalmente para indicar a taxa de frames.
sonificação: Uso de som para expressar feedback ou informações, como sons de toque e sons de teclado.
SPL: Nível de pressão sonora, uma medição relativa da pressão sonora.
estéreo: Dois canais. Comparar com multicanal.
ampliação estéreo: Efeito aplicado a um sinal estéreo para criar outro sinal estéreo que soe mais completo e rico. O efeito também pode ser aplicado a um sinal mono, em que é um tipo de upmix.
som surround: Técnica para aumentar a capacidade de um ouvinte de perceber a posição do som além do estéreo esquerdo e direito.
transparência: Resultado ideal da compactação de dados com perdas. A conversão de dados com perdas é transparente se não puder ser distinguida do original por um sujeito humano. Para detalhes, consulte Transparência.
underrun: Erro do Audible causado por falha na entrega dos dados necessários em tempo suficiente. Para mais detalhes, consulte Buffer underrun. Compare com overrun.
Upmix: Aumentar o número de canais, por exemplo, de mono para estéreo ou de estéreo para som surround. É feito por duplicação, panorâmica ou processamento de sinal mais avançado. Compare com a mistura para baixo.
USAC: Codificação unificada de fala e áudio. Um codec de áudio para apps de taxa de bits baixa. Para mais detalhes, consulte Codificação de áudio e fala unificada.
virtualizador: Efeito que tenta espacializar canais de áudio, como tentar simular mais alto-falantes ou dar a ilusão de que as fontes de som têm posição.
volume: Volume, a intensidade subjetiva de um sinal de áudio.

Interconexão entre dispositivos

As tecnologias de interconexão entre dispositivos conectam componentes de áudio e vídeo entre dispositivos e são facilmente visíveis nos conectores externos. O implementador e o usuário final do HAL precisam estar cientes desses termos.

Bluetooth: Tecnologia sem fio de curto alcance. Para detalhes sobre os perfis de Bluetooth e os protocolos de Bluetooth relacionados ao áudio, consulte A2DP para música, SCO para telefonia e Perfil de controle remoto de áudio/vídeo (AVRCP).
DisplayPort: Interface de exibição digital da Video Electronics Standards Association (VESA).
dongle: Um pequeno gadget, especialmente aquele que fica pendurado em outro dispositivo. Para mais detalhes, consulte Dongle.
FireWire: Consulte IEEE 1394.
HDMI: Interface multimídia de alta definição. Interface para transferir dados de áudio e vídeo. Para dispositivos móveis, é usado um conector micro-HDMI (tipo D) ou MHL.
IEEE 1394: Um barramento serial usado para apps de baixa latência em tempo real, como áudio. Também chamado de FireWire. Para mais detalhes, consulte IEEE 1394.
Intel HDA: Intel High Definition Audio (não confunda com áudio de alta definição ou áudio de alta resolução genéricos). Especificação de um conector do painel frontal. Para mais detalhes, consulte Áudio de alta definição da Intel.
interface: Uma interface converte um sinal de uma representação para outra. As interfaces comuns incluem uma interface de áudio USB e uma interface MIDI.
nível da linha: A intensidade de um sinal de áudio analógico que passa entre os componentes de áudio, não transdutores. Para mais detalhes, consulte Nível da linha.
MHL: Mobile High-Definition Link. Interface de áudio e vídeo para dispositivos móveis, geralmente por meio de um conector micro-USB.
conector do smartphone: Componente mini ou submini que conecta um dispositivo a fones de ouvido com fio, headset ou amplificador de nível de linha.
SlimPort: Adaptador de micro USB para HDMI.
S/PDIF: Formato de interface digital Sony/Philips. Interconexão para PCM descompactado e IEC 61937. Para mais detalhes, consulte S/PDIF. O S/PDIF é a variante de nível de consumidor do AES3.
Thunderbolt: Interface multimídia que compete com USB e HDMI para conexão com periféricos de última geração. Para mais detalhes, consulte Thunderbolt.
TOSLINK: Um cabo de áudio óptico usado com S/PDIF. Para mais detalhes, consulte TOSLINK.
USB: Universal Serial Bus. Para mais detalhes, consulte USB.

Interconexão intradispositivo

As tecnologias de interconexão intradispositivo conectam componentes de áudio internos em um determinado dispositivo e não são visíveis sem desmontar o dispositivo. O implementador do HAL precisa estar ciente disso, mas o usuário final não. Para detalhes sobre interconexões intradispositivo, consulte os seguintes artigos:

GPIO
I²C, para o canal de controle
I²S, para dados de áudio, mais simples que o SLIMbus
McASP
SLIMbus (link em inglês)
SPI
AC'97
Intel HDA
SoundWire
TDM

No system on chip (ASoC) do ALSA, elas são chamadas coletivamente de interfaces de áudio digital (DAIs).

Caminho do sinal de áudio

Os termos do caminho do sinal de áudio se referem ao caminho que os dados de áudio seguem de um app para o transdutor ou do transdutor para um app.

ADC: Conversor analógico-digital. Módulo que converte um sinal analógico (contínuo em tempo e amplitude) em um sinal digital (discreto em tempo e amplitude). Conceitualmente, um ADC consiste em uma amostragem periódica seguida por um quantizador, embora não precise ser implementado dessa maneira. Um ADC é geralmente precedido por um filtro passa-baixa para remover componentes de alta frequência que não podem ser representados usando a taxa de amostragem desejada. Para mais detalhes, consulte Conversor analógico-digital.
AP: Processador de apps. Principal computador de uso geral em um dispositivo móvel.
codec: Codificador-decodificador. Módulo que codifica e decodifica um sinal de áudio de uma representação para outra (normalmente analógico para PCM ou PCM para analógico). Em termos rigorosos, o codec é reservado para módulos que codificam e decodificam, mas pode ser usado de forma vaga para se referir a apenas um deles. Para mais detalhes, consulte Codec de áudio.
DAC: Conversor digital-analógico. Módulo que converte um sinal digital (discreto em tempo e amplitude) em um sinal analógico (contínuo em tempo e amplitude). Geralmente seguido por um filtro passa-baixa para remover componentes de alta frequência introduzidos pela quantização digital. Para mais detalhes, consulte Conversor digital-analógico.
DSP: Processador de sinais digitais. Componente opcional normalmente localizado após o processador do app (para saída) ou antes do processador do app (para entrada). O objetivo principal é descarregar o processador do app e oferecer recursos de processamento de sinal com um custo de energia menor.
PDM: Modulação de densidade de pulso. Forma de modulação usada para representar um sinal analógico por um sinal digital, em que a densidade relativa de 1s em relação a 0s indica o nível do sinal. É comumente usado por conversores digitais-analógicos. Para mais detalhes, consulte Modulação por densidade de pulso.
PWM: Modulação por largura de pulso. Forma de modulação usada para representar um sinal analógico por um sinal digital, em que a largura relativa de um pulso digital indica o nível do sinal. É comumente usado por conversores analógico-digital. Para mais detalhes, consulte Modulação por largura de pulso.
transdutor: Converte variações em quantidades físicas reais em sinais elétricos. No áudio, a quantidade física é a pressão do som, e os transdutores são o alto-falante e o microfone. Para mais detalhes, consulte Transdutor.

Conversão de taxa de amostragem

Os termos de conversão de taxa de amostragem se referem ao processo de conversão de uma taxa de amostragem para outra.

reduzir a amostra: Reamostragem, em que a taxa de amostragem do sink é menor que a taxa de amostragem da fonte.
Frequência de Nyquist: Componente de frequência máxima que pode ser representado por um sinal discretizado em 1/2 de uma determinada taxa de amostragem. Por exemplo, o alcance da audição humana se estende até aproximadamente 20 kHz. Portanto, um sinal de áudio digital precisa ter uma taxa de amostragem de pelo menos 40 kHz para representar esse alcance. Na prática, as taxas de amostragem de 44,1 kHz e 48 kHz são comumente usadas, com frequências de Nyquist de 22,05 kHz e 24 kHz, respectivamente. Para mais detalhes, consulte Frequência de Nyquist e Faixa de audição.
resampler: Sinônimo de conversor de taxa de amostragem.
Reamostragem: Processo de conversão da taxa de amostragem.
conversor de taxa de amostragem: Módulo que faz a reamostragem.
pia: Saída de um resampler.
fonte: Entrada para um resampler.
aumentar a amostra: Reamostragem, em que a taxa de amostragem do sink é maior que a taxa de amostragem da origem.

Telefonia

AEC: Cancelamento de eco acústico. Uma forma de reduzir o eco de um sinal. Para mais detalhes, consulte Supressão e cancelamento de eco.
cancelamento de ruído: Controle ativo de ruído. Uma forma de melhorar a qualidade de um sinal principal adicionando ativamente o inverso de um sinal secundário indesejado. Para mais detalhes, consulte Controle de ruído ativo.
discador: O app que fornece a interface do usuário para telefonia.
HCO: Transferência de audição. Um modo TTY em que uma mensagem é enviada como texto e recebida como fala.
ruído ambiente: Feedback sonoro do microfone local para o fone de ouvido local. Para mais detalhes, consulte Sidetone.
TDD: Dispositivo de telecomunicações para o surdo. Um tipo específico de teleimpressora (TTY) para pessoas com deficiência auditiva ou de fala.
TTD: Teleimpressora. Muitas vezes usado como sinônimo de TDD.
UE: Equipamento do usuário. O dispositivo de telefone do consumidor.
UMTS: Universal Mobile Telecommunications System. Um tipo de sistema celular móvel.
VCO: Transferência de voz. Um modo TTY em que uma mensagem é enviada como áudio e recebida como texto.

Termos específicos do Android

Os termos específicos do Android incluem termos usados apenas no framework de áudio do Android e termos genéricos que têm um significado especial no Android.

ALSA

Advanced Linux Sound Architecture. Um framework de áudio para Linux que também influenciou outros sistemas. Para uma definição genérica, consulte ALSA. No Android, o ALSA se refere ao framework de áudio e drivers do kernel, e não à classe do modo de usuário. Consulte também TinyALSA.

dispositivo de áudio

Endpoint de E/S de áudio com suporte de uma implementação da HAL.

AudioEffect, AudioEffect

Framework e classe de implementação para efeitos de saída (pós-processamento) e de entrada (pré-processamento). A classe é definida em android.media.audiofx.AudioEffect.

AudioFlinger

Implementação do servidor de som do Android. O AudioFlinger é executado no processo mediaserver. Para uma definição genérica, consulte Servidor de som.

foco de áudio

Conjunto de APIs para gerenciar interações de áudio em vários apps independentes. Para saber mais, consulte Como processar mudanças na saída de áudio e os métodos e constantes relacionados ao foco de android.media.AudioManager.

AudioMixer

Módulo no AudioFlinger responsável por combinar várias faixas e aplicar atenuação (volume) e efeitos. Para uma definição genérica, consulte Mixagem de áudio (música gravada), que discute um mixer como um dispositivo de hardware ou um app de software, em vez de um módulo de software em um sistema.

política de áudio

Serviço responsável por todas as ações que exigem uma decisão de política primeiro, como abrir um novo fluxo de E/S, redirecionar após uma mudança e gerenciar o volume do fluxo.

AudioRecord

Classe de cliente de baixo nível primária para receber dados de um dispositivo de entrada de áudio, como um microfone. Os dados geralmente são no formato PCM. A classe é definida em android.media.AudioRecord.

AudioResampler

Módulo no AudioFlinger responsável pela conversão de taxa de amostragem.

fonte de áudio, AudioSource

Uma enumeração de constantes que indica o caso de uso desejado para capturar entrada de áudio. A classe é definida em android.media.MediaRecorder.AudioSource. A partir do nível 21 da API e versões mais recentes, os atributos de áudio são preferidos.

AudioTrack

Classe de cliente de nível baixo primária para enviar dados a um dispositivo de saída de áudio, como um alto-falante. Os dados geralmente estão no formato PCM. A classe é definida em android.media.AudioTrack.

audio_utils

Biblioteca de utilitários de áudio para recursos como conversão de formato PCM, E/S de arquivos WAV e FIFO não bloqueante, que é praticamente independente da plataforma Android.

cliente

Geralmente, um app ou cliente de app. No entanto, um cliente do AudioFlinger pode ser uma linha de execução em execução no processo do sistema do MediaServer, como ao reproduzir mídia decodificada por um objeto MediaPlayer.

HAL

Camada de abstração de hardware. HAL é um termo genérico no Android. No áudio, é uma camada entre o AudioFlinger e o driver de dispositivo do kernel com uma API C, que substitui o libaudio C++.

Captura rápida

Thread no AudioFlinger que envia dados de áudio para faixas rápidas de latência mais baixa e controla o dispositivo de entrada quando configurado para latência reduzida.

FastMixer

Thread no AudioFlinger que recebe e mistura dados de áudio de faixas rápidas de baixa latência e aciona o dispositivo de saída principal quando configurado para reduzir a latência.

via rápida

AudioTrack ou cliente AudioRecord com latência mais baixa, mas menos recursos em alguns dispositivos e rotas.

MediaPlayer

Classe de cliente de nível mais alto que AudioTrack. Reproduz conteúdo codificado ou conteúdo que inclui faixas de áudio e vídeo multimídia. A classe é definida em android.media.MediaPlayer.

media.log

O recurso de depuração do AudioFlinger está disponível apenas em builds personalizados. Usado para registrar eventos de áudio em um buffer circular, em que os eventos podem ser descartados retroativamente quando necessário.

mediaserver

Processo do sistema Android que contém serviços relacionados à mídia, incluindo o AudioFlinger.

NBAIO

Entrada e saída de áudio não bloqueantes. Abstração para portas do AudioFlinger. O termo pode ser enganoso, já que algumas implementações da API NBAIO oferecem suporte ao bloqueio. As implementações principais do NBAIO são para diferentes tipos de pipes.

Mixer normal

Fila no AudioFlinger que atende aos clientes AudioTrack com mais recursos. Direciona diretamente um dispositivo de saída ou alimenta o submix no FastMixer usando um pipe.

OpenSL ES

Padrão de API de áudio do Khronos Group. As versões do Android com o nível 9 da API e versões mais recentes oferecem suporte a uma API de áudio nativa baseada em um subconjunto do OpenSL ES 1.0.1.

áudio profissional

Abreviatura da flag de recurso android.hardware.audio.pro. Os requisitos estão documentados na seção 5.10 Áudio profissional do CDD do Android. O pro no recurso android.hardware.audio.pro se refere ao nível de desempenho previsível em tempo real, não ao usuário pretendido.

tempo real (substantivo), em tempo real (adjetivo)

Os sistemas de computação em tempo real garantem uma resposta a eventos relevantes dentro de um limite de tempo necessário. O suporte à implementação de dispositivos para computação em tempo real é um pré-requisito necessário, mas insuficiente para atender aos requisitos do recurso android.hardware.audio.pro descrito em áudio profissional.

O desempenho em tempo real também tem benefícios em outros campos além do áudio, como jogos, gráficos, câmera, vídeo, processamento de sensores, realidade virtual (RV) e realidade aumentada (RA).

modo silencioso

Recurso configurável pelo usuário para silenciar o toque e as notificações do smartphone sem afetar a reprodução de mídia (música, vídeos, jogos) ou alarmes.

SoundPool

Classe de cliente de nível mais alto que AudioTrack. Toca clipes de áudio sampleados. Útil para acionar elementos como feedback da interface e sons do jogo. A classe é definida em android.media.SoundPool.

Stagefright

Um mecanismo de reprodução de mídia. Consulte Mídia.

StateQueue

Módulo no AudioFlinger responsável por sincronizar o estado entre as linhas de execução. Enquanto o NBAIO é usado para transmitir dados, o StateQueue é usado para transmitir informações de controle.

de estratégia

Grupo de tipos de transmissão com comportamento semelhante. Usado pelo serviço de política de áudio.

tipo de transmissão

que expressa um caso de uso para saída de áudio. A implementação da política de áudio usa o tipo de stream, junto com outros parâmetros, para determinar as decisões de volume e roteamento. Para conferir uma lista de tipos de transmissão, consulte android.media.AudioManager.

coletor

Consulte Depuração de áudio.

TinyALSA, tinyalsa

O TinyALSA é uma pequena API no modo de usuário acima do kernel ALSA com licença BSD. tinyalsa é o nome de um pacote na biblioteca TinyALSA. A biblioteca é recomendada para implementações do HAL.

ToneGenerator

Classe de cliente de nível mais alto que AudioTrack. Toca sinais de frequência dupla (DTMF, na sigla em inglês). Para mais detalhes, consulte Sinalização de frequência dual e de tons múltiplos e a definição de classe em android.media.ToneGenerator.

faixa

Stream de áudio. Controlado pela classe AudioTrack ou AudioRecord.

curva de atenuação de volume

Mapeamento específico do dispositivo de um índice de volume genérico para um fator de atenuação específico para uma determinada saída.

índice de volume

Número inteiro sem unidade que expressa o volume relativo desejado de um stream. Os elementos da API relacionados ao volume de android.media.AudioManager operam em índices de volume, e não em fatores de atenuação absolutos.

Terminologia de áudio Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.