Terminologia de áudio

Este glossário de terminologia relacionada a áudio inclui termos genéricos amplamente usados ​​e termos específicos do Android. Consulte o Glossário da Plataforma Android central para obter as definições canônicas dos termos.

Termos genéricos

Termos genéricos relacionados a áudio têm significados convencionais.

Áudio digital

Os termos de áudio digital referem-se ao tratamento do som usando sinais de áudio codificados em formato digital. Para obter detalhes, consulte Áudio digital .

AC3
Um codec de áudio por Dolby. Para obter detalhes, consulte Dolby Digital .
acústica
Estudo das propriedades mecânicas do som, por exemplo, como o posicionamento físico dos transdutores (alto-falantes, microfones, etc.) em um dispositivo afeta a qualidade do áudio percebida.
atenuação
Fator multiplicativo menor ou igual a 1,0, aplicado a um sinal de áudio para diminuir o nível do sinal. Compare para ganhar .
audiófilo
Pessoa preocupada com uma experiência de reprodução de música superior, especialmente disposta a fazer trocas substanciais (despesas, tamanho do componente, design da sala, etc.) pela qualidade do som. Para obter detalhes, consulte audiófilo .
AVB
Um padrão para transmissão em tempo real de áudio digital pela Ethernet. Para obter detalhes, consulte Ponte de áudio e vídeo .
bits por amostra ou profundidade de bits
Número de bits de informação por amostra.
canal
Fluxo único de informações de áudio, geralmente correspondendo a um local de gravação ou reprodução.
downmixing
Diminua o número de canais, como de estéreo para mono ou de 5.1 para estéreo. Realizado pela eliminação de canais, canais de mixagem ou processamento de sinal mais avançado. A mistura simples sem atenuação ou limitação tem o potencial de overflow e clipping. Compare com upmixing .
DSD
Transmissão Direta Digital. Codificação de áudio proprietária baseada em modulação de densidade de pulso . Enquanto a Pulse Code Modulation (PCM) codifica uma forma de onda como uma sequência de amostras de áudio individuais de vários bits, o DSD codifica uma forma de onda como uma sequência de bits em uma taxa de amostragem muito alta (sem o conceito de amostras). Tanto o PCM quanto o DSD representam vários canais por sequências independentes. O DSD é mais adequado para distribuição de conteúdo do que como uma representação interna para processamento, pois pode ser difícil aplicar algoritmos tradicionais de processamento de sinal digital (DSP) ao DSD. DSD é usado em Super Audio CD (SACD) e em DSD over PCM (DoP) para USB. Para obter detalhes, consulte Direct Stream Digital .
pato
Reduza temporariamente o volume de um fluxo quando outro fluxo se tornar ativo. Por exemplo, se a música estiver tocando quando uma notificação chegar, a música diminuirá enquanto a notificação é reproduzida. Compare com mudo .
FIFO
Primeiro a entrar, primeiro a sair. Módulo de hardware ou estrutura de dados de software que implementa o enfileiramento de dados First In, First Out . Em um contexto de áudio, os dados armazenados na fila são tipicamente quadros de áudio. FIFO pode ser implementado por um buffer circular .
quadro
Conjunto de amostras, uma por canal, em um ponto no tempo.
quadros por buffer
Número de quadros passados ​​de um módulo para o próximo ao mesmo tempo. A interface de áudio HAL usa o conceito de quadros por buffer.
ganho
Fator multiplicativo maior ou igual a 1,0, aplicado a um sinal de áudio para aumentar o nível do sinal. Compare com a atenuação .
Áudio HD
Áudio de alta definição. Sinônimo de áudio de alta resolução (mas diferente do áudio de alta definição Intel).
fones de ouvido
Altifalantes que se encaixam nos ouvidos, sem microfone. Compare com fone de ouvido.
fone de ouvido
Fones de ouvido com microfone. Compare com fones de ouvido.
Hz
Unidades para taxa de amostragem ou taxa de quadros.
áudio de alta resolução
Representação com maior profundidade de bits e taxa de amostragem do que CDs (PCM estéreo de 16 bits a 44,1 kHz) e sem compressão de dados com perdas. Equivalente ao áudio HD. Para obter detalhes, consulte áudio de alta resolução .
intercalado
Uma representação para áudio digital multicanal que alterna dados entre canais. Por exemplo, o áudio digital estéreo expresso em formato intercalado é esquerdo, direito, esquerdo, direito, etc.
latência
Atraso de tempo quando um sinal passa por um sistema.
sem perdas
Um algoritmo de compactação de dados sem perdas que preserva a precisão de bits na codificação e decodificação, onde o resultado da decodificação de dados codificados anteriormente é equivalente aos dados originais. Exemplos de formatos de distribuição de conteúdo de áudio sem perdas incluem CDs , PCM dentro de WAV e FLAC . O processo de autoria pode reduzir a profundidade de bits ou a taxa de amostragem dos mestres ; formatos de distribuição que preservam a resolução e a precisão de bits dos mestres são o assunto do áudio de alta resolução.
com perdas
Um algoritmo de compactação de dados com perdas que tenta preservar os recursos mais importantes da mídia na codificação e decodificação, onde o resultado da decodificação de dados codificados anteriormente é perceptivelmente semelhante aos dados originais, mas não idêntico. Exemplos de algoritmos de compressão de áudio com perdas incluem MP3 e AAC. Como os valores analógicos são de um domínio contínuo e os valores digitais são discretos, ADC e DAC são conversões com perdas em relação à amplitude. Consulte também transparência .
mono
Um canal.
multicanal
Consulte som surround . Em termos estritos, estéreo é mais de um canal e pode ser considerado multicanal; no entanto, esse uso é confuso e, portanto, evitado.
mudo
Forçar temporariamente o volume a ser zero, independente dos controles de volume usuais.
superação
Falha audível causada por falha em aceitar os dados fornecidos em tempo suficiente. Para obter detalhes, consulte buffer underrun . Compare com underrun .
panorâmico
Direcione um sinal para uma posição desejada dentro de um campo estéreo ou multicanal.
PCM
Modulação de código de pulso. Codificação de baixo nível mais comum de áudio digital. O sinal de áudio é amostrado em um intervalo regular, chamado de taxa de amostragem, e então quantizado para valores discretos dentro de um intervalo específico, dependendo da profundidade de bits. Por exemplo, para PCM de 16 bits, os valores de amostra são inteiros entre -32768 e +32767.
rampa
Aumente ou diminua gradualmente o nível de um parâmetro de áudio específico, como o volume ou a intensidade de um efeito. Uma rampa de volume é comumente aplicada ao pausar e retomar a música para evitar uma transição audível forte.
amostra
Número que representa o valor de áudio de um único canal em um determinado momento.
taxa de amostragem ou taxa de quadros
Número de quadros por segundo. Embora a taxa de quadros seja mais precisa, a taxa de amostragem é convencionalmente usada para significar a taxa de quadros.
sonificação
Uso do som para expressar feedback ou informações, como sons de toque e sons de teclado.
SPL
Nível de pressão sonora, uma medida relativa da pressão sonora.
estéreo
Dois canais.
ampliação estéreo
Efeito aplicado a um sinal estéreo para criar outro sinal estéreo que soe mais completo e rico. O efeito também pode ser aplicado a um sinal mono, onde é um tipo de upmixing.
o som ao Redor
Técnicas para aumentar a capacidade de um ouvinte de perceber a posição do som além do estéreo esquerdo e direito.
transparência
Resultado ideal de compressão de dados com perdas. A conversão de dados com perdas é transparente se for perceptivelmente indistinguível do original por um sujeito humano. Para obter detalhes, consulte Transparência .
underrun
Falha audível causada por falha no fornecimento de dados necessários em tempo suficiente. Para obter detalhes, consulte buffer underrun . Compare com superação .
misturando
Aumente o número de canais, como de mono para estéreo ou de estéreo para som surround. Realizado por duplicação, panning ou processamento de sinal mais avançado. Compare com downmixing .
USAC
Um codec de áudio para aplicativos de baixa taxa de bits. Para obter detalhes, consulte Fala Unificada e Codificação de Áudio .
virtualizador
Efeito que tenta espacializar os canais de áudio, como tentar simular mais alto-falantes ou dar a ilusão de que as fontes sonoras têm posição.
volume
Loudness, a força subjetiva de um sinal de áudio.

Interconexão entre dispositivos

As tecnologias de interconexão entre dispositivos conectam componentes de áudio e vídeo entre dispositivos e são facilmente visíveis nos conectores externos. O implementador HAL e o usuário final devem estar cientes desses termos.

Bluetooth
Tecnologia sem fio de curto alcance. Para obter detalhes sobre os perfis Bluetooth relacionados ao áudio e os protocolos Bluetooth , consulte A2DP para música, SCO para telefonia e Perfil de controle remoto de áudio/vídeo (AVRCP) .
DisplayPort
Interface de exibição digital pela Video Electronics Standards Association (VESA).
conector de wifi
Um dongle é um pequeno gadget, especialmente um que fica pendurado em outro dispositivo.
FireWire
Veja IEEE 1394.
HDMI
Interface multimídia de alta definição. Interface para transferência de dados de áudio e vídeo. Para dispositivos móveis, é usado um conector micro-HDMI (tipo D) ou MHL.
IEEE 1394
IEEE 1394 , também chamado de FireWire, é um barramento serial usado para aplicativos de baixa latência em tempo real, como áudio.
Intel HDA
Áudio de alta definição Intel (não confunda com áudio genérico de alta definição ou áudio de alta resolução ). Especificação para um conector do painel frontal. Para obter detalhes, consulte Áudio de alta definição Intel .
interface
Uma interface converte um sinal de uma representação para outra. As interfaces comuns incluem uma interface de áudio USB e uma interface MIDI.
nível de linha
Nível de linha é a força de um sinal de áudio analógico que passa entre componentes de áudio, não transdutores.
MHL
Link de alta definição móvel. Interface de áudio/vídeo móvel, geralmente através de conector micro-USB.
conector de telefone
Componente mini ou submini que conecta um dispositivo a fones de ouvido com fio, fone de ouvido ou amplificador de nível de linha.
SlimPort
Adaptador de micro-USB para HDMI.
S/PDIF
Formato de interface digital Sony/Philips. Interconexão para PCM não compactado e IEC 61937. Para obter detalhes, consulte S/PDIF . S/PDIF é a variante de grau de consumidor do AES3 .
Raio
Interface multimídia que compete com USB e HDMI para conexão com periféricos de última geração. Para obter detalhes, consulte Thunderbolt .
TOSLINK
TOSLINK é um cabo de áudio óptico usado com S/PDIF .
USB
Barramento serial universal. Para obter detalhes, consulte USB .

Interconexão entre dispositivos

As tecnologias de interconexão intradispositivo conectam componentes de áudio internos em um determinado dispositivo e não são visíveis sem desmontar o dispositivo. O implementador HAL pode precisar estar ciente disso, mas não o usuário final. Para obter detalhes sobre interconexões entre dispositivos, consulte os seguintes artigos:

No ALSA System on Chip (ASoC) , estes são chamados coletivamente de Interfaces de Áudio Digital (DAI).

Caminho do sinal de áudio

Os termos do caminho do sinal de áudio estão relacionados ao caminho do sinal que os dados de áudio seguem de um aplicativo para o transdutor ou vice-versa.

ADC
Conversor analógico para digital. Módulo que converte um sinal analógico (contínuo em tempo e amplitude) em sinal digital (discreto em tempo e amplitude). Conceitualmente, um ADC consiste em um sample-and-hold periódico seguido por um quantizador, embora não precise ser implementado dessa maneira. Um ADC geralmente é precedido por um filtro passa-baixa para remover quaisquer componentes de alta frequência que não sejam representáveis ​​usando a taxa de amostragem desejada. Para obter detalhes, consulte Conversor analógico-digital .
PA
Processador de aplicativos. Computador principal de uso geral em um dispositivo móvel.
codec
Codificador-decodificador. Módulo que codifica e/ou decodifica um sinal de áudio de uma representação para outra (tipicamente analógico para PCM ou PCM para analógico). Em termos estritos, o codec é reservado para módulos que codificam e decodificam, mas podem ser usados ​​livremente para se referir a apenas um deles. Para obter detalhes, consulte Codec de áudio .
DAC
Conversor digital-analógico. Módulo que converte um sinal digital (discreto em tempo e amplitude) para um sinal analógico (contínuo em tempo e amplitude). Frequentemente seguido por um filtro passa-baixa para remover componentes de alta frequência introduzidos pela quantização digital. Para obter detalhes, consulte Conversor digital-analógico .
DSP
Processador de sinal digital. Componente opcional normalmente localizado após o processador do aplicativo (para saída) ou antes do processador do aplicativo (para entrada). O objetivo principal é descarregar o processador do aplicativo e fornecer recursos de processamento de sinal com um custo de energia mais baixo.
PDM
Modulação de densidade de pulso. Forma de modulação utilizada para representar um sinal analógico por um sinal digital, onde a densidade relativa de 1s versus 0s indica o nível do sinal. Comumente usado por conversores digital para analógico. Para obter detalhes, consulte Modulação de densidade de pulso .
PWM
Modulação de largura de pulso. Forma de modulação utilizada para representar um sinal analógico por um sinal digital, onde a largura relativa de um pulso digital indica o nível do sinal. Comumente usado por conversores analógico-digital. Para obter detalhes, consulte Modulação por largura de pulso .
transdutor
Converte variações em quantidades físicas do mundo real em sinais elétricos. No áudio, a quantidade física é a pressão sonora, e os transdutores são o alto-falante e o microfone. Para obter detalhes, consulte Transdutor .

Conversão de taxa de amostra

Os termos de conversão de taxa de amostragem estão relacionados ao processo de conversão de uma taxa de amostragem para outra.

reduzir a amostra
Reamostragem, em que a taxa de amostragem do coletor < taxa de amostragem da origem.
Frequência de Nyquist
Componente de frequência máxima que pode ser representada por um sinal discretizado a 1/2 de uma determinada taxa de amostragem. Por exemplo, a faixa de audição humana se estende até aproximadamente 20 kHz, portanto, um sinal de áudio digital deve ter uma taxa de amostragem de pelo menos 40 kHz para representar essa faixa. Na prática, taxas de amostragem de 44,1 kHz e 48 kHz são comumente usadas, com frequências de Nyquist de 22,05 kHz e 24 kHz, respectivamente. Para obter detalhes, consulte Frequência de Nyquist e Alcance de audição .
reamostrador
Sinônimo de conversor de taxa de amostragem.
reamostragem
Processo de conversão da taxa de amostragem.
conversor de taxa de amostragem
Módulo que reamostra.
afundar
Saída de um reamostrador.
fonte
Entrada para um reamostrador.
aumentar a amostra
Reamostragem, em que taxa de amostragem do coletor > taxa de amostragem da origem.

Telefonia

AEC
O cancelamento de eco acústico é um meio de reduzir o eco de um sinal. Para obter detalhes, consulte Supressão e cancelamento de eco .
ANC
O Controle Ativo de Ruído é um meio de melhorar a qualidade de um sinal primário adicionando ativamente o inverso de um sinal secundário indesejado. Para obter detalhes, consulte Controle de ruído ativo .
discador
O aplicativo que fornece a interface do usuário para telefonia.
HCO
A Transmissão Auditiva é um modo TTY no qual uma mensagem é enviada como texto e recebida como fala.
tom lateral
Feedback audível do microfone local para o fone de ouvido local. Para obter detalhes, consulte Sidetone .
TDD
Dispositivo de telecomunicações para surdos é um tipo específico de Teletypewriter (TTY) para pessoas com deficiência auditiva ou de fala.
TTY
Teledatilógrafo . Muitas vezes usado de forma intercambiável com TDD.
UE
Equipamento do usuário. O dispositivo de telefone do consumidor.
UMTS
Sistema Universal de Telecomunicações Móveis . Um tipo de sistema celular móvel.
VCO
Voice Carry-Over é um modo TTY no qual uma mensagem é enviada como áudio e recebida como texto.

Termos específicos do Android

Os termos específicos do Android incluem termos usados ​​apenas na estrutura de áudio do Android e termos genéricos que têm um significado especial no Android.

ALSA
Arquitetura de som Linux avançada. Um framework de áudio para Linux que também influenciou outros sistemas. Para uma definição genérica, consulte ALSA . No Android, ALSA refere-se à estrutura e aos drivers de áudio do kernel e não à API do modo de usuário. Veja também tinyalsa .
dispositivo de áudio
Endpoint de E/S de áudio apoiado por uma implementação HAL.
Efeito de áudio
API e framework de implementação para efeitos de saída (pós-processamento) e efeitos de entrada (pré-processamento). A API é definida em android.media.audiofx.AudioEffect .
AudioFlinger
Implementação do servidor de som Android. AudioFlinger é executado dentro do processo mediaserver. Para uma definição genérica, consulte Servidor de som .
foco de áudio
Conjunto de APIs para gerenciar interações de áudio em vários aplicativos independentes. Para obter detalhes, consulte Gerenciando o foco de áudio e os métodos e constantes relacionados ao foco de android.media.AudioManager .
AudioMixer
Módulo em AudioFlinger responsável por combinar várias faixas e aplicar atenuação (volume) e efeitos. Para uma definição genérica, consulte Mixagem de áudio (música gravada) (discute um mixer como um dispositivo de hardware ou aplicativo de software, em vez de um módulo de software dentro de um sistema).
política de áudio
Serviço responsável por todas as ações que exigem que uma decisão de política seja tomada primeiro, como abrir um novo fluxo de E/S, redirecionar após uma alteração e gerenciamento de volume de fluxo.
Gravação de audio
API de cliente primário de baixo nível para receber dados de um dispositivo de entrada de áudio, como um microfone. Os dados geralmente são no formato PCM. A API é definida em android.media.AudioRecord .
AudioResampler
Módulo em AudioFlinger responsável pela conversão da taxa de amostragem .
fonte de áudio
Uma enumeração de constantes que indica o caso de uso desejado para capturar a entrada de áudio. Para obter detalhes, consulte a fonte de áudio . A partir do nível de API 21 e superior, os atributos de áudio são preferidos.
Faixa de áudio
API de cliente primário de baixo nível para enviar dados para um dispositivo de saída de áudio, como um alto-falante. Os dados geralmente estão no formato PCM. A API é definida em android.media.AudioTrack .
audio_utils
Biblioteca de utilitários de áudio para recursos como conversão de formato PCM, E/S de arquivo WAV e FIFO sem bloqueio , que é amplamente independente da plataforma Android.
cliente
Geralmente um aplicativo ou cliente de aplicativo. No entanto, um cliente AudioFlinger pode ser um thread em execução no processo do sistema mediaserver, como ao reproduzir mídia decodificada por um objeto MediaPlayer.
HAL
Camada de abstração de hardware. HAL é um termo genérico no Android; em áudio, é uma camada entre AudioFlinger e o driver de dispositivo do kernel com uma API C (que substitui o C++ libaudio).
FastCapture
Thread dentro do AudioFlinger que envia dados de áudio para faixas rápidas de latência mais baixa e aciona o dispositivo de entrada quando configurado para latência reduzida.
FastMixer
Thread dentro do AudioFlinger que recebe e mistura dados de áudio de faixas rápidas de baixa latência e aciona o dispositivo de saída principal quando configurado para latência reduzida.
faixa rápida
Cliente AudioTrack ou AudioRecord com menor latência, mas menos recursos em alguns dispositivos e rotas.
Reprodutor de mídia
API de cliente de nível superior que AudioTrack. Reproduz conteúdo codificado ou conteúdo que inclui faixas de áudio e vídeo multimídia.
media.log
Recurso de depuração AudioFlinger disponível apenas em compilações personalizadas. Usado para registrar eventos de áudio em um buffer circular onde eles podem ser despejados retroativamente quando necessário.
servidor de mídia
Processo do sistema Android que contém serviços relacionados à mídia, incluindo AudioFlinger.
NBAIO
Entrada/saída de áudio sem bloqueio. Abstração para portas AudioFlinger. O termo pode ser enganoso, pois algumas implementações da API NBAIO oferecem suporte ao bloqueio. As principais implementações do NBAIO são para diferentes tipos de tubos.
misturador normal
Thread dentro do AudioFlinger que atende a maioria dos clientes AudioTrack com recursos completos. Aciona diretamente um dispositivo de saída ou alimenta seu submix no FastMixer por meio de um tubo.
OpenSL ES
Padrão de API de áudio do The Khronos Group . As versões do Android desde o nível 9 da API são compatíveis com uma API de áudio nativa baseada em um subconjunto do OpenSL ES 1.0.1 .
áudio profissional
Abreviação do sinalizador de recurso android.hardware.audio.pro . Os requisitos estão documentados na seção 5.10 Professional Audio do Android CDD. O "pro" no recurso android.hardware.audio.pro refere-se ao nível de desempenho previsível em tempo real, não ao usuário pretendido.
tempo real

Os sistemas de computação em tempo real garantem uma resposta a eventos relevantes dentro de um limite de tempo necessário. O suporte à implementação do dispositivo para computação em tempo real é um pré-requisito necessário, mas não suficiente, para atender aos requisitos do recurso android.hardware.audio.pro descrito acima.

O desempenho em tempo real também traz benefícios em outros campos além do áudio, como jogos, gráficos, câmera, vídeo, processamento de sensores, Realidade Virtual (VR) e Realidade Aumentada (AR).

modo silencioso
Recurso configurável pelo usuário para silenciar a campainha do telefone e as notificações sem afetar a reprodução de mídia (música, vídeos, jogos) ou alarmes.
Sound Pool
API de cliente de nível superior que AudioTrack. Reproduz clipes de áudio amostrados. Útil para acionar o feedback da interface do usuário, sons de jogos etc. A API é definida em android.media.SoundPool .
Medo do palco
Veja Mídia .
StateQueue
Módulo dentro do AudioFlinger responsável por sincronizar o estado entre as threads. Enquanto NBAIO é usado para passar dados, StateQueue é usado para passar informações de controle.
estratégia
Grupo de tipos de fluxo com comportamento semelhante. Usado pelo serviço de política de áudio.
tipo de fluxo
Enumeração que expressa um caso de uso para saída de áudio. A implementação da política de áudio usa o tipo de fluxo, juntamente com outros parâmetros, para determinar o volume e as decisões de roteamento. Para obter uma lista de tipos de stream, consulte android.media.AudioManager .
pia de tee
Consulte Depuração de áudio .
minúscula
Pequena API de modo de usuário acima do kernel ALSA com licença BSD. Recomendado para implementações HAL.
Gerador de tons
API de cliente de nível superior que AudioTrack. Reproduz sinais de multifrequência de dois tons (DTMF). Para obter detalhes, consulte Sinalização multifrequência de tom duplo e a definição de API em android.media.ToneGenerator .
acompanhar
Fluxo de áudio. Controlado pela API AudioTrack ou AudioRecord.
curva de atenuação de volume
Mapeamento específico do dispositivo de um índice de volume genérico para um fator de atenuação específico para uma determinada saída.
índice de volume
Inteiro sem unidade que expressa o volume relativo desejado de um fluxo. As APIs relacionadas ao volume de android.media.AudioManager operam em índices de volume em vez de fatores de atenuação absolutos.