A partir de 2026, para alinhar com nosso modelo de desenvolvimento estável de tronco e garantir a estabilidade da plataforma para o ecossistema, vamos publicar o código-fonte no AOSP no segundo e quarto trimestres. Para criar e contribuir com o AOSP, recomendamos usar android-latest-release em vez de aosp-main. O branch de manifesto android-latest-release sempre vai fazer referência à versão mais recente enviada ao AOSP. Para mais informações, consulte Mudanças no AOSP.

Formato executável Dalvik

Este documento descreve o layout e o conteúdo dos arquivos .dex, que são usados para armazenar um conjunto de definições de classe e os dados complementares associados.

Guia para tipos

Nome	Descrição
byte	int assinado de 8 bits
ubyte	int sem sinal de 8 bits
short	Número inteiro assinado de 16 bits, little endian
ushort	Número inteiro sem sinal de 16 bits, little-endian
int	int assinado de 32 bits, little-endian
uint	Número inteiro sem sinal de 32 bits, little-endian
long	Int assinado de 64 bits, little-endian
ulong	int não assinado de 64 bits, little-endian
sleb128	LEB128 com sinal, comprimento variável (confira abaixo)
uleb128	LEB128 sem sinal, de comprimento variável (consulte abaixo)
uleb128p1	LEB128 sem sinal mais `1`, comprimento variável (veja abaixo)

LEB128

LEB128 ("Little-Endian Base 128") é uma codificação de comprimento variável para quantidades inteiras arbitrárias com ou sem sinal. O formato foi emprestado da especificação DWARF3. Em um arquivo .dex, o LEB128 é usado apenas para codificar quantidades de 32 bits.

Cada valor codificado em LEB128 consiste em um a cinco bytes, que juntos representam um único valor de 32 bits. Cada byte tem o bit mais significativo definido, exceto o byte final na sequência, que tem o bit mais significativo limpo. Os sete bits restantes de cada byte são payload, com os sete bits menos significativos da quantidade no primeiro byte, os próximos sete no segundo byte e assim por diante. No caso de um LEB128 assinado (sleb128), o bit de payload mais significativo do byte final na sequência é estendido por sinal para produzir o valor final. No caso sem sinal (uleb128), todos os bits não representados explicitamente são interpretados como 0.

Diagrama bit a bit de um valor LEB128 de dois bytes
Primeiro byte								Segundo byte
`1`	bit₆	bit₅	bit₄	bit₃	bit₂	bit₁	bit₀	`0`	bit₁₃	bit₁₂	bit₁₁	bit₁₀	bit₉	bit₈	bit₇

A variante uleb128p1 é usada para representar um valor com sinal, em que a representação é do valor mais um codificado como um uleb128. Isso faz com que a codificação de -1 (alternativamente, o valor sem sinal 0xffffffff), mas nenhum outro número negativo, seja um único byte. Isso é útil exatamente nos casos em que o número representado precisa ser não negativo ou -1 (ou 0xffffffff) e em que nenhum outro valor negativo é permitido (ou em que é improvável que sejam necessários valores sem sinal grandes).

Confira alguns exemplos de formatos:

Sequência codificada	Como `sleb128`	Como `uleb128`	Como `uleb128p1`
00	0	0	-1
01	1	1	0
7f	-1	127	126
80 7f	-128	16256	16255

Layout do arquivo

Nome	Formato	Descrição
cabeçalho	header_item	o cabeçalho
string_ids	string_id_item[]	lista de identificadores de string. São identificadores de todas as strings usadas por esse arquivo, seja para nomenclatura interna (por exemplo, descritores de tipo) ou como objetos constantes referenciados pelo código. Essa lista precisa ser classificada por conteúdo de string, usando valores de ponto de código UTF-16 (não de maneira sensível à localidade), e não pode conter entradas duplicadas.
type_ids	type_id_item[]	lista de identificadores de tipo. São identificadores de todos os tipos (classes, matrizes ou tipos primitivos) referidos por esse arquivo, definidos ou não nele. Essa lista precisa ser classificada por índice `string_id` e não pode conter entradas duplicadas.
proto_ids	proto_id_item[]	Lista de identificadores de protótipo de método. São identificadores de todos os protótipos referenciados por este arquivo. Essa lista precisa ser classificada em ordem principal de tipo de retorno (por índice `type_id`) e, em seguida, por lista de argumentos (ordem lexicográfica, argumentos individuais ordenados por índice `type_id`). A lista não pode conter entradas duplicadas.
field_ids	field_id_item[]	lista de identificadores de campo. São identificadores de todos os campos referidos por este arquivo, definidos ou não nele. Essa lista precisa ser classificada, em que o tipo definidor (pelo índice `type_id`) é a ordem principal, o nome do campo (pelo índice `string_id`) é a ordem intermediária e o tipo (pelo índice `type_id`) é a ordem secundária. A lista não pode conter entradas duplicadas.
method_ids	method_id_item[]	lista de identificadores de método. São identificadores de todos os métodos referidos por este arquivo, definidos ou não nele. Essa lista precisa ser classificada, em que o tipo de definição (pelo índice `type_id`) é a ordem principal, o nome do método (pelo índice `string_id`) é a ordem intermediária e o protótipo do método (pelo índice `proto_id`) é a ordem secundária. A lista não pode conter entradas duplicadas.
class_defs	class_def_item[]	lista de definições de classe. As classes precisam ser ordenadas de forma que a superclasse e as interfaces implementadas de uma determinada classe apareçam na lista antes da classe de referência. Além disso, não é permitido que uma definição para a classe de mesmo nome apareça mais de uma vez na lista.
call_site_ids	call_site_id_item[]	lista de identificadores de site de chamada. São identificadores de todos os sites de chamada referenciados por este arquivo, definidos ou não nele. Essa lista precisa ser classificada em ordem crescente de `call_site_off`.
method_handles	method_handle_item[]	lista de identificadores de métodos. Uma lista de todos os manipuladores de métodos referenciados por este arquivo, definidos ou não no arquivo. Essa lista não é classificada e pode conter duplicatas que correspondem logicamente a diferentes instâncias de manipulador de método.
dados	ubyte[]	área de dados, que contém todos os dados de suporte para as tabelas listadas acima. Itens diferentes têm requisitos de alinhamento diferentes, e bytes de padding são inseridos antes de cada item, se necessário, para alcançar o alinhamento adequado.
link_data	ubyte[]	dados usados em arquivos vinculados estaticamente. O formato dos dados nesta seção não é especificado neste documento. Essa seção fica vazia em arquivos não vinculados, e as implementações de tempo de execução podem usá-la como quiserem.

Formato do contêiner

A versão 41 apresenta um novo formato de contêiner para dados DEX com o objetivo de economizar espaço. Esse formato de contêiner permite que vários arquivos DEX lógicos sejam combinados em um único arquivo físico. O novo formato é basicamente uma concatenação simples de arquivos no formato anterior, com algumas diferenças:

O file_size é o tamanho do arquivo lógico, não do arquivo físico. Ele pode ser usado para iterar todos os arquivos lógicos no contêiner.
Os arquivos dex lógicos podem fazer referência a dados posteriores no contêiner, mas não anteriores. Isso permite que os arquivos DEX compartilhem dados, como strings, entre si.
Todos os deslocamentos são relativos ao arquivo físico. Nenhum deslocamento é relativo ao cabeçalho. Isso garante que seções com offsets possam ser compartilhadas entre arquivos lógicos.
O cabeçalho adiciona dois novos campos para descrever os limites do contêiner. Essa é uma verificação de consistência adicional que facilita a portabilidade do código para o novo formato.
Os data_size e data_off não são mais usados. Os dados podem ser distribuídos em vários arquivos lógicos e não precisam ser contíguos.

Definições de bitfield, string e constante

DEX_FILE_MAGIC

Incorporado em header_item

A matriz/string constante DEX_FILE_MAGIC é a lista de bytes que precisam aparecer no início de um arquivo .dex para que ele seja reconhecido como tal. O valor contém intencionalmente uma nova linha ("\n" ou 0x0a) e um byte nulo ("\0" ou 0x00) para ajudar na detecção de certas formas de corrupção. O valor também codifica um número de versão de formato como três dígitos decimais, que deve aumentar monotonicamente ao longo do tempo à medida que o formato evolui.

ubyte[8] DEX_FILE_MAGIC = { 0x64 0x65 0x78 0x0a 0x30 0x33 0x39 0x00 }
                        = "dex\n039\0"

Observação:o suporte à versão 041 do formato é experimental na versão do Android 16 para testar o formato de contêiner. No entanto, a versão 041 não deve ser usada para código de produção.

Observação:o suporte à versão 040 do formato foi adicionado no lançamento do Android 10.0, que estendeu o conjunto de caracteres permitidos em SimpleNames.

Observação:o suporte à versão 039 do formato foi adicionado no lançamento do Android 9.0, que introduziu dois novos bytecodes, const-method-handle e const-method-type. Cada um deles é descrito na tabela Resumo do conjunto de bytecode. No Android 10, a versão 039 estende o formato de arquivo DEX para incluir informações de API ocultas que só são aplicáveis a arquivos DEX no caminho de classe de inicialização.

Observação:o suporte à versão 038 do formato foi adicionado no lançamento do Android 8.0. A versão 038 adicionou novos bytecodes (invoke-polymorphic e invoke-custom) e dados para manipuladores de métodos.

Observação:o suporte para a versão 037 do formato foi adicionado no lançamento do Android 7.0. Antes da versão 037, a maioria das versões do Android usava a versão 035 do formato. A única diferença entre as versões 035 e 037 é a adição de métodos padrão e o ajuste do invoke.

Observação:pelo menos algumas versões anteriores do formato foram usadas em lançamentos de software público amplamente disponíveis. Por exemplo, a versão 009 foi usada para os lançamentos M3 da plataforma Android (novembro a dezembro de 2007), e a versão 013 foi usada para os lançamentos M5 da plataforma Android (fevereiro a março de 2008). Em vários aspectos, essas versões anteriores do formato são significativamente diferentes da versão descrita neste documento.

ENDIAN_CONSTANT e REVERSE_ENDIAN_CONSTANT

Incorporado em header_item

A constante ENDIAN_CONSTANT é usada para indicar a endianness do arquivo em que ela é encontrada. Embora o formato padrão .dex seja little-endian, as implementações podem optar por fazer a troca de bytes. Se uma implementação encontrar um cabeçalho cujo endian_tag seja REVERSE_ENDIAN_CONSTANT em vez de ENDIAN_CONSTANT, ela saberá que o arquivo teve a troca de bytes do formato esperado.

uint ENDIAN_CONSTANT = 0x12345678;
uint REVERSE_ENDIAN_CONSTANT = 0x78563412;

NO_INDEX

Incorporado em class_def_item e debug_info_item

A constante NO_INDEX é usada para indicar que um valor de índice está ausente.

Observação:esse valor não é definido como 0, porque esse é um índice válido.

O valor escolhido para NO_INDEX pode ser representado como um único byte na codificação uleb128p1.

uint NO_INDEX = 0xffffffff;    // == -1 if treated as a signed int

Definições de access_flags

Incorporado em class_def_item, encoded_field, encoded_method e InnerClass

Os campos de bits dessas flags são usados para indicar a acessibilidade e as propriedades gerais de classes e membros de classe.

Nome	Valor	Para classes (e anotações `InnerClass`)	Para campos	Para métodos
ACC_PUBLIC	0x1	`public`: visível em todos os lugares	`public`: visível em todos os lugares	`public`: visível em todos os lugares
ACC_PRIVATE	0x2	* `private`: somente visível para a classe de definição	`private`: visível apenas para a classe de definição	`private`: visível apenas para a classe de definição
ACC_PROTECTED	0x4	* `protected`: visível para o pacote e subclasses	`protected`: visível para o pacote e subclasses.	`protected`: visível para o pacote e subclasses.
ACC_STATIC	0x8	* `static`: não é construído com uma referência `this` externa	`static`: global para definir a classe	`static`: não usa um argumento `this`
ACC_FINAL	0x10	`final`: não pode ser subclassificado	`final`: imutável após a construção	`final`: não substituível
ACC_SYNCHRONIZED	0x20			`synchronized`: bloqueio associado adquirido automaticamente em torno da chamada para esse método. Observação:isso só é válido quando `ACC_NATIVE` também está definido.
ACC_VOLATILE	0x40		`volatile`: regras de acesso especial para ajudar na segurança de linhas de execução.
ACC_BRIDGE	0x40			método de ponte, adicionado automaticamente pelo compilador como uma ponte com segurança de tipo
ACC_TRANSIENT	0x80		`transient`: não ser salvo pela serialização padrão
ACC_VARARGS	0x80			o último argumento precisa ser tratado como um argumento "rest" pelo compilador
ACC_NATIVE	0x100			`native`: implementado em código nativo
ACC_INTERFACE	0x200	`interface`: classe abstrata de implementação múltipla
ACC_ABSTRACT	0x400	`abstract`: não pode ser instanciado diretamente		`abstract`: não implementado por esta classe
ACC_STRICT	0x800			`strictfp`: regras estritas para aritmética de ponto flutuante
ACC_SYNTHETIC	0x1000	não definido diretamente no código-fonte	não definido diretamente no código-fonte	não definido diretamente no código-fonte
ACC_ANNOTATION	0x2000	declarada como uma classe de anotação
ACC_ENUM	0x4000	declarado como um tipo enumerado	declarado como um valor enumerado
(não usado)	0x8000
ACC_CONSTRUCTOR	0x10000			método construtor (inicializador de classe ou instância)
ACC_DECLARED_ SYNCHRONIZED	0x20000			declarou `synchronized`. Observação:isso não tem efeito na execução, exceto na reflexão dessa flag.

* Só é permitido em anotações InnerClass e nunca pode estar ativado em um class_def_item.

Codificação UTF-8 modificada

Para facilitar o suporte legado, o formato .dex codifica os dados de string em um formato UTF-8 modificado padrão de fato, daqui em diante chamado de MUTF-8. Essa forma é idêntica ao UTF-8 padrão, exceto:

Apenas as codificações de um, dois e três bytes são usadas.
Os pontos de código no intervalo U+10000 … U+10ffff são codificados como um par substituto, cada um representado como um valor codificado de três bytes.
O ponto de código U+0000 é codificado em um formato de dois bytes.
Um byte nulo simples (valor 0) indica o fim de uma string, como é a interpretação padrão da linguagem C.

Os dois primeiros itens acima podem ser resumidos da seguinte forma: MUTF-8 é um formato de codificação para UTF-16, em vez de ser um formato de codificação mais direto para caracteres Unicode.

Os dois últimos itens acima permitem incluir o ponto de código U+0000 em uma string e manipular como uma string terminada em nulo no estilo C.

No entanto, a codificação especial de U+0000 significa que, ao contrário do UTF-8 normal, o resultado da chamada da função C padrão strcmp() em um par de strings MUTF-8 nem sempre indica o resultado assinado corretamente da comparação de strings desiguais. Quando a ordenação (não apenas a igualdade) é uma preocupação, a maneira mais direta de comparar strings MUTF-8 é decodificá-las caractere por caractere e comparar os valores decodificados. No entanto, também é possível fazer implementações mais inteligentes.

Consulte o Padrão Unicode para mais informações sobre codificação de caracteres. O MUTF-8 é mais parecido com a codificação CESU-8 (relativamente menos conhecida) do que com o UTF-8 em si.

Codificação encoded_value

Incorporado em "annotation_element" e "encoded_array_item"

Um encoded_value é uma parte codificada de dados (quase) arbitrários estruturados hierarquicamente. A codificação precisa ser compacta e fácil de analisar.

Nome	Formato	Descrição
(value_arg << 5) \| value_type	ubyte	byte que indica o tipo do `value` imediatamente subsequente, junto com um argumento explicativo opcional nos três bits de ordem superior. Confira abaixo as várias definições de `value`. Na maioria dos casos, `value_arg` codifica o comprimento do `value` imediatamente subsequente em bytes, como `(size - 1)`, por exemplo, `0` significa que o valor requer um byte, e `7` significa que ele requer oito bytes. No entanto, há exceções, conforme observado abaixo.
value	ubyte[]	bytes que representam o valor, com comprimento variável e interpretados de forma diferente para bytes `value_type` diferentes, embora sempre little-endian. Confira os detalhes nas várias definições de valor abaixo.

Formatos de valor

Nome do tipo	`value_type`	Formato `value_arg`	Formato `value`	Descrição
VALUE_BYTE	0x00	(nenhum; precisa ser `0`)	ubyte[1]	valor inteiro de um byte com sinal
VALUE_SHORT	0x02	tamanho - 1 (0…1)	ubyte[size]	valor inteiro de dois bytes com sinal, estendido por sinal
VALUE_CHAR	0x03	tamanho - 1 (0…1)	ubyte[size]	valor inteiro de dois bytes sem sinal, estendido com zero
VALUE_INT	0x04	tamanho - 1 (0…3)	ubyte[size]	valor inteiro de quatro bytes com sinal, estendido por sinal
VALUE_LONG	0x06	tamanho - 1 (0…7)	ubyte[size]	valor inteiro assinado de oito bytes, com extensão de sinal
VALUE_FLOAT	0x10	tamanho - 1 (0…3)	ubyte[size]	padrão de bits de quatro bytes, estendido com zeros à direita e interpretado como um valor de ponto flutuante de 32 bits IEEE754
VALUE_DOUBLE	0x11	tamanho - 1 (0…7)	ubyte[size]	padrão de bits de oito bytes, estendido com zero à direita e interpretado como um valor de ponto flutuante de 64 bits IEEE754
VALUE_METHOD_TYPE	0x15	tamanho - 1 (0…3)	ubyte[size]	valor inteiro de quatro bytes sem sinal (com extensão de zero), interpretado como um índice na seção `proto_ids` e representando um valor de tipo de método
VALUE_METHOD_HANDLE	0x16	tamanho - 1 (0…3)	ubyte[size]	valor inteiro de quatro bytes sem sinal (estendido com zero), interpretado como um índice na seção `method_handles` e representando um valor de manipulador de método
VALUE_STRING	0x17	tamanho - 1 (0…3)	ubyte[size]	valor inteiro de quatro bytes sem sinal (com extensão de zero), interpretado como um índice na seção `string_ids` e representando um valor de string
VALUE_TYPE	0x18	tamanho - 1 (0…3)	ubyte[size]	valor inteiro de quatro bytes sem sinal (extensão de zero), interpretado como um índice na seção `type_ids` e representando um valor de tipo/classe reflexivo
VALUE_FIELD	0x19	tamanho - 1 (0…3)	ubyte[size]	valor inteiro de quatro bytes sem sinal (com extensão de zero), interpretado como um índice na seção `field_ids` e representando um valor de campo refletivo
VALUE_METHOD	0x1a	tamanho - 1 (0…3)	ubyte[size]	valor inteiro de quatro bytes sem sinal (estendido com zero), interpretado como um índice na seção `method_ids` e representando um valor de método reflexivo
VALUE_ENUM	0x1b	tamanho - 1 (0…3)	ubyte[size]	valor inteiro de quatro bytes sem sinal (estendido com zero), interpretado como um índice na seção `field_ids` e representando o valor de uma constante de tipo enumerado
VALUE_ARRAY	0x1c	(nenhum; precisa ser `0`)	encoded_array	uma matriz de valores, no formato especificado por "formato `encoded_array`" abaixo. O tamanho de `value` está implícito na codificação.
VALUE_ANNOTATION	0x1d	(nenhum; precisa ser `0`)	encoded_annotation	uma subanotação, no formato especificado em "Formato `encoded_annotation`" abaixo. O tamanho de `value` está implícito na codificação.
VALUE_NULL	0x1e	(nenhum; precisa ser `0`)	(nenhum)	Valor de referência de `null`
VALUE_BOOLEAN	0x1f	booleano (0…1)	(nenhum)	valor de um bit; `0` para `false` e `1` para `true`. O bit é representado no `value_arg`.

Formato encoded_array

Nome	Formato	Descrição
size	uleb128	número de elementos na matriz
values	encoded_value[size]	uma série de sequências de bytes `size` `encoded_value` no formato especificado nesta seção, concatenadas sequencialmente.

formato encoded_annotation

Nome	Formato	Descrição
type_idx	uleb128	tipo da anotação. Precisa ser um tipo de classe (não matriz ou primitivo).
size	uleb128	número de mapeamentos de nome-valor nesta anotação
elementos	annotation_element[size]	elementos da anotação, representados diretamente inline (não como deslocamentos). Os elementos precisam ser classificados em ordem crescente pelo índice `string_id`.

formato annotation_element

Nome	Formato	Descrição
name_idx	uleb128	nome do elemento, representado como um índice na seção `string_ids`. A string precisa estar em conformidade com a sintaxe de MemberName, definida acima.
value	encoded_value	valor do elemento

Sintaxe de string

Há vários tipos de itens em um arquivo .dex que acabam se referindo a uma string. As definições de estilo BNF a seguir indicam a sintaxe aceitável para essas strings.

SimpleName

Um SimpleName é a base para a sintaxe dos nomes de outras coisas. O formato .dex permite uma boa quantidade de latitude aqui (muito mais do que a maioria dos idiomas de origem comuns). Em resumo, um nome simples consiste em qualquer caractere alfabético ou dígito ASCII minúsculo, alguns símbolos ASCII minúsculos específicos e a maioria dos pontos de código não ASCII que não são caracteres de controle, espaço ou especiais. A partir da versão 040, o formato também permite caracteres de espaço (categoria Unicode Zs). Os pontos de código substitutos (no intervalo U+d800 … U+dfff) não são considerados caracteres de nome válidos por si só, mas os caracteres suplementares Unicode são válidos (que são representados pela alternativa final da regra para SimpleNameChar) e devem ser representados em um arquivo como pares de pontos de código substitutos na codificação MUTF-8.

SimpleName →
	SimpleNameChar (SimpleNameChar)*
SimpleNameChar →
	`'A'` … `'Z'`
\|	`'a'` … `'z'`
\|	`'0'` … `'9'`
\|	`' '`	desde a versão 040 do DEX
\|	`'$'`
\|	`'-'`
\|	`'_'`
\|	`U+00a0`	desde a versão 040 do DEX
\|	`U+00a1` … `U+1fff`
\|	`U+2000` … `U+200a`	desde a versão 040 do DEX
\|	`U+2010` … `U+2027`
\|	`U+202f`	desde a versão 040 do DEX
\|	`U+2030` … `U+d7ff`
\|	`U+e000` … `U+ffef`
\|	`U+10000` … `U+10ffff`

MemberName

usado por field_id_item e method_id_item

Um MemberName é o nome de um membro de uma classe, sendo os membros campos, métodos e classes internas.

MemberName →
	SimpleName
\|	`'<'` SimpleName `'>'`

FullClassName

Um FullClassName é um nome de classe totalmente qualificado, incluindo um especificador de pacote opcional seguido por um nome obrigatório.

FullClassName →
	OptionalPackagePrefix SimpleName
OptionalPackagePrefix →
	(SimpleName `'/'`)*

TypeDescriptor

Usado por type_id_item

Um TypeDescriptor é a representação de qualquer tipo, incluindo primitivos, classes, matrizes e void. Confira abaixo o significado das várias versões.

TypeDescriptor →
	`'V'`
\|	FieldTypeDescriptor
FieldTypeDescriptor →
	NonArrayFieldTypeDescriptor
\|	(`'['` * 1…255) NonArrayFieldTypeDescriptor
NonArrayFieldTypeDescriptor→
	`'Z'`
\|	`'B'`
\|	`'S'`
\|	`'C'`
\|	`'I'`
\|	`'J'`
\|	`'F'`
\|	`'D'`
\|	`'L'` FullClassName `';'`

ShortyDescriptor

Usado por proto_id_item

Um ShortyDescriptor é a representação abreviada de um protótipo de método, incluindo tipos de retorno e parâmetro, exceto que não há distinção entre vários tipos de referência (classe ou matriz). Em vez disso, todos os tipos de referência são representados por um único caractere 'L'.

ShortyDescriptor →
	ShortyReturnType (ShortyFieldType)*
ShortyReturnType →
	`'V'`
\|	ShortyFieldType
ShortyFieldType →
	`'Z'`
\|	`'B'`
\|	`'S'`
\|	`'C'`
\|	`'I'`
\|	`'J'`
\|	`'F'`
\|	`'D'`
\|	`'L'`

Semântica do TypeDescriptor

Este é o significado de cada uma das variantes de TypeDescriptor.

Sintaxe	Significado
V	`void`; válido apenas para tipos de retorno
Z	`boolean`
B	`byte`
S	`short`
C	`char`
I	`int`
J	`long`
F	`float`
D	`double`
Lfully/qualified/Name;	a classe `fully.qualified.Name`
[descriptor	matriz de `descriptor`, que pode ser usada recursivamente para matrizes de matrizes, embora seja inválido ter mais de 255 dimensões.

Itens e estruturas relacionadas

Esta seção inclui definições para cada um dos itens de nível superior que podem aparecer em um arquivo .dex.

header_item

Aparece na seção de cabeçalho

Alinhamento: 4 bytes

Nome	Formato	Descrição
mágica	ubyte[8] = DEX_FILE_MAGIC	valor mágico. Confira a discussão acima em "`DEX_FILE_MAGIC`" para mais detalhes.
checksum	uint	Checksum adler32 do restante do arquivo (tudo, exceto `magic` e este campo). Usado para detectar corrupção de arquivos.
assinatura	ubyte[20]	Assinatura SHA-1 (hash) do restante do arquivo (tudo, exceto `magic`, `checksum` e este campo), usada para identificar arquivos de maneira exclusiva.
file_size	uint	tamanho do arquivo inteiro (incluindo o cabeçalho), em bytes (v40 ou anterior) Distância em bytes do início deste cabeçalho até o próximo cabeçalho ou até o fim de todo o arquivo (o contêiner). (v41 ou mais recente)
header_size	uint	tamanho do cabeçalho (esta seção inteira), em bytes. Isso permite pelo menos uma quantidade limitada de compatibilidade com versões anteriores/futuras sem invalidar o formato. precisa ter 0x70 (112) bytes (v40 ou anterior) precisa ter 0x78 (120) bytes (v41 ou mais recente)
endian_tag	uint = ENDIAN_CONSTANT	tag de endianness. Consulte a discussão acima em "`ENDIAN_CONSTANT` e `REVERSE_ENDIAN_CONSTANT`" para mais detalhes.
link_size	uint	tamanho da seção de link ou `0` se o arquivo não estiver vinculado estaticamente
link_off	uint	deslocamento do início do arquivo até a seção de links ou `0` se `link_size == 0`. Se for diferente de zero, o deslocamento precisa ser para um deslocamento na seção `link_data`. O formato dos dados apontados não é especificado por este documento. Este campo de cabeçalho (e o anterior) são deixados como hooks para uso por implementações de tempo de execução.
map_off	uint	Deslocamento do início do arquivo para o item do mapa. O deslocamento, que não pode ser zero, precisa ser para um deslocamento na seção `data`, e os dados precisam estar no formato especificado em "`map_list`" abaixo.
string_ids_size	uint	contagem de strings na lista de identificadores de string
string_ids_off	uint	deslocamento do início do arquivo para a lista de identificadores de string ou `0` se `string_ids_size == 0` (um caso limite estranho). Se for diferente de zero, o ajuste deve ser feito no início da seção `string_ids`.
type_ids_size	uint	contagem de elementos na lista de identificadores de tipo, no máximo 65.535
type_ids_off	uint	deslocamento do início do arquivo para a lista de identificadores de tipo ou `0` se `type_ids_size == 0` (um caso extremo estranho). Se for diferente de zero, o ajuste deve ser feito no início da seção `type_ids`.
proto_ids_size	uint	contagem de elementos na lista de identificadores de protótipo, no máximo 65.535
proto_ids_off	uint	deslocamento do início do arquivo para a lista de identificadores de protótipo ou `0` se `proto_ids_size == 0` (um caso extremo estranho). Se for diferente de zero, o ajuste deve ser feito no início da seção `proto_ids`.
field_ids_size	uint	Contagem de elementos na lista de identificadores de campo.
field_ids_off	uint	deslocamento do início do arquivo para a lista de identificadores de campo ou `0` se `field_ids_size == 0`. Se não for zero, o ajuste precisa ser feito no início da seção `field_ids`.
method_ids_size	uint	contagem de elementos na lista de identificadores de método
method_ids_off	uint	deslocamento do início do arquivo para a lista de identificadores de método ou `0` se `method_ids_size == 0`. Se não for zero, o ajuste precisa ser feito no início da seção `method_ids`.
class_defs_size	uint	contagem de elementos na lista de definições de classe
class_defs_off	uint	deslocamento do início do arquivo para a lista de definições de classe ou `0` se `class_defs_size == 0` (um caso extremo estranho). Se for diferente de zero, o ajuste deve ser feito no início da seção `class_defs`.
data_size	uint	Tamanho da seção `data` em bytes. Precisa ser um múltiplo par de sizeof(uint). (v40 ou anterior) Não usado (v41 ou mais recente)
data_off	uint	deslocamento do início do arquivo para o início da seção `data` (v40 ou anterior) Não usado (v41 ou mais recente)
container_size	uint	esse campo não existe. Pode ser considerado igual a `file_size`. (v40 ou anterior) tamanho de todo o arquivo (incluindo outros cabeçalhos dex e os dados deles). (v41 ou mais recente)
header_offset	uint	esse campo não existe. Pode ser considerado igual a `0`. (v40 ou anterior) Deslocamento do início do arquivo até o início do cabeçalho. (v41 ou mais recente)

map_list

Aparece na seção de dados

Referenciado de header_item

Alinhamento: 4 bytes

Esta é uma lista de todo o conteúdo de um arquivo, em ordem. Ele contém alguma redundância em relação ao header_item mas foi criado para ser uma forma fácil de usar para iterar em um arquivo inteiro. Um determinado tipo pode aparecer no máximo uma vez em um mapa, mas não há restrição quanto à ordem em que os tipos podem aparecer, além das restrições implícitas pelo restante do formato (por exemplo, uma seção header precisa aparecer primeiro, seguida por uma seção string_ids etc.). Além disso, as entradas de mapa precisam ser ordenadas por deslocamento inicial e não podem se sobrepor.

Nome	Formato	Descrição
size	uint	tamanho da lista, em entradas
list	map_item[size]	elementos da lista

Formato map_item

Nome	Formato	Descrição
type	ushort	tipo dos itens. Consulte a tabela abaixo.
unused	ushort	(não usado)
size	uint	contagem do número de itens a serem encontrados no deslocamento indicado
compensação	uint	deslocamento do início do arquivo para os itens em questão

Códigos de tipo

Tipo de item	Constante	Valor	Tamanho do item em bytes
header_item	TYPE_HEADER_ITEM	0x0000	0x70
string_id_item	TYPE_STRING_ID_ITEM	0x0001	0x04
type_id_item	TYPE_TYPE_ID_ITEM	0x0002	0x04
proto_id_item	TYPE_PROTO_ID_ITEM	0x0003	0x0c
field_id_item	TYPE_FIELD_ID_ITEM	0x0004	0x08
method_id_item	TYPE_METHOD_ID_ITEM	0x0005	0x08
class_def_item	TYPE_CLASS_DEF_ITEM	0x0006	0x20
call_site_id_item	TYPE_CALL_SITE_ID_ITEM	0x0007	0x04
method_handle_item	TYPE_METHOD_HANDLE_ITEM	0x0008	0x08
map_list	TYPE_MAP_LIST	0x1000	4 + (item.size * 12)
type_list	TYPE_TYPE_LIST	0x1001	4 + (item.size * 2)
annotation_set_ref_list	TYPE_ANNOTATION_SET_REF_LIST	0x1002	4 + (item.size * 4)
annotation_set_item	TYPE_ANNOTATION_SET_ITEM	0x1003	4 + (item.size * 4)
class_data_item	TYPE_CLASS_DATA_ITEM	0x2000	implicit; must parse
code_item	TYPE_CODE_ITEM	0x2001	implicit; must parse
string_data_item	TYPE_STRING_DATA_ITEM	0x2002	implicit; must parse
debug_info_item	TYPE_DEBUG_INFO_ITEM	0x2003	implicit; must parse
annotation_item	TYPE_ANNOTATION_ITEM	0x2004	implicit; must parse
encoded_array_item	TYPE_ENCODED_ARRAY_ITEM	0x2005	implicit; must parse
annotations_directory_item	TYPE_ANNOTATIONS_DIRECTORY_ITEM	0x2006	implicit; must parse
hiddenapi_class_data_item	TYPE_HIDDENAPI_CLASS_DATA_ITEM	0xF000	implicit; must parse

string_id_item

Aparece na seção "string_ids"

Alinhamento: 4 bytes

Nome	Formato	Descrição
string_data_off	uint	Deslocamento do início do arquivo para os dados de string deste item. O deslocamento precisa ser para um local na seção `data`, e os dados precisam estar no formato especificado por "`string_data_item`" abaixo. Não há requisito de alinhamento para o ajuste.

string_data_item

Aparece na seção de dados

Alinhamento: nenhum (alinhado por bytes)

Nome	Formato	Descrição
utf16_size	uleb128	tamanho dessa string, em unidades de código UTF-16 (que é o "comprimento da string" em muitos sistemas). Ou seja, esse é o comprimento decodificado da string. O comprimento codificado é implícito pela posição do byte `0`.
dados	ubyte[]	uma série de unidades de código MUTF-8 (também conhecidas como octetos ou bytes) seguida por um byte de valor `0`. Consulte "Codificação MUTF-8 (UTF-8 modificado)" acima para mais detalhes e uma discussão sobre o formato de dados. Observação:é aceitável ter uma string que inclua (a forma codificada de) unidades de código substituto UTF-16 (ou seja, `U+d800` … `U+dfff`) isoladamente ou fora de ordem em relação à codificação usual de Unicode em UTF-16. Cabe aos usos de nível superior de strings rejeitar essas codificações inválidas, se apropriado.

type_id_item

Aparece na seção "type_ids"

Alinhamento: 4 bytes

Nome	Formato	Descrição
descriptor_idx	uint	índice na lista `string_ids` para a string do descritor desse tipo. A string precisa estar em conformidade com a sintaxe de TypeDescriptor, definida acima.

proto_id_item

Aparece na seção "proto_ids"

Alinhamento: 4 bytes

Nome	Formato	Descrição
shorty_idx	uint	index na lista `string_ids` para a string descritora abreviada deste protótipo. A string precisa estar em conformidade com a sintaxe de ShortyDescriptor, definida acima, e corresponder ao tipo de retorno e aos parâmetros desse item.
return_type_idx	uint	indexar a lista `type_ids` para o tipo de retorno deste protótipo
parameters_off	uint	Deslocamento do início do arquivo para a lista de tipos de parâmetros deste protótipo ou `0` se ele não tiver parâmetros. Se for diferente de zero, esse deslocamento vai estar na seção `data`, e os dados vão estar no formato especificado por `"type_list"` abaixo. Além disso, não pode haver referência ao tipo `void` na lista.

field_id_item

Aparece na seção "field_ids"

Alinhamento: 4 bytes

Nome	Formato	Descrição
class_idx	ushort	índice na lista `type_ids` para o definidor deste campo. Precisa ser um tipo de classe, não um tipo primitivo ou de matriz.
type_idx	ushort	índice na lista `type_ids` para o tipo deste campo
name_idx	uint	indexe a lista `string_ids` para o nome deste campo. A string precisa estar em conformidade com a sintaxe de MemberName, definida acima.

method_id_item

Aparece na seção "method_ids".

Alinhamento: 4 bytes

Nome	Formato	Descrição
class_idx	ushort	índice na lista `type_ids` para o definidor deste método. Precisa ser uma classe ou um tipo de matriz, e não um tipo primitivo.
proto_idx	ushort	index na lista `proto_ids` para o protótipo deste método
name_idx	uint	indexe a lista `string_ids` para o nome deste método. A string precisa estar em conformidade com a sintaxe de MemberName, definida acima.

class_def_item

Aparece na seção "class_defs"

Alinhamento: 4 bytes

Nome	Formato	Descrição
class_idx	uint	índice na lista `type_ids` para essa classe. Precisa ser um tipo de classe, não um tipo primitivo ou de matriz.
access_flags	uint	flags de acesso para a classe (`public`, `final` etc.). Consulte "Definições de `access_flags`" para mais detalhes.
superclass_idx	uint	índice na lista `type_ids` da superclasse ou o valor constante `NO_INDEX` se a classe não tiver uma superclasse (ou seja, se for uma classe raiz, como `Object`). Se presente, precisa ser um tipo de classe, não uma matriz ou um tipo primitivo.
interfaces_off	uint	deslocamento do início do arquivo para a lista de interfaces ou `0` se não houver nenhuma. Esse deslocamento precisa estar na seção `data`, e os dados precisam estar no formato especificado em "`type_list`" abaixo. Cada um dos elementos da lista precisa ser um tipo de classe (não um array ou tipo primitivo), e não pode haver duplicatas.
source_file_idx	uint	index na lista `string_ids` para o nome do arquivo que contém a origem original (pelo menos a maior parte) dessa classe, ou o valor especial `NO_INDEX` para representar a falta dessa informação. O `debug_info_item` de qualquer método pode substituir esse arquivo de origem, mas a expectativa é que a maioria das classes venha de apenas um arquivo de origem.
annotations_off	uint	offset do início do arquivo para a estrutura de anotações desta classe ou `0` se não houver anotações nesta classe. Se for diferente de zero, esse deslocamento vai estar na seção `data`, e os dados vão estar no formato especificado por "`annotations_directory_item`" abaixo, com todos os itens referentes a essa classe como definidores.
class_data_off	uint	Deslocamento do início do arquivo para os dados da classe associada a este item ou `0` se não houver dados de classe para essa classe. (Esse pode ser o caso, por exemplo, se essa classe for uma interface de marcador.) Se o deslocamento não for zero, ele vai estar na seção `data`, e os dados vão estar no formato especificado por "`class_data_item`" abaixo, com todos os itens referentes a essa classe como o definidor.
static_values_off	uint	Deslocamento do início do arquivo para a lista de valores iniciais dos campos `static` ou `0` se não houver nenhum (e todos os campos `static` forem inicializados com `0` ou `null`). Esse deslocamento precisa estar na seção `data`, e os dados precisam estar no formato especificado por "`encoded_array_item`" abaixo. O tamanho da matriz não pode ser maior que o número de campos `static` declarados por essa classe, e os elementos correspondem aos campos `static` na mesma ordem em que foram declarados no `field_list` correspondente. O tipo de cada elemento da matriz precisa corresponder ao tipo declarado do campo correspondente. Se houver menos elementos na matriz do que campos `static`, os campos restantes serão inicializados com um `0` ou `null` adequado ao tipo.

call_site_id_item

Aparece na seção "call_site_ids"

Alinhamento: 4 bytes

Nome	Formato	Descrição
call_site_off	uint	Deslocamento do início do arquivo para a definição do site de chamada. O deslocamento precisa estar na seção de dados, e os dados precisam estar no formato especificado por "call_site_item" abaixo.

call_site_item

Aparece na seção de dados

Alinhamento: nenhum (alinhado por bytes)

O call_site_item é um encoded_array_item cujos elementos correspondem aos argumentos fornecidos a um método de vinculador de bootstrap. Os três primeiros argumentos são:

Um identificador de método que representa o método de vinculador de bootstrap (VALUE_METHOD_HANDLE).
Um nome de método que o vinculador de bootstrap precisa resolver (VALUE_STRING).
Um tipo de método correspondente ao tipo do nome do método a ser resolvido (VALUE_METHOD_TYPE).

Todos os argumentos extras são valores constantes transmitidos ao método de vinculador de bootstrap. Esses argumentos são transmitidos em ordem e sem conversões de tipo.

O manipulador de método que representa o método de vinculador de bootstrap precisa ter o tipo de retorno java.lang.invoke.CallSite. Os três primeiros tipos de parâmetros são:

java.lang.invoke.Lookup
java.lang.String
java.lang.invoke.MethodType

Os tipos de parâmetros de argumentos adicionais são determinados pelos valores constantes deles.

method_handle_item

Aparece na seção "method_handles"

Alinhamento: 4 bytes

Nome	Formato	Descrição
method_handle_type	ushort	tipo do manipulador de método; consulte a tabela abaixo
unused	ushort	(não usado)
field_or_method_id	ushort	ID do campo ou do método, dependendo se o tipo de manipulador do método é um acessador ou um invocador de método
unused	ushort	(não usado)

Códigos de tipo de identificador de método

Constante	Valor	Descrição
METHOD_HANDLE_TYPE_STATIC_PUT	0x00	O handle de método é um setter de campo estático (acessor).
METHOD_HANDLE_TYPE_STATIC_GET	0x01	O handle de método é um getter (acessor) de campo estático.
METHOD_HANDLE_TYPE_INSTANCE_PUT	0x02	O manipulador de método é um setter de campo de instância (acessor).
METHOD_HANDLE_TYPE_INSTANCE_GET	0x03	O manipulador de método é um getter (acessador) de campo de instância.
METHOD_HANDLE_TYPE_INVOKE_STATIC	0x04	O manipulador de método é um invocador de método estático.
METHOD_HANDLE_TYPE_INVOKE_INSTANCE	0x05	O manipulador de método é um invocador de método de instância.
METHOD_HANDLE_TYPE_INVOKE_CONSTRUCTOR	0x06	O identificador de método é um invocador de método construtor
METHOD_HANDLE_TYPE_INVOKE_DIRECT	0x07	O identificador de método é um invocador de método direto.
METHOD_HANDLE_TYPE_INVOKE_INTERFACE	0x08	O manipulador de método é um invocador de método de interface

class_data_item

Referenciado de class_def_item

Aparece na seção de dados

Alinhamento: nenhum (alinhado por bytes)

Nome	Formato	Descrição
static_fields_size	uleb128	o número de campos estáticos definidos neste item
instance_fields_size	uleb128	o número de campos de instância definidos neste item
direct_methods_size	uleb128	o número de métodos diretos definidos neste item
virtual_methods_size	uleb128	o número de métodos virtuais definidos neste item
static_fields	encoded_field[static_fields_size]	os campos estáticos definidos, representados como uma sequência de elementos codificados. Os campos precisam ser classificados por `field_idx` em ordem crescente.
instance_fields	encoded_field[instance_fields_size]	os campos de instância definidos, representados como uma sequência de elementos codificados. Os campos precisam ser classificados por `field_idx` em ordem crescente.
direct_methods	encoded_method[direct_methods_size]	os métodos diretos definidos (qualquer um de `static`, `private` ou construtor), representados como uma sequência de elementos codificados. Os métodos precisam ser classificados por `method_idx` em ordem crescente.
virtual_methods	encoded_method[virtual_methods_size]	os métodos virtuais definidos (nenhum de `static`, `private` ou construtor), representados como uma sequência de elementos codificados. Essa lista não deve incluir métodos herdados, a menos que sejam substituídos pela classe que este item representa. Os métodos precisam ser classificados por `method_idx` em ordem crescente. O `method_idx` de um método virtual não pode ser igual a nenhum método direto.

Observação:todas as instâncias field_id e method_id dos elementos precisam se referir à mesma classe de definição.

Formato encoded_field

Nome	Formato	Descrição
field_idx_diff	uleb128	Indexe a lista `field_ids` para a identidade deste campo (inclui o nome e o descritor), representado como uma diferença do índice do elemento anterior na lista. O índice do primeiro elemento em uma lista é representado diretamente.
access_flags	uleb128	flags de acesso para o campo (`public`, `final` etc.). Consulte "Definições de `access_flags`" para mais detalhes.

formato encoded_method

Nome	Formato	Descrição
method_idx_diff	uleb128	index na lista `method_ids` para a identidade deste método (inclui o nome e o descritor), representado como uma diferença do índice do elemento anterior na lista. O índice do primeiro elemento em uma lista é representado diretamente.
access_flags	uleb128	flags de acesso para o método (`public`, `final`, etc.). Consulte "Definições de `access_flags`" para mais detalhes.
code_off	uleb128	Deslocamento do início do arquivo para a estrutura de código deste método ou `0` se este método for `abstract` ou `native`. O deslocamento precisa ser para um local na seção `data`. O formato dos dados é especificado por "`code_item`" abaixo.

type_list

Referenciado de class_def_item e proto_id_item

Aparece na seção de dados

Alinhamento: 4 bytes

Nome	Formato	Descrição
size	uint	tamanho da lista, em entradas
list	type_item[size]	elementos da lista

Formato type_item

Nome	Formato	Descrição
type_idx	ushort	indexar na lista `type_ids`

code_item

Referenciado de encoded_method

Aparece na seção de dados

Alinhamento: 4 bytes

Nome	Formato	Descrição
registers_size	ushort	o número de registros usados por esse código
ins_size	ushort	o número de palavras dos argumentos recebidos para o método a que este código se destina
outs_size	ushort	o número de palavras do espaço de argumento de saída exigido por este código para invocação de método
tries_size	ushort	o número de `try_item`s para essa instância. Se for diferente de zero, eles vão aparecer como a matriz `tries` logo após o `insns` nesta instância.
debug_info_off	uint	Deslocamento do início do arquivo para a sequência de informações de depuração (números de linha + informações de variáveis locais) deste código ou `0` se não houver informações. Se o deslocamento não for zero, ele precisará ser para um local na seção `data`. O formato dos dados é especificado por "`debug_info_item`" abaixo.
insns_size	uint	tamanho da lista de instruções, em unidades de código de 16 bits
insns	ushort[insns_size]	matriz real de bytecode. O formato do código em uma matriz `insns` é especificado no documento complementar Bytecode Dalvik. Embora isso seja definido como uma matriz de `ushort`, há algumas estruturas internas que preferem o alinhamento de quatro bytes. Além disso, se isso acontecer em um arquivo com troca de endianness, a troca será feita apenas em instâncias `ushort` individuais, não nas estruturas internas maiores.
preenchimento	ushort (opcional) = 0	dois bytes de padding para alinhar `tries` a quatro bytes. Esse elemento só está presente se `tries_size` for diferente de zero e `insns_size` for ímpar.
tenta	try_item[tries_size] (opcional)	matriz que indica onde no código as exceções são capturadas e como processá-las. Os elementos da matriz não podem se sobrepor no intervalo e precisam estar em ordem crescente de endereço. Esse elemento só está presente se `tries_size` for diferente de zero.
gerenciadores	encoded_catch_handler_list (opcional)	bytes que representam uma lista de listas de tipos de captura e endereços de manipulador associados. Cada `try_item` tem um deslocamento de byte nessa estrutura. Esse elemento só está presente se `tries_size` for diferente de zero.

Formato try_item

Nome	Formato	Descrição
start_addr	uint	Endereço inicial do bloco de código coberto por esta entrada. O endereço é uma contagem de unidades de código de 16 bits até o início da primeira instrução coberta.
insn_count	ushort	Número de unidades de código de 16 bits cobertas por esta entrada. A última unidade de código coberta (inclusive) é `start_addr + insn_count - 1`.
handler_off	ushort	Deslocamento em bytes do início do `encoded_catch_hander_list` associado até o `encoded_catch_handler` desta entrada. Precisa ser um deslocamento para o início de um `encoded_catch_handler`.

formato encoded_catch_handler_list

Nome	Formato	Descrição
size	uleb128	tamanho desta lista, em entradas
list	encoded_catch_handler[handlers_size]	lista real de listas de manipuladores, representada diretamente (não como offsets) e concatenada sequencialmente

Formato encoded_catch_handler

Nome	Formato	Descrição
size	sleb128	número de tipos de captura nesta lista. Se não for positivo, será o negativo do número de tipos de captura, e as capturas serão seguidas por um manipulador de captura geral. Por exemplo, um `size` de `0` significa que há um catch-all, mas nenhum catch explicitamente tipado. Um `size` de `2` significa que há duas capturas de tipo explícito e nenhuma captura geral. Um `size` de `-1` significa que há uma captura tipada e uma captura geral.
gerenciadores	encoded_type_addr_pair[abs(size)]	fluxo de itens codificados `abs(size)`, um para cada tipo capturado, na ordem em que os tipos devem ser testados.
catch_all_addr	uleb128 (opcional)	Endereço de bytecode do manipulador "pega-tudo". Esse elemento só está presente se `size` for não positivo.

Formato encoded_type_addr_pair

Nome	Formato	Descrição
type_idx	uleb128	index na lista `type_ids` para o tipo da exceção a ser capturada
addr	uleb128	endereço de bytecode do gerenciador de exceções associado

debug_info_item

Referenciado de code_item

Aparece na seção de dados

Alinhamento: nenhum (alinhado por bytes)

Cada debug_info_item define uma máquina de estado byte-codificada inspirada no DWARF3 que, quando interpretada, emite a tabela de posições e (potencialmente) as informações de variáveis locais para um code_item. A sequência começa com um cabeçalho de comprimento variável (que depende do número de parâmetros do método), é seguida pelos bytecodes da máquina de estado e termina com um byte DBG_END_SEQUENCE.

A máquina de estado consiste em cinco registros. O registro address representa o deslocamento de instrução no insns_item associado em unidades de código de 16 bits. O registro address começa em 0 no início de cada sequência debug_info e só pode aumentar monotonicamente. O registro line representa qual número de linha de origem deve ser associado à próxima entrada da tabela de posições emitida pela máquina de estado. Ele é inicializado no cabeçalho da sequência e pode mudar em direções positivas ou negativas, mas nunca pode ser menor que 1. O registro source_file representa o arquivo de origem a que as entradas de número de linha se referem. Ele é inicializado com o valor de source_file_idx em class_def_item. As outras duas variáveis, prologue_end e epilogue_begin, são flags booleanas (inicializadas como false) que indicam se a próxima posição emitida deve ser considerada um prólogo ou epílogo de método. A máquina de estado também precisa rastrear o nome e o tipo da última variável local ativa em cada registro do código DBG_RESTART_LOCAL.

O cabeçalho é o seguinte:

Nome	Formato	Descrição
line_start	uleb128	o valor inicial do registro `line` da máquina de estado. Não representa uma entrada de posições real.
parameters_size	uleb128	o número de nomes de parâmetros codificados. Deve haver um por parâmetro de método, exceto o `this` de um método de instância, se houver.
parameter_names	uleb128p1[parameters_size]	Índice de string do nome do parâmetro do método. Um valor codificado de `NO_INDEX` indica que nenhum nome está disponível para o parâmetro associado. O descritor de tipo e a assinatura são implícitos no descritor e na assinatura do método.

Os valores de byte code são os seguintes:

Nome	Valor	Formato	Argumentos	Descrição
DBG_END_SEQUENCE	0x00		(nenhum)	encerra uma sequência de informações de depuração para um `code_item`
DBG_ADVANCE_PC	0x01	uleb128 addr_diff	`addr_diff`: valor a ser adicionado ao registro de endereço	avança o registro de endereço sem emitir uma entrada de posições
DBG_ADVANCE_LINE	0x02	sleb128 line_diff	`line_diff`: quantidade para mudar o registro de linha	avança o registro de linha sem emitir uma entrada de posições
DBG_START_LOCAL	0x03	uleb128 register_num uleb128p1 name_idx uleb128p1 type_idx	`register_num`: registro que vai conter local `name_idx`: índice de string do nome `type_idx`: índice de tipo do tipo	introduz uma variável local no endereço atual. `name_idx` ou `type_idx` podem ser `NO_INDEX` para indicar que o valor é desconhecido.
DBG_START_LOCAL_EXTENDED	0x04	uleb128 register_num uleb128p1 name_idx uleb128p1 type_idx uleb128p1 sig_idx	`register_num`: registro que vai conter local `name_idx`: índice de string do nome `type_idx`: índice de tipo do tipo `sig_idx`: índice de string da assinatura de tipo	introduz uma variável local com uma assinatura de tipo no endereço atual. Qualquer um dos valores `name_idx`, `type_idx` ou `sig_idx` pode ser `NO_INDEX` para indicar que o valor é desconhecido. No entanto, se `sig_idx` for `-1`, os mesmos dados poderão ser representados com mais eficiência usando o opcode `DBG_START_LOCAL`. Observação:consulte a discussão em "`dalvik.annotation.Signature`" abaixo para ver detalhes sobre como lidar com assinaturas.
DBG_END_LOCAL	0x05	uleb128 register_num	`register_num`: registro que continha local	marca uma variável local ativa como fora do escopo no endereço atual
DBG_RESTART_LOCAL	0x06	uleb128 register_num	`register_num`: registro para reiniciar	reintroduz uma variável local no endereço atual. O nome e o tipo são os mesmos do último local ativo no registro especificado.
DBG_SET_PROLOGUE_END	0x07		(nenhum)	Define o registro da máquina de estado `prologue_end`, indicando que a próxima entrada de posição adicionada deve ser considerada o fim de um prólogo de método (um lugar adequado para um ponto de interrupção de método). O registro `prologue_end` é limpo por qualquer opcode especial (`>= 0x0a`).
DBG_SET_EPILOGUE_BEGIN	0x08		(nenhum)	define o registro da máquina de estado `epilogue_begin`, indicando que a próxima entrada de posição adicionada deve ser considerada o início de um epílogo de método (um lugar adequado para suspender a execução antes da saída do método). O registro `epilogue_begin` é limpo por qualquer opcode especial (`>= 0x0a`).
DBG_SET_FILE	0x09	uleb128p1 name_idx	`name_idx`: índice de string do nome do arquivo de origem; `NO_INDEX` se desconhecido	indica que todas as entradas de número de linha subsequentes fazem referência a esse nome de arquivo de origem, em vez do nome padrão especificado em `code_item`.
Opcodes especiais	0x0a…0xff		(nenhum)	avança os registros `line` e `address`, emite uma entrada de posição e limpa `prologue_end` e `epilogue_begin`. Confira a descrição abaixo.

Opcodes especiais

Opcodes com valores entre 0x0a e 0xff (inclusive) movem os registros line e address em uma pequena quantidade e emitem uma nova entrada de tabela de posição. A fórmula para os incrementos é a seguinte:

DBG_FIRST_SPECIAL = 0x0a  // the smallest special opcode
DBG_LINE_BASE   = -4      // the smallest line number increment
DBG_LINE_RANGE  = 15      // the number of line increments represented

adjusted_opcode = opcode - DBG_FIRST_SPECIAL

line += DBG_LINE_BASE + (adjusted_opcode % DBG_LINE_RANGE)
address += (adjusted_opcode / DBG_LINE_RANGE)

annotations_directory_item

Referenciado de class_def_item

Aparece na seção de dados

Alinhamento: 4 bytes

Nome	Formato	Descrição
class_annotations_off	uint	Deslocamento do início do arquivo para as anotações feitas diretamente na classe ou `0` se a classe não tiver anotações diretas. Se o valor for diferente de zero, o deslocamento precisará ser para um local na seção `data`. O formato dos dados é especificado por "`annotation_set_item`" abaixo.
fields_size	uint	Contagem de campos anotados por este item.
annotated_methods_size	uint	Contagem de métodos anotados por este item.
annotated_parameters_size	uint	Contagem de listas de parâmetros de método anotadas por este item.
field_annotations	field_annotation[fields_size] (opcional)	lista de anotações de campo associadas. Os elementos da lista precisam ser classificados em ordem crescente por `field_idx`.
method_annotations	method_annotation[methods_size] (opcional)	lista de anotações de método associadas. Os elementos da lista precisam ser classificados em ordem crescente por `method_idx`.
parameter_annotations	parameter_annotation[parameters_size] (opcional)	lista de anotações de parâmetros de método associados. Os elementos da lista precisam ser classificados em ordem crescente por `method_idx`.

Observação:todas as instâncias field_id e method_id dos elementos precisam se referir à mesma classe de definição.

formato field_annotation

Nome	Formato	Descrição
field_idx	uint	index na lista `field_ids` para a identidade do campo que está sendo anotado
annotations_off	uint	Deslocamento do início do arquivo para a lista de anotações do campo. O deslocamento precisa ser para um local na seção `data`. O formato dos dados é especificado por "`annotation_set_item`" abaixo.

formato method_annotation

Nome	Formato	Descrição
method_idx	uint	index na lista `method_ids` para a identidade do método que está sendo anotado
annotations_off	uint	deslocamento do início do arquivo para a lista de anotações do método. O deslocamento precisa ser para um local na seção `data`. O formato dos dados é especificado por "`annotation_set_item`" abaixo.

Formato parameter_annotation

Nome	Formato	Descrição
method_idx	uint	indexar a lista `method_ids` para a identidade do método cujos parâmetros estão sendo anotados
annotations_off	uint	Deslocamento do início do arquivo para a lista de anotações dos parâmetros do método. O deslocamento precisa ser para um local na seção `data`. O formato dos dados é especificado por "`annotation_set_ref_list`" abaixo.

annotation_set_ref_list

Referenciado de parameter_annotations_item

Aparece na seção de dados

Alinhamento: 4 bytes

Nome	Formato	Descrição
size	uint	tamanho da lista, em entradas
list	annotation_set_ref_item[size]	elementos da lista

Formato annotation_set_ref_item

Nome	Formato	Descrição
annotations_off	uint	deslocamento do início do arquivo para o conjunto de anotações referenciado ou `0` se não houver anotações para esse elemento. Se o deslocamento não for zero, ele precisará estar em um local na seção `data`. O formato dos dados é especificado por "`annotation_set_item`" abaixo.

annotation_set_item

Referenciado em annotations_directory_item, field_annotations_item, method_annotations_item e annotation_set_ref_item

Aparece na seção de dados

Alinhamento: 4 bytes

Nome	Formato	Descrição
size	uint	tamanho do conjunto, em entradas
entries	annotation_off_item[size]	elementos do conjunto. Os elementos precisam ser classificados em ordem crescente por `type_idx`.

Formato annotation_off_item

Nome	Formato	Descrição
annotation_off	uint	Deslocamento do início do arquivo para uma anotação. O deslocamento precisa ser para um local na seção `data`, e o formato dos dados nesse local é especificado por "`annotation_item`" abaixo.

annotation_item

Referenciado de annotation_set_item

Aparece na seção de dados

Alinhamento: nenhum (alinhado por bytes)

Nome	Formato	Descrição
visibilidade	ubyte	visibilidade pretendida dessa anotação (veja abaixo)
annotation	encoded_annotation	conteúdo da anotação codificado, no formato descrito em "Formato `encoded_annotation`" em "Codificação `encoded_value`" acima.

Valores de visibilidade

Estas são as opções para o campo visibility em um annotation_item:

Nome	Valor	Descrição
VISIBILITY_BUILD	0x00	destinadas apenas a serem visíveis no momento da build (por exemplo, durante a compilação de outro código)
VISIBILITY_RUNTIME	0x01	destinada a ser visível no ambiente de execução
VISIBILITY_SYSTEM	0x02	destinada a ser visível no ambiente de execução, mas apenas para o sistema subjacente (e não para o código de usuário comum).

encoded_array_item

Referenciado de class_def_item

Aparece na seção de dados

Alinhamento: nenhum (alinhado por bytes)

Nome	Formato	Descrição
value	encoded_array	bytes que representam o valor da matriz codificada, no formato especificado por "Formato `encoded_array`" em "Codificação `encoded_value`" acima.

hiddenapi_class_data_item

Esta seção contém dados sobre interfaces restritas usadas por cada classe.

Observação:o recurso de API oculta foi introduzido no Android 10.0 e só é aplicável aos arquivos DEX de classes no caminho de classe de inicialização. A lista de flags descrita abaixo pode ser ampliada em versões futuras do Android. Para mais informações, consulte restrições para interfaces que não são SDK.

Nome	Formato	Descrição
size	uint	tamanho total da seção
compensações	uint[]	matriz de deslocamentos indexada por `class_idx`. Uma entrada de matriz zero no índice `class_idx` significa que não há dados para esse `class_idx` ou que todas as flags de API ocultas são zero. Caso contrário, a entrada da matriz será diferente de zero e vai conter um deslocamento do início da seção para uma matriz de flags de API ocultas para esse `class_idx`.
flags	uleb128[]	matrizes concatenadas de flags de API ocultas para cada classe. Os valores possíveis de flag são descritos na tabela abaixo. As flags são codificadas na mesma ordem que os campos e métodos são codificados nos dados de classe.

Tipos de flags de restrição:

Nome	Valor	Descrição
lista de permissões	0	São interfaces que podem ser usadas livremente e são aceitas como parte do Índice de pacote do framework do Android oficialmente documentado.
lista cinza	1	São interfaces externas ao SDK que podem ser usadas independente do nível da API de destino do aplicativo.
lista de proibições	2	São interfaces externas ao SDK que não podem ser usadas, independente do nível da API de destino do aplicativo. Acessar uma dessas interfaces causa um erro de execução.
greylist‑max‑o	3	São interfaces externas ao SDK que podem ser usadas no Android 8.x e versões anteriores, a menos que sejam restritas.
greylist‑max‑p	4	São interfaces não SDK que podem ser usadas no Android 9.x a menos que sejam restritas.
greylist‑max‑q	5	Interfaces não SDK que podem ser usadas no Android 10.x, a menos que sejam restritas.
greylist‑max‑r	6	Interfaces não SDK que podem ser usadas no Android 11.x, a menos que sejam restritas.

Anotações do sistema

As anotações do sistema são usadas para representar várias informações reflexivas sobre classes (e métodos e campos). Essas informações geralmente são acessadas apenas indiretamente pelo código do cliente (não do sistema).

As anotações do sistema são representadas em arquivos .dex como anotações com visibilidade definida como VISIBILITY_SYSTEM.

dalvik.annotation.AnnotationDefault

Aparece em métodos em interfaces de anotação

Uma anotação AnnotationDefault é anexada a cada interface de anotação que quer indicar vinculações padrão.

Nome	Formato	Descrição
value	Annotation	as vinculações padrão para essa anotação, representadas como uma anotação deste tipo. A anotação não precisa incluir todos os nomes definidos por ela. Os nomes ausentes simplesmente não têm valores padrão.

dalvik.annotation.EnclosingClass

Aparece nas turmas

Uma anotação EnclosingClass é anexada a cada classe que é definida como membro de outra classe, por si só, ou é anônima, mas não definida em um corpo de método (por exemplo, uma classe interna sintética). Toda classe com essa anotação também precisa ter uma anotação InnerClass. Além disso, uma classe não pode ter uma anotação EnclosingClass e uma EnclosingMethod.

Nome	Formato	Descrição
value	Classe	a classe que mais se aproxima do escopo lexical desta classe

dalvik.annotation.EnclosingMethod

Aparece nas turmas

Uma anotação EnclosingMethod é anexada a cada classe definida dentro do corpo de um método. Toda classe com essa anotação também precisa ter uma anotação InnerClass. Além disso, uma classe não pode ter uma anotação EnclosingClass e uma EnclosingMethod.

Nome	Formato	Descrição
value	Método	o método que mais se aproxima do escopo lexical dessa classe

dalvik.annotation.InnerClass

Aparece nas turmas

Uma anotação InnerClass é anexada a cada classe definida no escopo léxico da definição de outra classe. Qualquer classe que tenha essa anotação também precisa ter uma anotação EnclosingClass ou uma EnclosingMethod.

Nome	Formato	Descrição
nome	String	o nome simples originalmente declarado desta classe (sem incluir nenhum prefixo de pacote). Se a classe for anônima, o nome será `null`.
accessFlags	int	as flags de acesso originalmente declaradas da classe, que podem ser diferentes das flags efetivas devido a uma incompatibilidade entre os modelos de execução da linguagem de origem e da máquina virtual de destino.

dalvik.annotation.MemberClasses

Aparece nas turmas

Uma anotação MemberClasses é anexada a cada classe que declara classes de membros. Uma classe membro é uma classe interna direta que tem um nome.

Nome	Formato	Descrição
value	Class[]	matriz das classes de membros

dalvik.annotation.MethodParameters

Aparece em métodos

Observação:essa anotação foi adicionada depois do Android 7.1. A presença dele em versões anteriores do Android será ignorada.

Uma anotação MethodParameters é opcional e pode ser usada para fornecer metadados de parâmetros, como nomes e modificadores.

A anotação pode ser omitida de um método ou construtor com segurança quando os metadados do parâmetro não são necessários durante a execução. O java.lang.reflect.Parameter.isNamePresent() pode ser usado para verificar se os metadados estão presentes em um parâmetro, e os métodos de reflexão associados, como java.lang.reflect.Parameter.getName(), vão reverter para o comportamento padrão no tempo de execução se as informações não estiverem presentes.

Ao incluir metadados de parâmetros, os compiladores precisam incluir informações para classes geradas, como enums, já que os metadados de parâmetros incluem se um parâmetro é sintético ou obrigatório.

Uma anotação MethodParameters descreve apenas parâmetros de método individuais. Portanto, os compiladores podem omitir a anotação completamente para construtores e métodos sem parâmetros, para reduzir o tamanho do código e aumentar a eficiência do tempo de execução.

As matrizes documentadas abaixo precisam ter o mesmo tamanho da estrutura dex method_id_item associada ao método. Caso contrário, uma java.lang.reflect.MalformedParametersException será gerada durante a execução.

Ou seja, method_id_item.proto_idx -> proto_id_item.parameters_off -> type_list.size precisa ser igual a names().length e accessFlags().length.

Como MethodParameters descreve todos os parâmetros formais do método, mesmo aqueles não declarados explicitamente ou implicitamente no código-fonte, o tamanho das matrizes pode ser diferente da assinatura ou de outras informações de metadados que se baseiam apenas em parâmetros explícitos declarados no código-fonte. MethodParameters também não vai incluir informações sobre parâmetros de receptor de anotação de tipo que não existem na assinatura do método real.

Nome	Formato	Descrição
nomes	String[]	Os nomes dos parâmetros formais do método associado. A matriz não pode ser nula, mas precisa estar vazia se não houver parâmetros formais. Um valor na matriz precisa ser nulo se o parâmetro formal com esse índice não tiver um nome. Se as strings de nome de parâmetro estiverem vazias ou contiverem ".", ";", "[" ou "/", um `java.lang.reflect.MalformedParametersException` será gerado em tempo de execução.
accessFlags	int[]	As flags de acesso dos parâmetros formais do método associado. A matriz não pode ser nula, mas precisa estar vazia se não houver parâmetros formais. O valor é uma máscara de bits com os seguintes valores: 0x0010 : final, o parâmetro foi declarado como final 0x1000 : sintético, o parâmetro foi introduzido pelo compilador 0x8000 : obrigatório, o parâmetro é sintético, mas também implícito pela especificação de idioma Se algum bit for definido fora desse conjunto, um `java.lang.reflect.MalformedParametersException` será gerado no tempo de execução.

dalvik.annotation.Signature

Aparece em classes, campos e métodos

Uma anotação Signature é anexada a cada classe, campo ou método definido em termos de um tipo mais complicado do que pode ser representado por um type_id_item. O formato .dex não define o formato das assinaturas. Ele apenas representa as assinaturas que uma linguagem de origem exige para a implementação bem-sucedida da semântica dessa linguagem. Por isso, as assinaturas geralmente não são analisadas (ou verificadas) pelas implementações de máquinas virtuais. As assinaturas são simplesmente entregues a APIs e ferramentas de nível superior, como depuradores. Portanto, qualquer uso de uma assinatura precisa ser escrito para não fazer nenhuma suposição sobre o recebimento apenas de assinaturas válidas, protegendo-se explicitamente contra a possibilidade de encontrar uma assinatura sintaticamente inválida.

Como as strings de assinatura tendem a ter muito conteúdo duplicado, uma anotação Signature é definida como uma matriz de strings, em que os elementos duplicados se referem naturalmente aos mesmos dados subjacentes, e a assinatura é considerada a concatenação de todas as strings na matriz. Não há regras sobre como separar uma assinatura em strings diferentes. Isso depende totalmente das ferramentas que geram arquivos .dex.

Nome	Formato	Descrição
value	String[]	a assinatura dessa classe ou membro, como uma matriz de strings que será concatenada

dalvik.annotation.Throws

Aparece em métodos

Uma anotação Throws é anexada a cada método declarado para gerar um ou mais tipos de exceção.

Nome	Formato	Descrição
value	Class[]	a matriz de tipos de exceção gerados

Formato executável Dalvik Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Guia para tipos

LEB128

Layout do arquivo

Formato do contêiner

Definições de bitfield, string e constante

DEX_FILE_MAGIC

Incorporado em header_item

ENDIAN_CONSTANT e REVERSE_ENDIAN_CONSTANT

Incorporado em header_item

NO_INDEX

Incorporado em class_def_item e debug_info_item

Definições de access_flags

Incorporado em class_def_item, encoded_field, encoded_method e InnerClass

Codificação UTF-8 modificada

Codificação encoded_value

Incorporado em "annotation_element" e "encoded_array_item"

Formatos de valor

Formato encoded_array

formato encoded_annotation

formato annotation_element

Sintaxe de string

SimpleName

MemberName

usado por field_id_item e method_id_item

FullClassName

TypeDescriptor

Usado por type_id_item

ShortyDescriptor

Usado por proto_id_item

Semântica do TypeDescriptor

Itens e estruturas relacionadas

header_item

Aparece na seção de cabeçalho

Alinhamento: 4 bytes

map_list

Aparece na seção de dados

Referenciado de header_item

Alinhamento: 4 bytes

Formato map_item

Códigos de tipo

string_id_item

Aparece na seção "string_ids"

Alinhamento: 4 bytes

string_data_item

Aparece na seção de dados

Alinhamento: nenhum (alinhado por bytes)

type_id_item

Aparece na seção "type_ids"

Alinhamento: 4 bytes

proto_id_item

Aparece na seção "proto_ids"

Alinhamento: 4 bytes

field_id_item

Aparece na seção "field_ids"

Alinhamento: 4 bytes

method_id_item

Aparece na seção "method_ids".

Alinhamento: 4 bytes

class_def_item

Aparece na seção "class_defs"

Alinhamento: 4 bytes

call_site_id_item

Aparece na seção "call_site_ids"

Alinhamento: 4 bytes

call_site_item

Aparece na seção de dados

Alinhamento: nenhum (alinhado por bytes)

method_handle_item

Aparece na seção "method_handles"

Alinhamento: 4 bytes

Códigos de tipo de identificador de método

class_data_item

Referenciado de class_def_item

Aparece na seção de dados

Alinhamento: nenhum (alinhado por bytes)

Formato encoded_field

formato encoded_method

type_list

Referenciado de class_def_item e proto_id_item

Formato executável Dalvik