Glossário
Glossário de e-mail e MBOX
Termos essenciais sobre arquivos de e-mail, formatos, protocolos e a anatomia de uma mensagem — cada um com sua própria página, explicado em linguagem simples.
Formatos de arquivo
Formato de arquivo de texto simples que armazena múltiplas mensagens de e-mail concatenadas, cada uma iniciando com uma linha separadora "From ". É o formato produzido pelo Google Takeout ao exportar seu arquivo do Gmail.
Arquivo de mensagem única no formato MIME, contendo cabeçalhos, corpo e anexos. Os arquivos EML são amplamente suportados em clientes de e-mail e são úteis para arquivar ou compartilhar mensagens individuais.
Formato binário proprietário do Microsoft Outlook para uma única mensagem de e-mail, armazenando cabeçalhos, corpo e anexos em uma Estrutura de Documento Composto. Ao contrário do EML, o MSG não é um padrão de texto simples.
Personal Storage Table — arquivo contêiner do Microsoft Outlook para uma caixa de entrada inteira, incluindo pastas, mensagens, contatos e itens de calendário. Também conhecido como OST quando usado para sincronização offline com Exchange ou Microsoft 365.
Formato de caixa de correio que armazena cada mensagem de e-mail como um arquivo separado em uma hierarquia de diretórios, em vez de concatenar todas as mensagens em um único arquivo como o MBOX.
Protocolos e serviços
Internet Message Access Protocol — protocolo padrão para acessar e-mail armazenado em um servidor, mantendo mensagens sincronizadas entre múltiplos dispositivos sem baixá-las e excluí-las.
Post Office Protocol 3 — protocolo mais antigo de recuperação de e-mail que baixa mensagens de um servidor para um dispositivo local, geralmente removendo-as do servidor em seguida.
Simple Mail Transfer Protocol — protocolo padrão usado para enviar e retransmitir mensagens de e-mail entre servidores de e-mail. É usado somente para e-mail de saída; ler e-mail requer IMAP ou POP3.
Serviço oficial do Google para exportar seus dados pessoais, incluindo o Gmail. Para e-mail, produz um ou mais arquivos MBOX contendo todas as suas mensagens e suas etiquetas do Gmail.
Sistema de marcação do Gmail que atribui uma ou mais etiquetas a cada mensagem, cumprindo o papel que as pastas desempenham em clientes de e-mail tradicionais. Uma única mensagem pode ter várias etiquetas simultaneamente.
Estrutura da mensagem
O bloco de metadados estruturados no início de uma mensagem de e-mail, contendo campos como De, Para, Assunto, Data e numerosos campos técnicos que descrevem como a mensagem foi composta, roteada e codificada.
Multipurpose Internet Mail Extensions — padrão que define como as mensagens de e-mail codificam texto não-ASCII, corpos HTML, anexos e outros conteúdos binários dentro da estrutura de texto simples do e-mail.
Estrutura de mensagem MIME que combina múltiplas partes de conteúdo — como texto simples, HTML e anexos — em uma única mensagem, cada uma separada por uma string de delimitação única.
Identificador globalmente único atribuído a cada mensagem de e-mail, especificado no cabeçalho Message-ID. É usado para rastrear mensagens, construir threads de conversa e detectar duplicatas ao mesclar arquivos.
Cabeçalhos de e-mail (In-Reply-To e References) que vinculam uma resposta à mensagem à qual ela responde, permitindo que clientes de e-mail e ferramentas de arquivo agrupem mensagens relacionadas em threads de conversa.
Os metadados de entrega usados pelos servidores SMTP para rotear uma mensagem de e-mail — especificamente o remetente do envelope (MAIL FROM) e os destinatários do envelope (RCPT TO) — que podem diferir dos cabeçalhos De e Para visíveis.
Um arquivo — como PDF, imagem ou planilha — incorporado em uma mensagem de e-mail e codificado como parte MIME, separado do corpo da mensagem, destinado ao destinatário para salvar ou abrir.
Uma imagem incorporada diretamente no corpo de um e-mail HTML usando uma referência Content-ID (cid:), em vez de ser anexada como arquivo separado para download. Os dados da imagem são armazenados como parte MIME dentro da mesma mensagem.
Codificação e conjuntos de caracteres
A codificação de caracteres que especifica como os bytes em uma parte de texto são mapeados para caracteres legíveis. Conjuntos de caracteres comuns incluem UTF-8, ISO-8859-1 e Shift_JIS; uma incompatibilidade causa texto ilegível conhecido como mojibake.
Esquema de codificação binário para texto que representa dados binários arbitrários usando apenas 64 caracteres ASCII imprimíveis, amplamente usado em e-mail para transmitir com segurança anexos e conteúdo binário.
Codificação de transferência MIME que representa texto com caracteres majoritariamente ASCII, escapando bytes não-ASCII como sequências hexadecimais =XX. Mantém a maior parte do texto legível por humanos na fonte bruta da mensagem.
Esquema de codificação definido na RFC 2047 ("Encoded-Word") que permite caracteres não-ASCII em campos de cabeçalho de e-mail como Assunto e De, codificando-os como tokens =?charset?codificação?texto?=.
Conceitos e recursos
Processo de agrupar mensagens de e-mail relacionadas em conversas seguindo os vínculos dos cabeçalhos In-Reply-To e References, tipicamente usando o algoritmo JWZ que suporta até quatro níveis de aninhamento.
Processo de detectar e remover mensagens de e-mail duplicadas de um arquivo, tipicamente comparando valores de Message-ID, para evitar redundância ao mesclar múltiplos arquivos MBOX.
Técnica de análise que lê um arquivo incrementalmente em pequenos fragmentos, em vez de carregar o arquivo inteiro na memória de uma vez, permitindo que ferramentas abram e indexem arquivos MBOX muito grandes — dezenas ou centenas de gigabytes — com baixo uso de memória.
Arquivo de índice compacto que o Mbox Viewer grava junto a um arquivo MBOX após a primeira análise, armazenando deslocamentos de bytes e metadados das mensagens para permitir reabertura quase instantânea sem reescanear o arquivo inteiro.
Mensagem de e-mail cujo corpo é formatado com HTML e CSS, permitindo tipografia rica, layout, cores e imagens. A maioria dos e-mails modernos é HTML, mas considerações de privacidade e segurança exigem renderização cuidadosa.
Um pacote de aplicativo macOS que contém código compilado nativo tanto para Apple Silicon (ARM64) quanto para Intel (x86_64), executando nativamente em qualquer processador sem emulação.
O App Sandbox é um recurso de segurança do macOS que restringe o acesso de um aplicativo a recursos do sistema, arquivos e conexões de rede, limitando o impacto potencial caso o aplicativo ou suas dependências tenham uma vulnerabilidade.