Message-ID
Identificador globalmente único atribuído a cada mensagem de e-mail, especificado no cabeçalho Message-ID. É usado para rastrear mensagens, construir threads de conversa e detectar duplicatas ao mesclar arquivos.
O cabeçalho Message-ID (RFC 5322 seção 3.6.4) contém uma string que se destina a ser única em todos os e-mails já enviados, tipicamente formatada como uma string parte-local@domínio como <[email protected]>. O servidor de e-mail de envio gera esse identificador no momento da transmissão. As respostas incluem o Message-ID da mensagem original em seus cabeçalhos In-Reply-To e References para vincular a conversa.
O Message-ID é a chave primária usada pelos algoritmos de encadeamento para reconstruir conversas. Também é usado durante a deduplicação: ao mesclar dois arquivos MBOX que podem se sobrepor — por exemplo, duas exportações do Google Takeout de datas diferentes — comparar os Message-IDs permite que o aplicativo identifique e pule mensagens que já existem no arquivo de destino.
Em casos raros, os Message-IDs podem estar ausentes (em mensagens muito antigas) ou duplicados (por software de envio com falhas). Uma ferramenta de arquivo robusta trata esses casos extremos recorrendo à correspondência heurística em outros cabeçalhos como Data, De e Assunto quando um Message-ID está ausente ou não confiável.
Termos relacionados
Cabeçalhos de e-mail (In-Reply-To e References) que vinculam uma resposta à mensagem à qual ela responde, permitindo que clientes de e-mail e ferramentas de arquivo agrupem mensagens relacionadas em threads de conversa.
Processo de detectar e remover mensagens de e-mail duplicadas de um arquivo, tipicamente comparando valores de Message-ID, para evitar redundância ao mesclar múltiplos arquivos MBOX.
Processo de agrupar mensagens de e-mail relacionadas em conversas seguindo os vínculos dos cabeçalhos In-Reply-To e References, tipicamente usando o algoritmo JWZ que suporta até quatro níveis de aninhamento.