Glossaire
Glossaire du courrier électronique et MBOX
Termes clés des archives de courrier, des formats, des protocoles et de l’anatomie d’un message — chacun avec sa propre page, expliqué en langage clair.
Formats de fichier
Un format de fichier en texte brut qui stocke plusieurs messages électroniques concaténés, chacun commençant par une ligne de séparation « From ». C'est le format produit par Google Takeout lors de l'export d'une archive Gmail.
Un fichier à message unique au format MIME, contenant les en-têtes, le corps et les pièces jointes. Les fichiers EML sont largement pris en charge par les clients de messagerie et sont utiles pour archiver ou partager des messages individuels.
Le format binaire propriétaire de Microsoft Outlook pour un message électronique unique, stockant les en-têtes, le corps et les pièces jointes dans une structure de document composé. Contrairement à EML, MSG n'est pas un standard ouvert.
Personal Storage Table — le fichier conteneur de Microsoft Outlook pour une boîte aux lettres entière, incluant les dossiers, les messages, les contacts et les éléments de calendrier. Également connu sous le nom OST lorsqu'il est utilisé pour la synchronisation hors ligne avec Exchange ou Microsoft 365.
Un format de boîte aux lettres qui stocke chaque message électronique comme un fichier distinct dans une hiérarchie de répertoires, plutôt que de concaténer tous les messages dans un seul fichier comme MBOX.
Protocoles & services
Internet Message Access Protocol — le protocole standard pour accéder aux courriels stockés sur un serveur, maintenant les messages synchronisés sur plusieurs appareils sans les télécharger et les supprimer.
Post Office Protocol 3 — un ancien protocole de récupération de courrier électronique qui télécharge les messages d'un serveur vers un appareil local, les supprimant généralement du serveur par la suite.
Simple Mail Transfer Protocol — le protocole standard utilisé pour envoyer et relayer des messages électroniques entre serveurs de messagerie. Il est utilisé uniquement pour le courrier sortant ; la lecture du courrier nécessite IMAP ou POP3.
Le service officiel de Google pour exporter vos données personnelles, y compris Gmail. Pour le courrier électronique, il produit un ou plusieurs fichiers MBOX contenant tous vos messages et leurs étiquettes Gmail.
Le système d'étiquetage de Gmail qui attribue une ou plusieurs étiquettes à chaque message, jouant le rôle que jouent les dossiers dans les clients de messagerie traditionnels. Un même message peut porter plusieurs étiquettes simultanément.
Structure du message
Le bloc de métadonnées structurées au début d'un message électronique, contenant des champs tels que From, To, Subject, Date et de nombreux champs techniques décrivant la façon dont le message a été composé, acheminé et encodé.
Multipurpose Internet Mail Extensions — le standard qui définit comment les messages électroniques encodent le texte non ASCII, les corps HTML, les pièces jointes et tout autre contenu binaire dans la structure en texte brut du courrier électronique.
Une structure de message MIME qui combine plusieurs parties de contenu — telles que le texte brut, le HTML et les pièces jointes — dans un seul message, chacune séparée par une chaîne de délimitation unique.
Un identifiant globalement unique attribué à chaque message électronique, spécifié dans l'en-tête Message-ID. Il est utilisé pour suivre les messages, construire des fils de conversation et détecter les doublons lors de la fusion d'archives.
Des en-têtes de courriel (In-Reply-To et References) qui relient une réponse au message auquel elle répond, permettant aux clients de messagerie et aux outils d'archivage de regrouper les messages connexes en fils de conversation.
Les métadonnées de livraison utilisées par les serveurs SMTP pour acheminer un message électronique — spécifiquement l'expéditeur d'enveloppe (MAIL FROM) et les destinataires d'enveloppe (RCPT TO) — qui peuvent différer des en-têtes From et To visibles.
Un fichier — tel qu'un PDF, une image ou une feuille de calcul — intégré dans un message électronique et encodé comme partie MIME, séparé du corps du message, destiné à être sauvegardé ou ouvert par le destinataire.
Une image incorporée directement dans le corps d'un courriel HTML à l'aide d'une référence Content-ID (cid:), plutôt qu'attachée comme fichier téléchargeable séparé. Les données de l'image sont stockées comme partie MIME dans le même message.
Encodage & jeux de caractères
L'encodage de caractères qui spécifie comment les octets d'une partie texte sont mappés sur des caractères lisibles. Les jeux de caractères courants incluent UTF-8, ISO-8859-1 et Shift_JIS ; une incompatibilité provoque du texte illisible connu sous le nom de mojibake.
Un schéma d'encodage binaire vers texte qui représente des données binaires arbitraires en utilisant seulement 64 caractères ASCII imprimables, largement utilisé dans les courriels pour transmettre en toute sécurité des pièces jointes et du contenu binaire.
Un encodage de transfert MIME qui représente le texte composé principalement de caractères ASCII, en échappant les octets non ASCII sous forme de séquences hexadécimales =XX. Il conserve la majorité du texte lisible par l'humain dans la source brute du message.
Un schéma d'encodage défini dans la RFC 2047 (« Encoded-Word ») qui permet les caractères non ASCII dans les champs d'en-tête de courriel tels que Subject et From, en les encodant sous forme de tokens =?charset?encodage?texte?=.
Concepts & fonctionnalités
Le processus de regroupement de messages électroniques connexes en conversations en suivant les liens d'en-têtes In-Reply-To et References, généralement à l'aide de l'algorithme JWZ qui prend en charge jusqu'à quatre niveaux d'imbrication.
Le processus de détection et de suppression des messages électroniques en double dans une archive, généralement en comparant les valeurs Message-ID, afin d'éviter la redondance lors de la fusion de plusieurs fichiers MBOX.
Une technique d'analyse qui lit un fichier de manière incrémentale en petits blocs plutôt que de charger l'intégralité du fichier en mémoire, permettant aux outils d'ouvrir et d'indexer des fichiers MBOX très volumineux — des dizaines ou centaines de gigaoctets — avec une faible utilisation de la mémoire.
Un fichier d'index compact que Mbox Viewer écrit à côté d'une archive MBOX après la première analyse, stockant les décalages en octets des messages et les métadonnées pour permettre des réouvertures quasi instantanées sans re-parcourir l'intégralité du fichier.
Un message électronique dont le corps est formaté avec HTML et CSS, permettant une typographie riche, une mise en page, des couleurs et des images. La plupart des courriels modernes sont en HTML, mais la confidentialité et la sécurité nécessitent un rendu soigneux.
Un bundle d'application macOS qui contient du code compilé natif pour les architectures Apple Silicon (ARM64) et Intel (x86_64), s'exécutant nativement sur l'un ou l'autre processeur sans émulation.
App Sandbox est une fonctionnalité de sécurité macOS qui restreint l'accès d'une application aux ressources système, aux fichiers et aux connexions réseau, limitant l'impact potentiel si l'application ou ses dépendances présente une vulnérabilité.