Guide de terrain des formats de stockage d'e-mails : histoire, anatomie et comparatif
Comment les e-mails sont réellement stockés sur le disque — MBOX, Maildir, EML, PST, OST, OLM, MSG, NSF et des formats historiques comme Eudora. Leur histoire, leur construction, à quoi chacun sert, et un comparatif côte à côte.
David Carrero ·
Tout logiciel de messagerie doit répondre à la même question : où vont réellement les messages sur le disque ? Un demi-siècle de réponses a produit un petit zoo de formats — certains ouverts et d’une simplicité admirable, d’autres des bases de données propriétaires illisibles sans l’application qui les a créées. Voici un tour d’horizon de ceux que vous croiserez, leur construction, leur origine et la façon dont ils se comparent.
Dans les grandes lignes, ils se répartissent en trois familles :
- Conteneurs ouverts et textuels — un fichier contient de nombreux messages (MBOX), ou un fichier par message dans un dossier (Maildir). Lisibles par l’humain, indépendants de tout éditeur.
- Un message par fichier — un message unique sous forme de fichier autonome (EML, MSG).
- Bases de données propriétaires — un stockage binaire contenant le courrier ainsi que le calendrier, les contacts et l’état (PST, OST, OLM, NSF). Compactes au sein de leur application, opaques en dehors.
Les formats ouverts et textuels
MBOX — la lingua franca
MBOX remonte aux premiers systèmes de messagerie Unix des années 1970. L’idée est d’une simplicité désarmante : concaténer tous les messages d’une boîte aux lettres dans un seul fichier texte brut, et marquer le début de chacun par une ligne commençant par From (la « ligne From_ », avec une espace, et non l’en-tête From:). En-têtes, corps et pièces jointes — encodés sous forme de texte — vivent tous en ligne.
Cette simplicité cache une subtilité célèbre : que se passe-t-il lorsque le corps d’un message contient lui-même une ligne commençant par « From » ? Des réponses différentes ont donné naissance à des variantes — mboxo, mboxrd, mboxcl et mboxcl2 — qui échappent (ou non) cette séquence de manière différente. En pratique, les outils modernes les lisent toutes. MBOX est ce qu’exportent Google Takeout, Apple Mail, Thunderbird et la plupart des clients classiques, ce qui en fait ce qui se rapproche le plus d’un format d’archive universel pour l’e-mail.
Maildir — un fichier par message
Créé pour le serveur qmail en 1995, Maildir adopte l’approche inverse : chaque message est son propre fichier au sein d’un dossier, réparti entre les sous-répertoires tmp/, new/ et cur/. Sa grande vertu est la sécurité sans verrouillage — deux processus peuvent distribuer du courrier en même temps sans corrompre un fichier partagé, le risque classique avec MBOX. C’est le format natif de serveurs comme Dovecot et Courier. La contrepartie : des millions de tout petits fichiers, ce que certains systèmes de fichiers n’apprécient guère.
EML — un message unique, tel que l’internet le définit
EML, c’est un message enregistré exactement tel qu’il circule : la structure MIME brute définie par les RFC de l’e-mail (822 → 2822 → 5322). Les en-têtes en haut, puis le corps et les pièces jointes encodés en parties MIME. Parce qu’il est le format tel qu’il transite sur le réseau, presque tout peut le produire et le lire — Outlook, Thunderbird, les systèmes de tickets, les scanners et les serveurs de messagerie. Un dossier de fichiers .eml est l’archive la plus simple qui soit.
Les bases de données propriétaires
PST — le stockage personnel d’Outlook sous Windows
PST (Personal Storage Table) est la base de données sur disque de Microsoft Outlook sous Windows, bâtie sur le modèle MAPI. Elle contient bien plus que du courrier — calendrier, contacts, tâches, notes — dans un seul fichier binaire. Le PST ANSI d’origine (Outlook 97–2002) plafonnait à 2 Go et était sujet à la corruption à l’approche de cette limite ; le PST Unicode (Outlook 2003+) l’a portée à 20–50 Go. Rapide et compact au sein d’Outlook, mais inutilisable par les autres applications sans conversion.
OST — le cache hors ligne
OST (Offline Storage Table) est le cousin du PST : une copie mise en cache d’une boîte aux lettres qui réside sur un serveur Exchange ou Microsoft 365. Il existe pour qu’Outlook fonctionne hors ligne et se resynchronise ensuite. Point crucial : un OST est lié à son compte et à son profil — ce n’est pas une archive portable, et les fichiers OST orphelins peuvent être très difficiles à ouvrir.
OLM — Outlook pour Mac
OLM est le format d’export/d’archive d’Outlook pour Mac. Même intention que PST, conteneur différent — un paquet propriétaire qui, comme PST, doit être converti avant qu’autre chose qu’Outlook puisse le lire.
MSG — un message Outlook unique
MSG est un message exporté depuis Outlook, stocké sous forme de « fichier composé » OLE (un mini système de fichiers à l’intérieur d’un fichier) portant des propriétés MAPI. C’est l’équivalent Windows d’EML, mais binaire et spécifique à Microsoft.
NSF — Lotus Notes / HCL Domino
NSF (Notes Storage Facility) est la base de données derrière IBM/Lotus Notes (désormais HCL Domino) — une plateforme applicative complète, pas seulement de la messagerie. Les archives NSF refont surface dans les entreprises de longue date et, comme les autres ici, nécessitent des outils dédiés pour en extraire le contenu.
Les formats historiques
- Eudora (1988–2006) était le client dominant des débuts de l’internet. Il stockait le courrier dans des fichiers de boîte aux lettres
.mbx— essentiellement du MBOX — associés à un index sommaire.toc. Comme le corps est du texte de type MBOX, les archives Eudora sont généralement récupérables aujourd’hui. - Outlook Express utilisait des fichiers
.dbx(un par dossier) sous Windows à la fin des années 1990 et dans les années 2000 ; son successeur Windows Mail / Live Mail est passé à des fichiers.emlindividuels. - Le courrier Netscape/Mozilla, Evolution, Claws Mail, Entourage et d’autres stockaient ou exportaient du MBOX — c’est précisément pourquoi MBOX reste aussi largement lisible.
Côte à côte
| Format | Structure | Ouvert ? | Archive portable ? | Origine |
|---|---|---|---|---|
| MBOX | Un fichier texte, de nombreux messages | ✅ Ouvert | ✅ Excellente | Unix, années 1970 |
| Maildir | Un fichier par message, dans des dossiers | ✅ Ouvert | ✅ Bonne | qmail, 1995 |
| EML | Un message, MIME brut | ✅ Ouvert | ✅ Excellente | RFC de l’internet |
| MSG | Un message, composé OLE | ❌ Propriétaire | ⚠️ Limitée | Microsoft |
| PST | Base de données binaire (courrier + PIM) | ❌ Propriétaire | ⚠️ Convertir d’abord | Outlook (Win) |
| OST | Boîte aux lettres serveur en cache | ❌ Propriétaire | ❌ Liée au compte | Outlook/Exchange |
| OLM | Paquet propriétaire | ❌ Propriétaire | ⚠️ Convertir d’abord | Outlook (Mac) |
| NSF | Base de données applicative | ❌ Propriétaire | ⚠️ Convertir d’abord | Lotus Notes |
Que choisir pour le long terme
Pour archiver — conserver le courrier lisible pendant des décennies — les formats ouverts et textuels l’emportent à chaque fois. MBOX et EML n’ont ni éditeur, ni licence, ni moteur de base de données susceptible de devenir obsolète : dans vingt ans, ce sera toujours du texte brut que n’importe quel outil pourra ouvrir. C’est pourquoi, si vous avez le choix du format d’export, MBOX (ou un dossier de fichiers EML) est l’option sûre, et pourquoi convertir un PST/OLM en MBOX pérennise une archive Outlook.
Une fois votre courrier en MBOX ou EML, Mbox Viewer l’ouvre sur Mac et Windows — quelle que soit la taille, en lecture seule, entièrement hors ligne. Pour la version pratique « quel fichier puis-je ouvrir et comment » de ce guide, voir MBOX, EML, PST, OLM : les formats d’archive d’e-mails expliqués ; pour transformer un fichier Outlook en MBOX, voir comment convertir un PST/OLM en MBOX.
Ouvrez votre archive avec Mbox Viewer
Application native pour Mac et Windows. Lit en streaming des fichiers MBOX et EML de toute taille, entièrement hors ligne.