Ein Feldführer zu E-Mail-Speicherformaten: Geschichte, Aufbau und ein Vergleich
Wie E-Mails tatsächlich auf der Festplatte gespeichert werden — MBOX, Maildir, EML, PST, OST, OLM, MSG, NSF und historische Formate wie Eudora. Ihre Geschichte, ihr Aufbau, wofür sie jeweils gut sind und ein direkter Vergleich.
David Carrero ·
Jedes E-Mail-Programm muss dieselbe Frage beantworten: Wohin gehen die Nachrichten eigentlich auf der Festplatte? Ein halbes Jahrhundert an Antworten hat einen kleinen Zoo von Formaten hervorgebracht — manche offen und wunderbar einfach, andere proprietäre Datenbanken, die man ohne die Anwendung, die sie erzeugt hat, nicht lesen kann. Dies ist ein Rundgang durch jene, denen Sie begegnen werden: wie sie aufgebaut sind, woher sie stammen und wie sie sich im Vergleich schlagen.
Grob lassen sie sich in drei Familien einteilen:
- Offene, textbasierte Container — eine Datei enthält viele Nachrichten (MBOX), oder eine Datei pro Nachricht in einem Ordner (Maildir). Menschenlesbar, herstellerneutral.
- Eine Nachricht pro Datei — eine einzelne Nachricht als eigenständige Datei (EML, MSG).
- Proprietäre Datenbanken — ein binärer Speicher, der Mail samt Kalender, Kontakten und Status enthält (PST, OST, OLM, NSF). Kompakt innerhalb ihrer Anwendung, undurchsichtig außerhalb.
Die offenen, textbasierten Formate
MBOX — die Lingua franca
MBOX geht auf die frühen Unix-Mailsysteme der 1970er-Jahre zurück. Die Idee ist entwaffnend einfach: jede Nachricht eines Postfachs in einer einzigen Klartextdatei aneinanderreihen und markieren, wo jede beginnt, mit einer Zeile, die mit From anfängt (die „From_-Zeile”, mit einem Leerzeichen, nicht der From:-Kopfzeile). Kopfzeilen, Textkörper und Anhänge — als Text codiert — liegen alle inline.
Diese Einfachheit verbirgt eine berühmte Tücke: Was passiert, wenn ein Nachrichtentext selbst eine Zeile enthält, die mit „From ” beginnt? Unterschiedliche Antworten brachten Varianten hervor — mboxo, mboxrd, mboxcl und mboxcl2 —, die diese Sequenz auf verschiedene Weise maskieren (oder eben nicht). In der Praxis lesen moderne Werkzeuge sie alle. MBOX ist das Format, das Google Takeout, Apple Mail, Thunderbird und die meisten klassischen Clients exportieren, was es zu dem macht, was E-Mail einem universellen Archivformat am nächsten kommt.
Maildir — eine Datei pro Nachricht
1995 für den qmail-Server entwickelt, verfolgt Maildir den entgegengesetzten Ansatz: Jede Nachricht ist eine eigene Datei innerhalb eines Ordners, aufgeteilt auf die Unterverzeichnisse tmp/, new/ und cur/. Sein großer Vorzug ist Sicherheit ohne Sperren — zwei Prozesse können gleichzeitig Mail zustellen, ohne eine gemeinsame Datei zu beschädigen, das klassische Risiko bei MBOX. Es ist das native Format von Servern wie Dovecot und Courier. Der Nachteil sind Millionen winziger Dateien, die manche Dateisysteme nicht mögen.
EML — eine einzelne Nachricht, so wie das Internet sie definiert
EML ist eine Nachricht, gespeichert genau so, wie sie unterwegs ist: die rohe MIME-Struktur, die durch die E-Mail-RFCs definiert wird (822 → 2822 → 5322). Kopfzeilen oben, dann der Textkörper und die Anhänge, codiert in MIME-Teilen. Weil es das Format auf der Leitung ist, kann fast alles es erzeugen und lesen — Outlook, Thunderbird, Ticketsysteme, Scanner und Mailserver. Ein Ordner mit .eml-Dateien ist das denkbar einfachste Archiv.
Die proprietären Datenbanken
PST — Outlooks persönlicher Speicher unter Windows
PST (Personal Storage Table) ist die Festplattendatenbank von Microsoft Outlook unter Windows, aufgebaut auf dem MAPI-Modell. Sie enthält weit mehr als Mail — Kalender, Kontakte, Aufgaben, Notizen — in einer einzigen Binärdatei. Die ursprüngliche ANSI-PST (Outlook 97–2002) war bei 2 GB begrenzt und nahe dieser Grenze anfällig für Beschädigungen; die Unicode-PST (Outlook 2003+) hob das auf 20–50 GB an. Schnell und kompakt innerhalb von Outlook, aber für andere Anwendungen ohne Konvertierung nutzlos.
OST — der Offline-Cache
OST (Offline Storage Table) ist die Schwester von PST: eine zwischengespeicherte Kopie eines Postfachs, das auf einem Exchange- oder Microsoft-365-Server liegt. Sie existiert, damit Outlook offline arbeitet und sich später wieder synchronisiert. Entscheidend ist: Eine OST ist an ihr Konto und ihr Profil gebunden — sie ist kein portables Archiv, und verwaiste OST-Dateien lassen sich oft nur schwer überhaupt öffnen.
OLM — Outlook für Mac
OLM ist das Export-/Archivformat von Outlook für Mac. Gleiche Absicht wie PST, anderer Container — ein proprietäres Bündel, das, wie PST, konvertiert werden muss, bevor etwas anderes als Outlook es lesen kann.
MSG — eine einzelne Outlook-Nachricht
MSG ist eine aus Outlook exportierte Nachricht, gespeichert als OLE-„Compound File” (ein Mini-Dateisystem innerhalb einer Datei), das MAPI-Eigenschaften trägt. Es ist das Windows-Gegenstück zu EML, aber binär und Microsoft-spezifisch.
NSF — Lotus Notes / HCL Domino
NSF (Notes Storage Facility) ist die Datenbank hinter IBM/Lotus Notes (heute HCL Domino) — eine komplette Anwendungsplattform, nicht nur Mail. NSF-Archive tauchen in langjährig bestehenden Unternehmen noch immer auf und erfordern, wie die anderen hier, eigene Werkzeuge zum Extrahieren.
Die historischen
- Eudora (1988–2006) war der dominierende Client der frühen Internet-Ära. Es speicherte Mail in
.mbx-Postfachdateien — im Wesentlichen MBOX — gepaart mit einem.toc-Inhaltsverzeichnis als Index. Weil der Textkörper MBOX-ähnlicher Text ist, sind Eudora-Archive heute meist wiederherstellbar. - Outlook Express verwendete unter Windows bis in die späten 1990er- und 2000er-Jahre
.dbx-Dateien (eine pro Ordner); sein Nachfolger Windows Mail / Live Mail wechselte zu einzelnen.eml-Dateien. - Netscape/Mozilla-Mail, Evolution, Claws Mail, Entourage und andere speicherten oder exportierten MBOX — genau deshalb bleibt MBOX so breit lesbar.
Im direkten Vergleich
| Format | Aufbau | Offen? | Portables Archiv? | Herkunft |
|---|---|---|---|---|
| MBOX | Eine Textdatei, viele Nachrichten | ✅ Offen | ✅ Hervorragend | Unix, 1970er |
| Maildir | Eine Datei pro Nachricht, in Ordnern | ✅ Offen | ✅ Gut | qmail, 1995 |
| EML | Eine Nachricht, rohes MIME | ✅ Offen | ✅ Hervorragend | Internet-RFCs |
| MSG | Eine Nachricht, OLE-Compound | ❌ Proprietär | ⚠️ Eingeschränkt | Microsoft |
| PST | Binäre Datenbank (Mail + PIM) | ❌ Proprietär | ⚠️ Erst konvertieren | Outlook (Win) |
| OST | Zwischengespeichertes Server-Postfach | ❌ Proprietär | ❌ Kontogebunden | Outlook/Exchange |
| OLM | Proprietäres Bündel | ❌ Proprietär | ⚠️ Erst konvertieren | Outlook (Mac) |
| NSF | Anwendungsdatenbank | ❌ Proprietär | ⚠️ Erst konvertieren | Lotus Notes |
Was man für die lange Sicht wählen sollte
Fürs Archivieren — Mail über Jahrzehnte lesbar zu halten — gewinnen die offenen, textbasierten Formate jedes Mal. MBOX und EML haben keinen Hersteller, keine Lizenz und keine Datenbank-Engine, die veralten könnte: In zwanzig Jahren sind sie immer noch Klartext, den jedes Werkzeug öffnen kann. Wenn Sie jemals ein Exportformat wählen dürfen, ist MBOX (oder ein Ordner voller EML-Dateien) deshalb die sichere Wahl, und genau deshalb macht die Konvertierung von PST/OLM nach MBOX ein Outlook-Archiv zukunftssicher.
Sobald Ihre Mail in MBOX oder EML vorliegt, öffnet sie Mbox Viewer auf Mac und Windows — jede Größe, schreibgeschützt, vollständig offline. Für die praktische Variante dieses Leitfadens („Welche Datei kann ich öffnen und wie?”) siehe MBOX, EML, PST, OLM: E-Mail-Archivformate erklärt; um eine Outlook-Datei in MBOX zu verwandeln, siehe wie man PST/OLM nach MBOX konvertiert.
Öffne dein Archiv mit Mbox Viewer
Native App für Mac und Windows. Streamt MBOX- und EML-Dateien jeder Größe, vollständig offline.