Glossar
E-Mail- & MBOX-Glossar
Wichtige Begriffe rund um E-Mail-Archive, Formate, Protokolle und den Aufbau einer Nachricht — jeder Begriff mit eigener Seite, in verständlicher Sprache erklärt.
Dateiformate
Ein Klartextdateiformat, das mehrere E-Mail-Nachrichten hintereinander speichert, wobei jede Nachricht mit einer "From "-Trennzeile beginnt. Es ist das Format, das Google Takeout beim Export eines Gmail-Archivs erzeugt.
Eine Einzelnachrichten-Datei im MIME-Format, die Kopfzeilen, Nachrichtentext und Anhänge enthält. EML-Dateien werden von den meisten E-Mail-Clients unterstützt und eignen sich gut zum Archivieren oder Weitergeben einzelner Nachrichten.
Microsofts proprietäres Binärformat für eine einzelne E-Mail-Nachricht, das Kopfzeilen, Nachrichtentext und Anhänge in einer Compound-Document-Struktur speichert. Anders als EML ist MSG kein offener Klartextstandard.
Personal Storage Table – Microsofts Container-Datei für ein gesamtes Postfach, einschließlich Ordner, Nachrichten, Kontakte und Kalendereinträge. Auch als OST bekannt, wenn sie für die Offline-Synchronisation mit Exchange oder Microsoft 365 verwendet wird.
Ein Postfachformat, das jede E-Mail-Nachricht als separate Datei innerhalb einer Verzeichnishierarchie speichert, anstatt alle Nachrichten wie MBOX in einer einzigen Datei zu verketten.
Protokolle & Dienste
Internet Message Access Protocol – das Standardprotokoll für den Zugriff auf E-Mails, die auf einem Server gespeichert sind. Es hält Nachrichten über mehrere Geräte hinweg synchronisiert, ohne sie herunterzuladen und zu löschen.
Post Office Protocol 3 – ein älteres E-Mail-Abrufprotokoll, das Nachrichten vom Server auf ein lokales Gerät herunterlädt und sie dabei in der Regel vom Server löscht.
Simple Mail Transfer Protocol – das Standardprotokoll zum Senden und Weiterleiten von E-Mail-Nachrichten zwischen Mailservern. Es wird ausschließlich für ausgehende E-Mails verwendet; zum Lesen von E-Mails werden IMAP oder POP3 benötigt.
Googles offizieller Dienst zum Exportieren persönlicher Daten, einschließlich Gmail. Für E-Mails erzeugt er eine oder mehrere MBOX-Dateien, die alle Nachrichten samt Gmail-Labels enthalten.
Gmails Tagging-System, das jeder Nachricht einen oder mehrere Labels zuweist und damit die Rolle übernimmt, die Ordner in herkömmlichen E-Mail-Clients spielen. Eine einzelne Nachricht kann gleichzeitig mehrere Labels tragen.
Nachrichtenstruktur
Der strukturierte Metadatenblock am Anfang einer E-Mail-Nachricht, der Felder wie From, To, Subject, Date und zahlreiche technische Felder enthält, die beschreiben, wie die Nachricht verfasst, weitergeleitet und kodiert wurde.
Multipurpose Internet Mail Extensions – der Standard, der definiert, wie E-Mail-Nachrichten Nicht-ASCII-Text, HTML-Texte, Anhänge und andere binäre Inhalte innerhalb der Klartextstruktur von E-Mails kodieren.
Eine MIME-Nachrichtenstruktur, die mehrere Inhaltsteile – wie Klartext, HTML und Anhänge – in einer einzigen Nachricht kombiniert, wobei jeder Teil durch eine eindeutige Boundary-Zeichenkette getrennt wird.
Eine global eindeutige Kennung, die jeder E-Mail-Nachricht zugewiesen wird und im Message-ID-Header angegeben ist. Sie wird verwendet, um Nachrichten zu verfolgen, Konversations-Threads aufzubauen und Duplikate beim Zusammenführen von Archiven zu erkennen.
E-Mail-Kopfzeilen (In-Reply-To und References), die eine Antwort mit der Nachricht verknüpfen, auf die sie antwortet. Sie ermöglichen es Mail-Clients und Archivwerkzeugen, zusammengehörige Nachrichten zu Konversations-Threads zu gruppieren.
Die Zustellungsmetadaten, die SMTP-Server zum Weiterleiten einer E-Mail-Nachricht verwenden – insbesondere der Umschlag-Absender (MAIL FROM) und die Umschlag-Empfänger (RCPT TO) –, die sich von den sichtbaren From- und To-Kopfzeilen unterscheiden können.
Eine Datei – wie ein PDF, ein Bild oder eine Tabelle –, die in einer E-Mail-Nachricht eingebettet und als MIME-Teil kodiert ist, getrennt vom Nachrichtentext, damit der Empfänger sie speichern oder öffnen kann.
Ein Bild, das über einen Content-ID-Verweis (cid:) direkt in den HTML-Text einer E-Mail eingebettet wird, anstatt als separate herunterladbare Datei angehängt zu sein. Die Bilddaten sind als MIME-Teil in derselben Nachricht gespeichert.
Kodierung & Zeichensätze
Die Zeichenkodierung, die festlegt, wie Bytes in einem Textteil auf lesbare Zeichen abgebildet werden. Gängige Zeichensätze sind UTF-8, ISO-8859-1 und Shift_JIS; ein Missmatch verursacht unlesbaren Text, der als Mojibake bekannt ist.
Ein Binär-zu-Text-Kodierungsverfahren, das beliebige Binärdaten mit nur 64 druckbaren ASCII-Zeichen darstellt und in E-Mails weit verbreitet ist, um Anhänge und binäre Inhalte sicher zu übertragen.
Eine MIME-Übertragungskodierung, die Text mit überwiegend ASCII-Zeichen darstellt und Nicht-ASCII-Bytes als =XX-Hexadezimalsequenzen escaped. Sie hält den Großteil des Textes im Rohquelltext lesbar.
Ein in RFC 2047 definiertes Kodierungsverfahren ("Encoded-Word"), das Nicht-ASCII-Zeichen in E-Mail-Kopfzeilenfeldern wie Subject und From ermöglicht, indem sie als =?charset?kodierung?text?=-Token kodiert werden.
Konzepte & Funktionen
Der Prozess, zusammengehörige E-Mail-Nachrichten zu Konversationen zu gruppieren, indem In-Reply-To- und References-Kopfzeilenverknüpfungen verfolgt werden, typischerweise mit dem JWZ-Algorithmus, der bis zu vier Verschachtelungsebenen unterstützt.
Der Prozess des Erkennens und Entfernens doppelter E-Mail-Nachrichten aus einem Archiv, typischerweise durch Vergleich von Message-ID-Werten, um Redundanz beim Zusammenführen mehrerer MBOX-Dateien zu vermeiden.
Eine Analysetechnik, die eine Datei inkrementell in kleinen Blöcken liest, anstatt die gesamte Datei auf einmal in den Speicher zu laden. Sie ermöglicht es Werkzeugen, sehr große MBOX-Dateien – Dutzende oder Hunderte von Gigabyte – mit geringem Speicherverbrauch zu öffnen und zu indizieren.
Eine kompakte Indexdatei, die Mbox Viewer nach dem ersten Analysieren neben einem MBOX-Archiv schreibt. Sie speichert Nachrichten-Byte-Offsets und Metadaten, um nahezu sofortige Neuöffnungen zu ermöglichen, ohne die gesamte Datei erneut zu scannen.
Eine E-Mail-Nachricht, deren Text mit HTML und CSS formatiert ist und dadurch reichhaltige Typografie, Layout, Farben und Bilder ermöglicht. Die meisten modernen E-Mails sind HTML, aber Datenschutz- und Sicherheitsaspekte erfordern ein sorgfältiges Rendering.
Ein macOS-Anwendungspaket, das nativen kompilierten Code sowohl für Apple Silicon (ARM64) als auch für Intel (x86_64)-Architekturen enthält und auf beiden Prozessoren ohne Emulation nativ läuft.
App Sandbox ist eine macOS-Sicherheitsfunktion, die den Zugriff einer Anwendung auf Systemressourcen, Dateien und Netzwerkverbindungen einschränkt und so den möglichen Schaden bei einer Sicherheitslücke in der App oder ihren Abhängigkeiten begrenzt.