Przewodnik terenowy po formatach przechowywania poczty: historia, budowa i porównanie
Jak poczta jest naprawdę zapisywana na dysku — MBOX, Maildir, EML, PST, OST, OLM, MSG, NSF oraz formaty historyczne jak Eudora. Ich historia, sposób budowy, do czego się nadają i porównanie obok siebie.
David Carrero ·
Każdy program pocztowy musi odpowiedzieć na to samo pytanie: gdzie tak naprawdę trafiają wiadomości na dysku? Pół wieku odpowiedzi zaowocowało małym zoo formatów — jedne otwarte i pięknie proste, inne to zamknięte bazy danych, których nie odczytasz bez aplikacji, która je stworzyła. Oto przegląd tych, które napotkasz: jak są zbudowane, skąd się wzięły i jak wypadają w porównaniu.
Ogólnie dzielą się na trzy rodziny:
- Otwarte kontenery tekstowe — jeden plik mieści wiele wiadomości (MBOX) albo jeden plik na wiadomość w folderze (Maildir). Czytelne dla człowieka, niezależne od producenta.
- Jedna wiadomość na plik — pojedyncza wiadomość jako samodzielny plik (EML, MSG).
- Zamknięte bazy danych — binarny magazyn przechowujący pocztę wraz z kalendarzem, kontaktami i stanem (PST, OST, OLM, NSF). Kompaktowy wewnątrz swojej aplikacji, nieprzejrzysty poza nią.
Formaty otwarte, tekstowe
MBOX — lingua franca
MBOX sięga początków uniksowych systemów pocztowych z lat 70. Idea jest rozbrajająco prosta: połącz wszystkie wiadomości ze skrzynki w jeden plik tekstowy i zaznacz początek każdej z nich linią zaczynającą się od From (linia From_, ze spacją, nie nagłówek From:). Nagłówki, treść i załączniki — zakodowane jako tekst — wszystko mieści się w jednym miejscu.
Ta prostota kryje słynną pułapkę: co się stanie, gdy treść wiadomości sama zawiera linię zaczynającą się od „From ”? Różne odpowiedzi dały początek wariantom — mboxo, mboxrd, mboxcl i mboxcl2 — które różnie escapują (lub nie) tę sekwencję. W praktyce nowoczesne narzędzia odczytują je wszystkie. MBOX to format, do którego eksportują Google Takeout, Apple Mail, Thunderbird i większość klasycznych programów pocztowych, co czyni go najbliższym uniwersalnemu formatowi archiwum, jaki ma poczta.
Maildir — jeden plik na wiadomość
Stworzony dla serwera qmail w 1995 roku, Maildir przyjmuje odwrotne podejście: każda wiadomość to osobny plik wewnątrz folderu, rozłożony pomiędzy podkatalogi tmp/, new/ i cur/. Jego wielką zaletą jest bezpieczeństwo bez blokowania — dwa procesy mogą dostarczać pocztę jednocześnie, nie uszkadzając wspólnego pliku, co jest klasycznym ryzykiem przy MBOX. To natywny format serwerów takich jak Dovecot i Courier. Ceną są miliony drobnych plików, których niektóre systemy plików nie lubią.
EML — pojedyncza wiadomość w postaci zdefiniowanej przez internet
EML to jedna wiadomość zapisana dokładnie tak, jak podróżuje: surowa struktura MIME zdefiniowana przez internetowe standardy poczty (RFC 822 → 2822 → 5322). Nagłówki na górze, potem treść i załączniki zakodowane w częściach MIME. Ponieważ jest formatem przesyłanym w sieci, niemal wszystko potrafi go tworzyć i odczytywać — Outlook, Thunderbird, systemy ticketowe, skanery i serwery pocztowe. Folder plików .eml to najprostsze możliwe archiwum.
Zamknięte bazy danych
PST — osobisty magazyn Outlooka w Windows
PST (Personal Storage Table) to dyskowa baza danych Microsoft Outlook w systemie Windows, zbudowana na modelu MAPI. Mieści znacznie więcej niż pocztę — kalendarz, kontakty, zadania, notatki — w jednym pliku binarnym. Pierwotny ANSI PST (Outlook 97–2002) miał limit 2 GB i był podatny na uszkodzenia w pobliżu tego progu; Unicode PST (Outlook 2003+) podniósł go do 20–50 GB. Szybki i kompaktowy wewnątrz Outlooka, ale bezużyteczny dla innych aplikacji bez konwersji.
OST — bufor offline
OST (Offline Storage Table) to rodzeństwo PST: buforowana kopia skrzynki, która przechowywana jest na serwerze Exchange lub Microsoft 365. Istnieje po to, by Outlook działał offline i ponownie synchronizował się później. Co istotne, OST jest powiązany ze swoim kontem i profilem — nie jest przenośnym archiwum, a osierocone pliki OST bywa trudno w ogóle otworzyć.
OLM — Outlook dla Maca
OLM to format eksportu/archiwum Outlooka dla Maca. Ten sam zamysł co PST, inny kontener — zamknięty pakiet, który, podobnie jak PST, wymaga konwersji, zanim cokolwiek poza Outlookiem zdoła go odczytać.
MSG — pojedyncza wiadomość Outlooka
MSG to jedna wiadomość wyeksportowana z Outlooka, zapisana jako „compound file” OLE (mini-system plików wewnątrz pliku) niosący właściwości MAPI. To windowsowy odpowiednik EML, ale binarny i specyficzny dla Microsoftu.
NSF — Lotus Notes / HCL Domino
NSF (Notes Storage Facility) to baza danych stojąca za IBM/Lotus Notes (dziś HCL Domino) — cała platforma aplikacyjna, nie tylko poczta. Archiwa NSF wciąż pojawiają się w długo działających przedsiębiorstwach i, jak pozostałe tutaj, wymagają dedykowanych narzędzi do wyodrębnienia danych.
Formaty historyczne
- Eudora (1988–2006) była dominującym programem wczesnej ery internetu. Przechowywała pocztę w plikach skrzynek
.mbx— w istocie MBOX — w parze z indeksem-spisem treści.toc. Ponieważ treść jest tekstem podobnym do MBOX, archiwa Eudory zwykle dają się dziś odzyskać. - Outlook Express używał plików
.dbx(po jednym na folder) w systemie Windows przez późne lata 90. i 2000.; jego następca Windows Mail / Live Mail przeszedł na pojedyncze pliki.eml. - Poczta Netscape/Mozilla, Evolution, Claws Mail, Entourage i inne przechowywały lub eksportowały MBOX — i właśnie dlatego MBOX pozostaje tak powszechnie czytelny.
Obok siebie
| Format | Budowa | Otwarty? | Przenośne archiwum? | Pochodzenie |
|---|---|---|---|---|
| MBOX | Jeden plik tekstowy, wiele wiadomości | ✅ Otwarty | ✅ Doskonałe | Unix, lata 70. |
| Maildir | Jeden plik na wiadomość, w folderach | ✅ Otwarty | ✅ Dobre | qmail, 1995 |
| EML | Jedna wiadomość, surowy MIME | ✅ Otwarty | ✅ Doskonałe | Internetowe RFC |
| MSG | Jedna wiadomość, compound OLE | ❌ Zamknięty | ⚠️ Ograniczone | Microsoft |
| PST | Baza binarna (poczta + PIM) | ❌ Zamknięty | ⚠️ Najpierw konwersja | Outlook (Win) |
| OST | Buforowana skrzynka serwerowa | ❌ Zamknięty | ❌ Powiązane z kontem | Outlook/Exchange |
| OLM | Zamknięty pakiet | ❌ Zamknięty | ⚠️ Najpierw konwersja | Outlook (Mac) |
| NSF | Baza danych aplikacji | ❌ Zamknięty | ⚠️ Najpierw konwersja | Lotus Notes |
Co wybrać na długą metę
Do archiwizacji — utrzymywania poczty w stanie czytelnym przez dziesięciolecia — otwarte formaty tekstowe wygrywają za każdym razem. MBOX i EML nie mają producenta, licencji ani silnika bazy danych, który mógłby się zestarzeć: za dwadzieścia lat nadal będą zwykłym tekstem, który otworzy dowolne narzędzie. Dlatego, jeśli kiedykolwiek będziesz mieć możliwość wyboru formatu eksportu, MBOX (albo folder plików EML) jest bezpiecznym wyborem, i dlatego konwersja PST/OLM do MBOX zabezpiecza archiwum Outlooka na przyszłość.
Gdy Twoja poczta jest już w MBOX lub EML, Mbox Viewer otworzy ją na Macu i Windows — w dowolnym rozmiarze, tylko do odczytu, w pełni offline. Praktyczną wersję tego przewodnika, w wariancie „który plik mogę otworzyć i jak”, znajdziesz w artykule MBOX, EML, PST, OLM: formaty archiwów e-mail wyjaśnione; aby zamienić plik Outlooka w MBOX, zobacz jak przekonwertować PST/OLM do MBOX.
Otwórz swoje archiwum w Mbox Viewer
Natywna aplikacja na Maca i Windows. Strumieniuje pliki MBOX i EML dowolnej wielkości, w pełni offline.