Indeks binarny
Kompaktowy plik indeksu, który Mbox Viewer zapisuje obok archiwum MBOX po pierwszym parsowaniu, przechowujący przesunięcia bajtów wiadomości i metadane umożliwiające niemal natychmiastowe ponowne otwarcia bez ponownego skanowania całego pliku.
Po pierwszym otwarciu i przejściu strumieniowym przez plik MBOX przez Mbox Viewer, zapisuje on mały binarny plik indeksu w tej samej lokalizacji. Ten indeks rejestruje przesunięcie bajtów i długość każdej wiadomości w MBOX, wraz z kluczowymi metadanymi nagłówkowymi, takimi jak data, nadawca i temat. Przy wszystkich kolejnych otwarciach, aplikacja ładuje indeks zamiast ponownie skanować plik, skracając czas otwierania z minut (dla bardzo dużych archiwów) do poniżej sekundy.
Aby upewnić się, że indeks pozostaje ważny, Mbox Viewer przechowuje hash SHA-256 pliku MBOX (lub jego części wystarczającej do wykrycia zmian) w indeksie. Gdy aplikacja otwiera plik MBOX, weryfikuje, czy hash pasuje przed zaufaniem indeksowi. Jeśli MBOX został zmodyfikowany — na przykład dlatego, że nowy eksport zastąpił stary plik — indeks jest odrzucany i plik jest ponownie parsowany.
Indeks binarny jest optymalizacją wydajności, która jest całkowicie transparentna dla użytkownika. Nigdy nie modyfikuje samego pliku MBOX; tworzy tylko plik towarzyszący. Jest to zgodne z projektem Mbox Viewer opartym na zasadzie tylko do odczytu: Twoje archiwum poczty nigdy nie jest zmieniane, tylko odczytywane.
Powiązane pojęcia
Technika parsowania, która odczytuje plik przyrostowo w małych fragmentach zamiast ładować cały plik do pamięci naraz, umożliwiając narzędziom otwieranie i indeksowanie bardzo dużych plików MBOX — dziesiątek lub setek gigabajtów — przy niskim zużyciu pamięci.
Format pliku tekstowego przechowujący wiele wiadomości e-mail połączonych w jeden plik, z każdą wiadomością poprzedzoną linią separatora "From ". Jest to format generowany przez Google Takeout podczas eksportu archiwum Gmail.