Guía de campo de los formatos de almacenamiento de correo: historia, anatomía y comparación
Cómo se guarda realmente el correo en el disco — MBOX, Maildir, EML, PST, OST, OLM, MSG, NSF y formatos históricos como Eudora. Su historia, cómo están construidos, para qué sirve cada uno y una comparación lado a lado.
David Carrero ·
Todo programa de correo tiene que responder a la misma pregunta: ¿dónde acaban realmente los mensajes en el disco? Medio siglo de respuestas ha producido un pequeño zoo de formatos — algunos abiertos y de una simplicidad preciosa, otros bases de datos propietarias que no puedes leer sin la aplicación que las creó. Este es un recorrido por los que te vas a encontrar: cómo están construidos, de dónde vienen y cómo se comparan entre sí.
A grandes rasgos, se agrupan en tres familias:
- Contenedores abiertos, basados en texto — un archivo guarda muchos mensajes (MBOX), o un archivo por mensaje dentro de una carpeta (Maildir). Legibles por humanos, neutrales respecto al fabricante.
- Un mensaje por archivo — un único mensaje como archivo independiente (EML, MSG).
- Bases de datos propietarias — un almacén binario que guarda el correo más calendario, contactos y estado (PST, OST, OLM, NSF). Compactas dentro de su aplicación, opacas fuera de ella.
Los formatos abiertos basados en texto
MBOX — la lingua franca
MBOX se remonta a los primeros sistemas de correo de Unix, en los años setenta. La idea es desarmantemente simple: concatenar todos los mensajes de un buzón en un único archivo de texto plano, y marcar dónde empieza cada uno con una línea que comienza por From (la «línea From_», con un espacio, no la cabecera From:). Cabeceras, cuerpo y adjuntos — codificados como texto — conviven todos en línea.
Esa simplicidad esconde una arruga famosa: ¿qué pasa cuando el cuerpo de un mensaje contiene a su vez una línea que empieza por «From »? Las distintas respuestas dieron lugar a variantes — mboxo, mboxrd, mboxcl y mboxcl2 — que escapan (o no) esa secuencia de forma diferente. En la práctica, las herramientas modernas las leen todas. MBOX es lo que exportan Google Takeout, Apple Mail, Thunderbird y la mayoría de clientes clásicos, lo que lo convierte en lo más parecido que tiene el correo a un formato de archivo universal.
Maildir — un archivo por mensaje
Creado para el servidor qmail en 1995, Maildir adopta el enfoque opuesto: cada mensaje es su propio archivo dentro de una carpeta, repartido en los subdirectorios tmp/, new/ y cur/. Su gran virtud es la seguridad sin bloqueos — dos procesos pueden entregar correo al mismo tiempo sin corromper un archivo compartido, el riesgo clásico de MBOX. Es el formato nativo de servidores como Dovecot y Courier. La contrapartida son millones de archivos diminutos, que a algunos sistemas de archivos no les gustan.
EML — un único mensaje, tal como lo define internet
EML es un mensaje guardado exactamente como viaja: la estructura MIME cruda que definen los RFC del correo (822 → 2822 → 5322). Cabeceras arriba, luego el cuerpo y los adjuntos codificados en partes MIME. Como es el formato que circula por la red, casi todo puede producirlo y leerlo — Outlook, Thunderbird, sistemas de tickets, escáneres y servidores de correo. Una carpeta de archivos .eml es el archivo más sencillo posible.
Las bases de datos propietarias
PST — el almacén personal de Outlook en Windows
PST (Personal Storage Table) es la base de datos en disco de Microsoft Outlook en Windows, construida sobre el modelo MAPI. Guarda mucho más que correo — calendario, contactos, tareas, notas — en un único archivo binario. El PST original ANSI (Outlook 97–2002) tenía un tope de 2 GB y era propenso a corromperse cerca de ese límite; el PST Unicode (Outlook 2003+) lo subió a 20–50 GB. Rápido y compacto dentro de Outlook, pero inútil para otras aplicaciones sin conversión.
OST — la caché sin conexión
OST (Offline Storage Table) es el hermano del PST: una copia en caché de un buzón que reside en un servidor Exchange o Microsoft 365. Existe para que Outlook funcione sin conexión y vuelva a sincronizar después. Lo crucial es que un OST está ligado a su cuenta y a su perfil — no es un archivo portátil, y los archivos OST huérfanos pueden ser difíciles de abrir siquiera.
OLM — Outlook para Mac
OLM es el formato de exportación/archivo de Outlook para Mac. La misma intención que el PST, distinto contenedor — un paquete propietario que, como el PST, necesita convertirse antes de que algo que no sea Outlook pueda leerlo.
MSG — un único mensaje de Outlook
MSG es un mensaje exportado desde Outlook, almacenado como un «archivo compuesto» OLE (un mini sistema de archivos dentro de un archivo) que transporta propiedades MAPI. Es el equivalente en Windows del EML, pero binario y específico de Microsoft.
NSF — Lotus Notes / HCL Domino
NSF (Notes Storage Facility) es la base de datos que hay detrás de IBM/Lotus Notes (hoy HCL Domino) — toda una plataforma de aplicaciones, no solo correo. Los archivos NSF todavía aparecen en empresas de largo recorrido y, como los demás de esta lista, requieren herramientas dedicadas para extraer su contenido.
Los históricos
- Eudora (1988–2006) fue el cliente dominante de la primera era de internet. Guardaba el correo en archivos de buzón
.mbx— esencialmente MBOX — acompañados de un índice de tabla de contenidos.toc. Como el cuerpo es texto al estilo MBOX, los archivos de Eudora suelen ser recuperables hoy. - Outlook Express usaba archivos
.dbx(uno por carpeta) en Windows durante finales de los noventa y los dos mil; su sucesor Windows Mail / Live Mail pasó a archivos.emlindividuales. - El correo de Netscape/Mozilla, Evolution, Claws Mail, Entourage y otros guardaba o exportaba MBOX — que es precisamente la razón por la que MBOX sigue siendo tan legible por todas partes.
Lado a lado
| Formato | Estructura | ¿Abierto? | ¿Archivo portátil? | Origen |
|---|---|---|---|---|
| MBOX | Un archivo de texto, muchos mensajes | ✅ Abierto | ✅ Excelente | Unix, años 70 |
| Maildir | Un archivo por mensaje, en carpetas | ✅ Abierto | ✅ Bueno | qmail, 1995 |
| EML | Un mensaje, MIME crudo | ✅ Abierto | ✅ Excelente | RFC de internet |
| MSG | Un mensaje, compuesto OLE | ❌ Propietario | ⚠️ Limitado | Microsoft |
| PST | Base de datos binaria (correo + PIM) | ❌ Propietario | ⚠️ Convertir antes | Outlook (Win) |
| OST | Buzón de servidor en caché | ❌ Propietario | ❌ Ligado a la cuenta | Outlook/Exchange |
| OLM | Paquete propietario | ❌ Propietario | ⚠️ Convertir antes | Outlook (Mac) |
| NSF | Base de datos de aplicación | ❌ Propietario | ⚠️ Convertir antes | Lotus Notes |
Qué elegir para el largo plazo
Para archivar — mantener el correo legible durante décadas — los formatos abiertos basados en texto ganan siempre. MBOX y EML no tienen fabricante, ni licencia, ni motor de base de datos que pueda quedar obsoleto: dentro de veinte años seguirán siendo texto plano que cualquier herramienta podrá abrir. Por eso, si alguna vez puedes elegir el formato de exportación, MBOX (o una carpeta de archivos EML) es la opción segura, y por eso convertir PST/OLM a MBOX hace que un archivo de Outlook esté a prueba de futuro.
Una vez que tu correo está en MBOX o EML, Mbox Viewer lo abre en Mac y Windows — cualquier tamaño, solo lectura, totalmente offline. Para la versión práctica de «qué archivo puedo abrir y cómo» de esta guía, consulta MBOX, EML, PST, OLM: los formatos de archivo de correo, explicados; para convertir un archivo de Outlook a MBOX, consulta cómo convertir PST/OLM a MBOX.
Abre tu archivo con Mbox Viewer
App nativa para Mac y Windows. Lee archivos MBOX y EML de cualquier tamaño, sin conexión.