Glosario
Glosario de correo y MBOX
Términos clave de los archivos de correo, formatos, protocolos y la estructura de un email — cada uno con su propia página explicada en lenguaje claro.
Formatos de archivo
Formato de archivo de texto plano que almacena múltiples mensajes de correo concatenados, cada uno precedido por una línea separadora «From ». Es el formato que produce Google Takeout al exportar tu archivo de Gmail.
Archivo de mensaje único en formato MIME que contiene cabeceras, cuerpo y adjuntos. Los archivos EML son ampliamente compatibles con los clientes de correo y resultan útiles para archivar o compartir mensajes individuales.
Formato binario propietario de Microsoft Outlook para un único mensaje de correo, que almacena cabeceras, cuerpo y adjuntos en una estructura de documento compuesto. A diferencia del EML, MSG no es un estándar de texto plano.
Personal Storage Table — archivo contenedor de Microsoft Outlook para todo un buzón, incluyendo carpetas, mensajes, contactos y elementos de calendario. También se conoce como OST cuando se usa para sincronización sin conexión con Exchange o Microsoft 365.
Formato de buzón que almacena cada mensaje de correo como un archivo independiente dentro de una jerarquía de directorios, en lugar de concatenar todos los mensajes en un único archivo como hace MBOX.
Protocolos y servicios
Internet Message Access Protocol — protocolo estándar para acceder al correo almacenado en un servidor, manteniendo los mensajes sincronizados entre múltiples dispositivos sin descargarlos ni eliminarlos.
Post Office Protocol 3 — protocolo de recuperación de correo más antiguo que descarga los mensajes del servidor a un dispositivo local, eliminándolos del servidor por defecto.
Simple Mail Transfer Protocol — protocolo estándar utilizado para enviar y retransmitir mensajes de correo entre servidores. Se usa solo para el correo saliente; para leer el correo se requiere IMAP o POP3.
Servicio oficial de Google para exportar tus datos personales, incluido Gmail. Para el correo, produce uno o varios archivos MBOX que contienen todos tus mensajes y sus etiquetas de Gmail.
Sistema de etiquetado de Gmail que asigna una o varias etiquetas a cada mensaje, cumpliendo la función que las carpetas desempeñan en los clientes de correo tradicionales. Un único mensaje puede llevar varias etiquetas simultáneamente.
Estructura del mensaje
Bloque de metadatos estructurado al inicio de un mensaje de correo, que contiene campos como From, To, Subject, Date y numerosos campos técnicos que describen cómo se compuso, enrutó y codificó el mensaje.
Multipurpose Internet Mail Extensions — estándar que define cómo los mensajes de correo codifican texto no ASCII, cuerpos HTML, adjuntos y otro contenido binario dentro de la estructura de texto plano del correo.
Estructura de mensaje MIME que combina múltiples partes de contenido —como texto plano, HTML y adjuntos— en un único mensaje, separadas por una cadena de límite única.
Identificador globalmente único asignado a cada mensaje de correo, especificado en la cabecera Message-ID. Se usa para rastrear mensajes, construir hilos de conversación y detectar duplicados al fusionar archivos.
Cabeceras de correo (In-Reply-To y References) que enlazan una respuesta con el mensaje al que responde, permitiendo a los clientes de correo y herramientas de archivo agrupar los mensajes relacionados en hilos de conversación.
Metadatos de entrega utilizados por los servidores SMTP para enrutar un mensaje de correo — concretamente el remitente del sobre (MAIL FROM) y los destinatarios del sobre (RCPT TO) — que pueden diferir de las cabeceras visibles From y To.
Archivo —como un PDF, una imagen o una hoja de cálculo— incrustado en un mensaje de correo y codificado como parte MIME, separado del cuerpo del mensaje, destinado a que el destinatario lo guarde o abra.
Imagen integrada directamente en el cuerpo de un correo HTML mediante una referencia Content-ID (cid:), en lugar de adjuntarse como archivo descargable independiente. Los datos de la imagen se almacenan como parte MIME dentro del mismo mensaje.
Codificación y juegos de caracteres
Codificación de caracteres que especifica cómo se mapean los bytes de una parte de texto a caracteres legibles. Los juegos de caracteres habituales incluyen UTF-8, ISO-8859-1 y Shift_JIS; una discordancia provoca texto ilegible conocido como mojibake.
Esquema de codificación de binario a texto que representa datos binarios arbitrarios usando solo 64 caracteres ASCII imprimibles, ampliamente usado en correo para transmitir de forma segura adjuntos y contenido binario.
Codificación de transferencia MIME que representa texto compuesto principalmente por caracteres ASCII, escapando los bytes no ASCII como secuencias hexadecimales =XX. Mantiene la mayor parte del texto legible en el código fuente del mensaje.
Esquema de codificación definido en el RFC 2047 («Encoded-Word») que permite caracteres no ASCII en campos de cabecera de correo como Subject y From, codificándolos como tokens =?juego-de-caracteres?codificación?texto?=.
Conceptos y funciones
Proceso de agrupar mensajes de correo relacionados en conversaciones siguiendo los enlaces de las cabeceras In-Reply-To y References, usando típicamente el algoritmo JWZ que admite hasta cuatro niveles de anidamiento.
Proceso de detección y eliminación de mensajes de correo duplicados en un archivo, típicamente comparando los valores de Message-ID, para evitar redundancias al fusionar varios archivos MBOX.
Técnica de análisis que lee un archivo de forma incremental en pequeños fragmentos en lugar de cargar todo el archivo en memoria de una vez, permitiendo a las herramientas abrir e indexar archivos MBOX muy grandes —decenas o cientos de gigabytes— con un uso reducido de memoria.
Archivo de índice compacto que Mbox Viewer escribe junto al archivo MBOX tras el primer análisis, almacenando desplazamientos de bytes de los mensajes y metadatos para permitir reaperturas casi instantáneas sin volver a escanear el archivo completo.
Mensaje de correo cuyo cuerpo está formateado con HTML y CSS, lo que permite tipografía enriquecida, maquetación, colores e imágenes. La mayor parte del correo moderno es HTML, pero su renderizado requiere atención a consideraciones de privacidad y seguridad.
Paquete de aplicación de macOS que contiene código compilado nativo tanto para Apple Silicon (ARM64) como para Intel (x86_64), ejecutándose de forma nativa en cualquiera de los dos procesadores sin emulación.
App Sandbox es una función de seguridad de macOS que restringe el acceso de una aplicación a recursos del sistema, archivos y conexiones de red, limitando el impacto potencial en caso de que la aplicación o sus dependencias tengan una vulnerabilidad.