Skip to content
Mbox Viewer

Juego de caracteres

Codificación de caracteres que especifica cómo se mapean los bytes de una parte de texto a caracteres legibles. Los juegos de caracteres habituales incluyen UTF-8, ISO-8859-1 y Shift_JIS; una discordancia provoca texto ilegible conocido como mojibake.

Cada parte de texto de un correo tiene una codificación de caracteres: una regla que asigna valores de byte a caracteres. El juego de caracteres se declara en la cabecera Content-Type, por ejemplo: Content-Type: text/plain; charset="UTF-8". UTF-8 es la codificación dominante hoy en día porque puede representar cualquier carácter de Unicode, pero los mensajes más antiguos pueden usar codificaciones regionales como ISO-8859-1 (Europa Occidental), ISO-2022-JP (japonés), GB2312 (chino simplificado) o Windows-1252.

Cuando un correo se muestra con el juego de caracteres incorrecto, los caracteres fuera del rango ASCII básico se renderizan como símbolos sin sentido, fenómeno conocido como mojibake (del japonés, algo así como «transformación de caracteres»). Esto ocurre cuando un mensaje declara un juego de caracteres pero el lector usa otro, o cuando no se declara ninguno y el lector adivina incorrectamente.

Mbox Viewer detecta la declaración del juego de caracteres en las cabeceras MIME y aplica el decodificador correcto para cada parte del mensaje. Para los mensajes que omiten la declaración de juego de caracteres, la aplicación aplica detección heurística para identificar la codificación a partir de los patrones de bytes, reduciendo el mojibake en archivos que contienen correo de clientes antiguos o no estándar.

Términos relacionados

Lee tus archivos MBOX en tu Mac