Parola codificata (RFC 2047)
RFC 2047Uno schema di codifica definito nell'RFC 2047 ("Encoded-Word") che consente caratteri non ASCII nei campi di intestazione delle e-mail come Subject e From, codificandoli come token =?charset?codifica?testo?=.
Le intestazioni delle e-mail devono contenere solo caratteri ASCII a 7 bit secondo l'RFC 5322. RFC 2047 fornisce una soluzione alternativa: il testo non ASCII nelle intestazioni è rappresentato come una "parola codificata" nella forma =?charset?B?...?= (Base64) o =?charset?Q?...?= (quoted-printable). Ad esempio, un oggetto in giapponese potrebbe apparire nel messaggio raw come =?ISO-2022-JP?B?...?= e deve essere decodificato prima di poter essere visualizzato.
Senza la decodifica RFC 2047, le righe dell'oggetto e i nomi dei mittenti contenenti caratteri accentati, caratteri CJK, arabo o qualsiasi altro script non ASCII appaiono come stringhe codificate raw — completamente illeggibili per l'utente finale. Un'implementazione corretta richiede il rilevamento dei token encoded-word ovunque possano apparire legalmente in un valore di intestazione e la decodifica di ciascuno usando il charset e la codifica specificati.
Mbox Viewer decodifica le parole codificate RFC 2047 in tutti i campi di intestazione quando costruisce il suo elenco di messaggi e l'indice di ricerca. Ciò significa che la ricerca di un nome scritto nella sua scrittura originale — ad esempio, il nome di un mittente giapponese — corrisponderà correttamente anche se il file MBOX sottostante memorizza il nome in forma codificata.
Termini correlati
La codifica dei caratteri che specifica come i byte di una parte di testo vengono mappati in caratteri leggibili. I charset comuni includono UTF-8, ISO-8859-1 e Shift_JIS; una mancata corrispondenza causa testo distorto noto come mojibake.
Il blocco di metadati strutturati all'inizio di un messaggio e-mail, contenente campi come From, To, Subject, Date e numerosi campi tecnici che descrivono come il messaggio è stato composto, instradato e codificato.