Encoded-word (RFC 2047)
RFC 2047Un schéma d'encodage défini dans la RFC 2047 (« Encoded-Word ») qui permet les caractères non ASCII dans les champs d'en-tête de courriel tels que Subject et From, en les encodant sous forme de tokens =?charset?encodage?texte?=.
Les en-têtes de courrier électronique sont requis par la RFC 5322 pour ne contenir que des caractères ASCII 7 bits. La RFC 2047 fournit une solution de contournement : le texte non ASCII dans les en-têtes est représenté sous la forme d'un « mot encodé » de la forme =?charset?B?...?= (Base64) ou =?charset?Q?...?= (quoted-printable). Par exemple, un objet en japonais peut apparaître dans le message brut sous la forme =?ISO-2022-JP?B?...?= et doit être décodé avant de pouvoir être affiché.
Sans décodage RFC 2047, les lignes d'objet et les noms d'expéditeurs contenant des caractères accentués, des caractères CJK, de l'arabe ou tout autre script non ASCII apparaissent sous forme de chaînes encodées brutes — complètement illisibles pour l'utilisateur final. Une implémentation correcte nécessite la détection des tokens de mots encodés partout où ils peuvent légalement apparaître dans une valeur d'en-tête et le décodage de chacun en utilisant le jeu de caractères et l'encodage spécifiés.
Mbox Viewer décode les mots encodés RFC 2047 dans tous les champs d'en-tête lors de la construction de sa liste de messages et de son index de recherche. Cela signifie que la recherche d'un nom écrit dans son script original — par exemple, un nom d'expéditeur en japonais — trouvera correctement une correspondance même si le fichier MBOX sous-jacent stocke le nom sous forme encodée.
Termes liés
L'encodage de caractères qui spécifie comment les octets d'une partie texte sont mappés sur des caractères lisibles. Les jeux de caractères courants incluent UTF-8, ISO-8859-1 et Shift_JIS ; une incompatibilité provoque du texte illisible connu sous le nom de mojibake.
Le bloc de métadonnées structurées au début d'un message électronique, contenant des champs tels que From, To, Subject, Date et de nombreux champs techniques décrivant la façon dont le message a été composé, acheminé et encodé.