Mojibake

Mojibake

Mojibake est un emprunt lexical du japonais qui signifie que les caractères affichés à l'écran d'un logiciel informatique ne s'affichent pas correctement, à cause d'un problème de codage. Ce concept est similaire au concept de krakozyabry (кракозя́бры).

Étymologie

Le mot japonais 文字化け (mojibake) est composé de 文字 (moji), qui signifie caractère et 化け (bake), provenant du verbe 化ける (bakeru), qui signifie apparaître de manière déguisée, prendre la forme de, changer pour le pire. Littéralement, mojibake signifie donc « changement de caractère ».

Causes

Le phénomène de mojibake a lieu lorsque le codage des caractères utilisé pour enregistrer un texte est différent de celui utilisé pour l'afficher. Dans le cas d'une page web, le codage utilisé peut être spécifié explicitement soit par le biais d'une balise HTML soit par le biais d'un en-tête HTTP, de sorte que le navigateur est capable d'afficher le texte avec le codage dans lequel il a été écrit. Cependant, si cette information est erronée ou absente, ce ne seront pas les bons caractères qui s'afficheront. Par exemple, si le mot « 文字化け » est codé en UTF-8 mais décodé comme de l'ISO 8859-1, le navigateur affichera les caractères bizarres « æ–‡å­—化け ». Quand le codage n'est pas spécifié explicitement, la plupart des navigateurs modernes utilisent des heuristiques pour tenter de déterminer le codage du texte dans le cas où l'option « détection automatique de l'encodage » est sélectionnée et utilisent le codage par défaut dans le cas contraire.

Le mojibake est un phénomène particulièrement répandu en japonais (ce qui explique la nécessité de créer un mot pour le nommer) car il existe plusieurs codages possibles pour écrire le japonais : ISO 2022, Shift-JIS, EUC-JP, UTF-8… Or, selon le système d'exploitation, le codage par défaut n'est pas le même. Par conséquent, si l'information concernant le codage d'une page est absente, le codage par défaut utilisé pour afficher la page ne sera pas le même. Il en résulte que la page sera mojibake si elle n'est pas affichée sur le même système d'exploitation que celui avec lequel elle a été écrite.

Le problème du mojibake ne se limite cependant pas aux seules pages web. Sous Windows, certaines applications sont dites « Unicode » (application tournant quelle que soit la langue de Windows) et d'autres sont localisées. Si une application japonaise n'est pas Unicode, un utilisateur d'une version française de Windows devra passer le système d'exploitation complet en mode japonais afin de pouvoir la voir correctement. Les applications japonaises deviendront alors lisibles mais les applications françaises non Unicode deviendront à leur tour mojibake.


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Mojibake de Wikipédia en français (auteurs)

Игры ⚽ Поможем решить контрольную работу

Regardez d'autres dictionnaires:

  • Mojibake — (文字化け, moji carácter + bake fantasma) es una palabra procedente del japonés para referirse a los caracteres ininteligibles: basura que se aparece cuando se intentan visualizar conjuntos de caracteres internacionales mediante programas que no… …   Enciclopedia Universal

  • Mojibake — The UTF 8 encoded Japanese Wikipedia article for mojibake, as displayed in the Windows 1252 encoding. Mojibake (文字化け …   Wikipedia

  • Mojibake — Mit Mojibake (jap. 文字化け, zu Deutsch auch Zeichensalat) wird u. a. im Japanischen der Zustand falsch dargestellter Zeichen bezeichnet, der anstelle der gewünschten Schriftzeichen vor allem im Internet auftaucht. Der Begriff stammt aus dem… …   Deutsch Wikipedia

  • Mojibake — Artículo Mojibake en la Wikipedia japonesa utilizando la codificación de Windows 1252. Mojibake (文字化け, Mojibake …   Wikipedia Español

  • mojibake — noun /modʑibake/ corrupt characters or letters, especially from display or transfer through an inappropriate character set, e.g., •¶Žš‰»‚¯, which is a corruption of 文字化け …   Wiktionary

  • Krakozyabri — Mit Mojibake (jap. 文字化け, zu Deutsch auch Zeichensalat) wird u. a. im Japanischen der Zustand falsch dargestellter Zeichen bezeichnet, der anstelle der gewünschten Schriftzeichen vor allem im Internet auftaucht. Der Begriff stammt aus dem… …   Deutsch Wikipedia

  • Zeichensalat — Mit Mojibake (jap. 文字化け, zu Deutsch auch Zeichensalat) wird u. a. im Japanischen der Zustand falsch dargestellter Zeichen bezeichnet, der anstelle der gewünschten Schriftzeichen vor allem im Internet auftaucht. Der Begriff stammt aus dem… …   Deutsch Wikipedia

  • AppLocale — is a tool for Windows XP and Windows Server 2003 by Microsoft. It is a launcher application that makes it possible to run non Unicode (code page based) applications in a locale of the user s choice. Since changing the locale normally requires a… …   Wikipedia

  • Character encoding — Special characters redirects here. For the Wikipedia editor s handbook page, see Help:Special characters. A character encoding system consists of a code that pairs each character from a given repertoire with something else, such as a sequence of… …   Wikipedia

  • ID3 — is a metadata container most often used in conjunction with the MP3 audio file format. It allows information such as the title, artist, album, track number, or other information about the file to be stored in the file itself.There are two… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”