ISO 2022


ISO 2022

ISO 2022

ISO 2022, ou plus formellement ISO/CEI 2022 (ICS n° 35.040), est une norme ISO spécifiant une technique pour inclure de multiples jeux de caractères dans un seul codage de caractères. À la différence du codage de caractères ISO 8859 qui utilise 8 bits pour tous les caractères, les codages ISO 2022 sont de tailles variables en utilisant typiquement 8 ou 16 bits par caractère. Un grand nombre de codages de caractères utilisent les mécanismes spécifiés dans l'ISO 2022. Par exemple, l'ISO-2022-JP est largement utilisé comme codage de caractères pour le japonais.

Sommaire

Introduction

Beaucoup de langues ou de famille de langues ne sont pas basées sur l'alphabet latin telles que le grec, russe, l'arabe, ou l'hébreu, qui historiquement étaient représentées sur les ordinateurs avec un jeu de caractères ASCII étendu de 8 bit et incluant la famille du jeu de caractères de l'ISO 8859. Les langues écrites de l'Asie de l'Est, et spécifiquement, le chinois, le japonais et le coréen, utilisent nettement plus de caractères que ne peut contenir un octet. C'est pourquoi, afin de représenter ces multiples caractères, on a tout d'abord utilisé un codage spécifique composé de deux octets.

L'ISO 2022 avait développé une technique pour représenter les caractères de multiples systèmes de caractères à travers un unique système de codage. Les caractères ISO 2022 incorporent des séquences d'échappement qui indiquent le jeu à utiliser pour le caractère qui suit. Les séquences d'échappement sont enregistrées dans l'ISO et sont souvent codées par une chaîne de trois caractères utilisant le caractère ASCII ECHAP (hexadécimal : 1B, octal : 33). Ces codages de caractères requièrent que les données soient exécutées séquentiellement afin de parvenir à une interprétation correcte des diverses séquences d'échappement.

Même si le jeu de caractères ISO 2022, et particulièrement, ISO-2022-JP, est encore énormément utilisé, les logiciels modernes utilisent aujourd'hui des codages de caractères de type Unicode tel que l'UTF-8.

Jeux de caractères ISO 2022

Les codages de caractères utilisant les mécanismes ISO 2022 inclus :

  • ISO-2022-JP - largement utilisé dans le codage du japonais. Commence par des caractères ASCII et inclut les séquences d'échappements suivantes :
    • ESC ( B pour utiliser le code ASCII (1 octet par caractère)
    • ESC ( J pour utiliser le codage JIS X 0201-1976 (1 octet par caractère)
    • ESC $ @ pour utiliser le codage JIS X 0208-1978 (2 octets par caractère)
    • ESC $ B pour utiliser le codage JIS X 0208-1983 (2 octets par caractère)
  • ISO-2022-JP-1 - Identique à ISO-2022-JP avec une séquence d'échappement supplémentaire :
    • ESC $ ( D pour utiliser le codage JIS X 0212-1990 (2 octets par caractère)
  • ISO-2022-JP-2 - Extension multilingue de l'ISO-2022-JP. Identique à l'ISO-2022-JP-1 avec les séquences d'échappement supplémentaires suivantes :
    • ESC $ A pour utiliser le codage GB2312-1980 (2 octets par caractère)
    • ESC $ ( C pour utiliser le codage KSC5601-1987 (2 octets par caractère)
    • ESC . À pour utiliser le codage ISO 8859-1 (1 octet par caractère)
    • ESC . B pour utiliser le codage ISO 8859-7 (1 octet par caractère)
  • ISO-2022-JP-3 - japonais
  • ISO-2022-KR - coréen
  • ISO-2022-CN - chinois
  • ISO-2022-CN-EXT - chinois

Voir aussi

Liens externes

Ce document provient de « ISO 2022 ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article ISO 2022 de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • ISO-2022 — ISO 2022, ou plus formellement ISO/CEI 2022 (ICS n° 35.040), est une norme ISO spécifiant une technique pour inclure de multiples jeux de caractères dans un seul codage de caractères. À la différence du codage de caractères ISO 8859 qui utilise 8 …   Wikipédia en Français

  • Iso 2022 — ISO 2022, ou plus formellement ISO/CEI 2022 (ICS n° 35.040), est une norme ISO spécifiant une technique pour inclure de multiples jeux de caractères dans un seul codage de caractères. À la différence du codage de caractères ISO 8859 qui utilise 8 …   Wikipédia en Français

  • ISO-2022-CN — ISO/IEC 2022, Informationstechnologie – Zeichensatzstruktur und erweiterungstechniken (engl. Information Technology Character code structure and extension techniques) ist ein ISO Standard, der eine Technik zur Kodierung mehrerer Zeichensätze… …   Deutsch Wikipedia

  • ISO-2022-JP — ISO/IEC 2022, Informationstechnologie – Zeichensatzstruktur und erweiterungstechniken (engl. Information Technology Character code structure and extension techniques) ist ein ISO Standard, der eine Technik zur Kodierung mehrerer Zeichensätze… …   Deutsch Wikipedia

  • ISO-2022-KR — ISO/IEC 2022, Informationstechnologie – Zeichensatzstruktur und erweiterungstechniken (engl. Information Technology Character code structure and extension techniques) ist ein ISO Standard, der eine Technik zur Kodierung mehrerer Zeichensätze… …   Deutsch Wikipedia

  • ISO 2022 — ISO/IEC 2022, Informationstechnologie – Zeichensatzstruktur und erweiterungstechniken (engl. Information Technology Character code structure and extension techniques) ist ein ISO Standard, der eine Technik zur Kodierung mehrerer Zeichensätze… …   Deutsch Wikipedia

  • ISO/IEC 2022 — ISO 2022, more formally ISO/IEC 2022 Information Technology Character code structure and extension techniques , is an ISO standard (equivalent to the ECMA standard ECMA 35) specifying * a technique for including multiple character sets in a… …   Wikipedia

  • ISO/CEI 2022 — ISO 2022, ou plus formellement ISO/CEI 2022 (ICS no 35.040), est une norme ISO spécifiant une technique pour inclure de multiples jeux de caractères dans un seul codage de caractères. À la différence du codage de caractères ISO 8859 qui… …   Wikipédia en Français

  • ISO/IEC 2022 — ISO/IEC 2022, Informationstechnologie – Zeichensatzstruktur und erweiterungstechniken (englisch Information Technology Character code structure and extension techniques) ist ein ISO Standard, der eine Technik zur Kodierung mehrerer… …   Deutsch Wikipedia

  • ISO/IEC 8859-1 — ISO 8859 1, more formally cited as ISO/IEC 8859 1 is part 1 of ISO/IEC 8859, a standard character encoding of the Latin alphabet. It is less formally referred to as Latin 1. It was originally developed by the ISO, but later jointly maintained by… …   Wikipedia