Normalisation Unicode


Normalisation Unicode

La normalisation Unicode est une normalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.

Sommaire

NFD

Les caractères sont décomposés par équivalence canonique et réordonnés.

Exemples 
  caractères   forme
normalisée
à a +  ̀ = a +   ̀
ẹ́ e +  ́ +  ̣ e +  ̣ +  ́
ñ ñ n +  ̃
Ω (ohm) Ω Ω (omega)
fi (ligature) =
² ² = ²

NFC

Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.

Exemples 
  caractères   forme
normalisée
à a +  ̀ à
ẹ́ e +  ́ +  ̣ ẹ +  ́
ñ ñ ñ
Ω (ohm) Ω Ω (omega)
fi (ligature) =
² ² = ²

NFKD

Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.

Exemples 
  caractères   forme
normalisée
à a +  ̀ = a +  ̀
ẹ́ e +  ́ +  ̣ e +  ̣ +  ́
ñ ñ n +  ̃
Ω (ohm) Ω Ω (omega)
fi (ligature) = f + i
² ² 2

NFKC

Les caractères sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.

Exemples 
  caractères   forme
normalisée
à a +  ̀ à
ẹ́ e +  ́ +  ̣ ẹ +  ́
ñ ñ = ñ
Ω (ohm) Ω Ω (omega)
fi (ligature) f + i
² ² 2

Annexes

Articles connexes

Liens externes


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Normalisation Unicode de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • Unicode — est une norme informatique, développée par le Consortium Unicode, qui vise à permettre le codage de texte écrit en donnant à tout caractère de n’importe quel système d’écriture un nom et un identifiant numérique, et ce de manière unifiée, quelle… …   Wikipédia en Français

  • Equivalences unicode — Équivalences unicode Cet article traite des équivalences unicode. Unicode contient de nombreux caractères. Pour maintenir la compatibilité avec des standards existants, certains d’entre eux sont équivalents à d’autres caractères ou à des… …   Wikipédia en Français

  • Équivalences unicode — Cet article traite des équivalences unicode. Unicode contient de nombreux caractères. Pour maintenir la compatibilité avec des standards existants, certains d’entre eux sont équivalents à d’autres caractères ou à des séquences de caractères.… …   Wikipédia en Français

  • Table des caracteres Unicode (0000-FFFF) — Table des caractères Unicode (0000 FFFF) Tables Unicode 0000 – 0FFF   8000 – 8FFF 1000 – 1FFF 9000 – 9FFF 2000 – 2F …   Wikipédia en Français

  • Table des caracteres Unicode (10000-1FFFF) — Table des caractères Unicode (10000 1FFFF) Tables Unicode 10000 – 10FFF   18000 – 18FFF 11000 – 11FFF 19000 – 19FFF …   Wikipédia en Français

  • Table des caracteres Unicode (20000-2FFFF) — Table des caractères Unicode (20000 2FFFF) Tables Unicode 20000 – 20FFF   28000 – 28FFF 21000 – 21FFF 29000 – 29FFF …   Wikipédia en Français

  • Table des caracteres Unicode (E0000-EFFFF) — Table des caractères Unicode (E0000 EFFFF) Tables Unicode E0000 – E0FFF   E8000 – E8FFF E1000 – E1FFF E9000 – E9FFF …   Wikipédia en Français

  • Table des caractères Unicode (10000-1FFFF) — Tables Unicode (plan 1) 10000 – 10FFF   18000 – 18FFF 11000 – 11FFF 19000 – 19FFF 12000 – 12FFF …   Wikipédia en Français

  • Table des caractères Unicode (E0000-EFFFF) — Tables Unicode (plan E) E0000 – E0FFF   E8000 – E8FFF E1000 – E1FFF E9000 – E9FFF E2000 – E2FFF …   Wikipédia en Français

  • Table des caractères unicode (0000-ffff) — Tables Unicode 0000 – 0FFF   8000 – 8FFF 1000 – 1FFF 9000 – 9FFF 2000 – 2F …   Wikipédia en Français