BOCU-1

Binary Ordered Compression for Unicode

Unicode
Jeux de caractères
Équivalences normalisées
  • NFC (précomposée)
  • NFD (décomposée)
  • NFKC (compatibilité)
  • NFKD (compatibilité)
Propriétés et algorithmes
Codage
Autres transformations
Applications d'échanges de données

Le BOCU-1 est un schéma de compression Unicode compatible MIME. BOCU signifie (en anglais: for Binary Ordered Compression for Unicode) Compression Ordonnées Binairmeent pour Unicode. BOCU-1 combine la large applicabilité d' UTF-8 avec la compacité du SCSU. Cet Unicode encoding est utile pour compresser de courtes chaînes, et maintient l'ordre des code point. Usuellement, les zip, bzip2, et autres algorithmes standards disponibles compressent de plus grandes quantités de textes plus efficacement.

SCSU a été créé comme schéma de compression Unicode avec un ration octet/code point similaire à ceux des code page spécifiques aux différentes langues. Il n'a pas été largement adopté bien que vérifiant les critères de jeu de caractères IANA et enregistré avec IANA. SCSU n'est pas disponible pour du type texte MIME . Par exemple, SCSU ne peut pas être utilisé directement dans les courriels et protocoles similaires. SCSU requirt un design d'encodeur compliqué pour avoir de bonnes performances.

C'est worth rien que le SCSU ait été adopté comme official Unicode Technical Standard. BOCU-1 n'a pas été officiellement adopté par le consortium Unicode, mais Unicode Technical Note #6 décrit cet encodage avec plus de détails.

Liens internes

Liens externes

Ce document provient de « Binary Ordered Compression for Unicode ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article BOCU-1 de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • böcü — is., hlk. 1) Kurt 2) Böcek 3) Çocukları korkutmak için söylenen ve hayalet, hortlak vb. hayalî varlık Ferace ile böcü gibi çıkacak değilim ya. H. R. Gürpınar …   Çağatay Osmanlı Sözlük

  • ISO 8859-1 — La norme ISO 8859 1, dont le nom complet est ISO/CEI 8859 1, et qui est souvent appelée Latin 1 ou Europe occidentale, forme la première partie de la norme internationale ISO/CEI 8859, qui est une norme de l Organisation internationale de… …   Wikipédia en Français

  • ISO-8859-1 — Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • ISO/CEI 8859-1 — ISO 8859 1 Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • ISO latin 1 — ISO 8859 1 Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • Iso 8859-1 — Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • Latin-1 — ISO 8859 1 Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • Latin 1 — ISO 8859 1 Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • UTF-1 — is a way of transforming ISO 10646/Unicode into a stream of bytes. Due to the design it is not possible to resynchronise if decoding starts in the middle of a character (this makes truncation hard, among other things) and simple byte oriented… …   Wikipedia

  • Binary Ordered Compression for Unicode — BOCU 1 is a MIME compatible Unicode compression scheme. BOCU stands for Binary Ordered Compression for Unicode. BOCU 1 combines the wide applicability of UTF 8 with the compactness of SCSU. This Unicode encoding is designed to be useful for… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”