ISO/FDIS 639-3

ISO/FDIS 639-3

ISO 639

L’ISO 639 (ICS n°01.140.20) est une norme internationale l'ISO qui définit des codes pour la représentation des noms de langues.

Les langues sont représentées par un code unique de 2 ou 3 lettres, par exemple fi et fin sont associés au finnois. Le standard est composé actuellement de trois parties, dont la publication s'est déroulée de 1998 à 2007, et trois autres parties sont encore en projet.

La norme se compose de différentes parties :

  • ISO 639-1 (2002) : Codes pour la représentation des noms de langues - Partie 1 : Codes alpha-2 (liste des codes ISO 639-1)
  • ISO 639-2 (1998) : Codes pour la représentation des noms de langues - Partie 2 : Codes alpha-3 (liste des codes ISO 639-2)
  • ISO 639-3 (2007) : Codes pour la représentation des noms de langues - Partie 3 : Codes alpha-3 pour un traitement exhaustif des langues
  • ISO/CD 639-4 (2009?) : Codes pour la représentation des noms de langues -- Partie 4 : Lignes directrices pour la mise en oeuvre et principes généraux des codes de langues
  • ISO 639-5 (2008) : Codes pour la représentation des noms de langues - Partie 5 : Code alpha-3 pour les familles de langues et groupes de langues
  • ISO/CD 639-6 (2009?) : Codes pour la représentation des noms de langues - Partie 6 : Représentation alpha-4 pour un traitement exhaustif des variantes linguistiques

Sommaire

Codes alpha-2

Les codes à 2 caractères latins, utilisé par l'ISO 639-1, donnent la possibilité de coder 262=676 langues différentes. Ceci est insuffisant pour coder l'ensemble des langues (estimé de 4000 à 7000), ce qui est réalisé par les normes ISO 639-2 et ISO 639-3 qui utilisent des codes à 3 lettres. La norme ISO 639-1 associe chaque code au nom de la langue en français et en anglais.

Codes alpha-3

Les codes à 3 caractères latins donnent la possibilité de coder 263=17 576 langues différentes. Les codes à 3 lettres sont utilisés par l'ISO 639-2 et l'ISO 639-3.

L'ISO 639-2 définit en plus de l'ISO 639-1 des codes désignant des groupes de langues (arabe, quechua, chinois…), ainsi que des codes spéciaux :

  • mis utilisé pour une langue identifiée mais qui ne dispose ou ne disposait pas encore de codes alpha-2 ou alpha-3 (ce code étant complété souvent d’extensions codifiées pour l’écriture utilisée et l’emplacement géographique, ou non codifiées pour les variantes linguistiques),
  • mul pour codifier les contenus multilingues, c'est-à-dire quand il n’est pas possible d’étiqueter ses éléments séparément et que ceux-ci utilisent des langues différentes, et que la liste des langues ne peut être spécifiée pour le contenu tout entier,
  • und pour codifier toute langue inconnue ou non complètement identifiable,
  • zxx pour coder l'absence de tout contenu linguistique ou attribuable à une langue ou groupe de langue particulier (par exemple une photo de la Lune, un fond musical, etc.),
  • et enfin qaa-qtz, un espace de 520 autres codes réservés mais laissés à un usage privé hors du champ de la normalisation.

Certaines langues (23 en tout) sont codées dans l'ISO 639-2 par deux codes différents : terminologique et bibliographique. Par exemple pour l'allemand, on a : ger pour le code bibliographique (conservé pour des raisons de compatibilité historique avec les systèmes d’échanges et de classification d’information bibliographiques normalisés dans certains pays) et deu pour le code terminologique (à utiliser dans tous les autres cas, y compris pour l’usage selon la norme technique RFC 4646 / BCP 47) ; de même le code alpha-3 bibliographique pour le français est fre mais le code alpha-3 terminologique est fra.

L'ISO 639-3, publié en 2007, vise à répertorier le plus grand nombre possible de langues. Celles-ci peuvent être d'une part des langues individuelles (exemple : arménien, hye), des macrolangues (exemple : albanais, sqi) ou des collections de langues (exemple : langues algonquiennes, alg) ; et d'autre part des langues vivantes (exemple : irlandais, gle), éteintes (récemment, par exemple kato, ktw), anciennes (disparues il y a longtemps, par exemple : vieux norrois, non), historiques (distinctes de langues modernes, mais dont ces dernières descendent de la langue considérée, par exemple moyen anglais, enm) ou construites (exemple : klingon, tlh).

SIL International est l'auteur principal de l'ISO 639-3 et s’est largement appuyé sur les données en provenance de la base de données Ethnologue.com pour codifier des centaines de langues auparavant non codées. Toutefois les codes Ethnologues.com (trois caractères indiqués en majuscules jusque dans sa 15e édition) n'ont pas été tous retenus car certains étaient en conflits avec des codes ISO 639-2 existants. Depuis la publication de la norme ISO 639-3, Ethnologue.com a modifié sa base de données et n’utilise plus que les codes ISO 639-3 (en minuscules) : ses anciens codes, auparavant utilisés aussi par SIL, ne doivent plus être utilisés car Ethnologue.com ne les supporte plus. La norme ISO 639-3 a subi de nombreuses modifications et corrections depuis sa première publication (et notamment de nombreux codes publiés transitoirement dans la version bêta ont été supprimés, fusionnés ou scindés suite aux contributions et discussions sur cette nouvelle norme).

L’ISO 639-5, dont une première version provisoire a été publiée le 15 mai 2008, vise à classer l’ensemble des langues individuelles (ou éventuelles macro-langues qui les contiennent) en familles de langues et groupes de langues selon un système plus complet que ce que permet l’ISO 639-3 (qui ne traite que des macro-langues sans possibilité de définir une hiérarchie complète sur plus d'un seul niveau), en attribuant des codes alpha-3 supplémentaires pour ces familles et groupes de langues, ce que ne permet pas l’ISO 639-1 ou 639-2, où des codes collectifs ont été définis (mais non spécifiés précisément) regroupant parfois des langues isolées de différents groupes et non mutuellement intelligibles ou des groupes trop restreints de langues.

La nouvelle norme ISO 639-5 (publiée mais pas encore sous une forme librement diffusable) visera à préciser les codes collectifs de ISO 639-2 (ou leur équivalent dans la norme ISO 639-1 quand ils existent ; il n'y a aucun nouveau code collectif dans la norme ISO 639-3) et à en définir d’autres selon une classification scientifique la plus sérieuse possible, et les avis des linguistes et bibliothèques du monde entier (elle s’appuie largement sur les données de classification des langues déjà collectées et publiées par Ethnologue.com). Cette norme visera aussi à faciliter la localisation des logiciels et améliorer globalement le traitement des langues plus rares en les rapprochant de langues plus proches au lieu d’utiliser une langue de repli unique (souvent l’anglais dans une version simplifiée et parfois imprécise).

Voir aussi

Articles connexes

Liens externes

  • Portail des langues Portail des langues
Ce document provient de « ISO 639 ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article ISO/FDIS 639-3 de Wikipédia en français (auteurs)

Игры ⚽ Нужно сделать НИР?

Regardez d'autres dictionnaires:

  • ISO 639-6 — ISO/FDIS 639 6, titled Codes for the representation of names of languages Part 6: Alpha 4 representation for comprehensive coverage of language variation , is an international standard being developed by ISO/TC 37/SC 2. The latest FDIS wasissued… …   Wikipedia

  • FDIS — ISO 639 L’ISO 639 (ICS n°01.140.20) est une norme internationale l ISO qui définit des codes pour la représentation des noms de langues. Les langues sont représentées par un code unique de 2 ou 3 lettres, par exemple fi et fin sont associés au… …   Wikipédia en Français

  • ISO 639 — is the set of international standards that lists short codes for language names. It was also the name of the original standard, approved in 1967 and withdrawn in 2002.ISO 639 consists of different parts, of which two parts have been approved and… …   Wikipedia

  • ISO 639-5 — La norme ISO 639 5 (ISO 639 5:2008), intitulée Codes pour la représentation des noms de langues – Partie 5 : code alpha 3 pour les familles et groupes de langues , est une norme internationale développée par le sous comité 2 du comité… …   Wikipédia en Français

  • ISO 639-3 — (ISO 639 3:2007) is an international standard for language codes. The standard describes three‐letter codes for identifying languages. It extends the ISO 639 2 alpha 3 codes with an aim to cover all known natural languages. The standard was… …   Wikipedia

  • ISO 25178 — désigne un ensemble de normes internationales définissant l’analyse des états de surface surfaciques (appelés aussi états de surface 3D). Cette norme en plusieurs parties a été rédigée par le groupe de travail WG16 au sein du comité technique… …   Wikipédia en Français

  • Liste de normes ISO par domaines — Fin 2009, l Organisation internationale de normalisation (ISO) compte environ 18 000 normes actives[1]. Cette liste en donne des exemples, classés par domaines. Certaines normes peuvent apparaître dans plusieurs domaines. Sommaire 1 Normes… …   Wikipédia en Français

  • BPY — can be one of the following abbreviations: * for 2,2 Bipyridine * the ISO/FDIS 639 3 code for Bishnupriya Manipuri language …   Wikipedia

  • Dox — may refer to: dox, an ISO/FDIS 639 3 code for Bussa language Dox, a type of Warez Dornier Do X, the German aircraft Direct oximetry Dog fox hybrid, a supposed hybrid between a fox and a dog dox, an Internet slang word for personally identifiable… …   Wikipedia

  • PDT — Die Abkürzung PDT steht für: Pacific Daylight Time, die Sommerzeit UTC 7 der Zonenzeit PST (Pacific Standard Time UTC 8), eine Zeitzone Partido Democrático Trabalhista, Demokratische Arbeiterpartei in Brasilien Photodynamische Therapie, ein… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”