Groupe d'Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole


Groupe d'Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole
GETALP
Image illustrative de l'article Groupe d'Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole

Création 2007
Siège Bâtiment IMAG B - 385 avenue de la Bibliothèque
38400 Saint-Martin-d'Hères
Pays France
Coordonnées 45° 11′ 37″ Nord
       5° 46′ 13″ Est
/ 45.193629, 5.770199
45° 11′ 37″ N 5° 46′ 13″ E / 45.193629, 5.770199
Rattachement Laboratoire LIG
CNRS UMR 5217
Directeur Hervé Blanchon
Disciplines Informatique, Linguistique
Chercheurs statutaires 14
Chercheurs associés 2
Doctorants 12
Site web http://www.getalp.org

Géolocalisation sur la carte : France

(Voir situation sur carte : France)
Nommé(e)

Le Groupe d'Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole ou GETALP, anciennement GETA est une équipe de recherche en traduction automatique et traitement automatisé des langues et de la parole, issue du premier laboratoire français de traduction automatique, le Centre d'Études sur la Traduction Automatique (CETA), créé le 24 décembre 1959.

Sommaire

Historique

1959 : le CETA

En 1959, l'intérêt du CNRS pour les recherches en traduction automatique se confirme avec une demande en traduction automatique du russe, en documentation automatique, en analyse numérique et en automatisme.

À cette fin, il faut équiper en calculateurs électroniques deux ou trois super-centres, Paris, Grenoble et Toulouse, auxquels est confiée l'étude des problèmes prioritaires.

Le CETA est finalement créé le 24 décembre 1959 par une convention entre le CNRS, la DEFA (Direction des études et fabrications d'armement) et le CASDEN (Comité d'action scientifique de défense du centre d'exploitation scientifique et technique du ministère de la Défense). Il est créé au sein du Laboratoire de calcul numérique de l'Institut Blaise-Pascal du CNRS. Il a pour mission « l'étude et la conception d'une méthode pour la traduction automatique notamment du russe en français et l'étude de l'organisation générale d'une machine pour cette fin ».

Le directeur du laboratoire de calcul numérique, René de Possel, et son sous-directeur, André Lentin, par ailleurs membre fondateur de l'ATALA (Association pour le traitement automatique des langues), joueront un rôle important dans l'interaction entre mathématiques appliquées, langages formels et linguistique. Ils sont tous deux membres du conseil scientifique du CETA[1].

LE CETA est ensuite réparti en deux sections : le CETAP à Paris et le GETAG à Grenoble.

Le CETAP

L'armée est, à plusieurs titres, partie prenante dans l'affaire. Le CETAP bénéficie des locaux du Laboratoire central de l'armement (LCA) au Fort de Montrouge à Arcueil. Son directeur, Aimé Sestier, né en 1920, est ingénieur militaire en chef, chef de la section des machines à calculer du LCA.

Les ingénieurs et le personnel technico-administratif appartiennent au LCA. Les linguistes, sept slavistes et deux germanistes, sont rémunérés par le CNRS.

L'abandon du travail en linguistique fondamentale va progressivement conduire Aimé Sestier à démissionner et à dissoudre le CETAP en octobre 1962[2].

1960 : le CETAG

Grenoble est à cette époque l'un des principaux lieux d'implantation de l'informatique en France. C'est à Grenoble qu'est fondée l'AFCAL (Association française de calcul) en 1957, et Jean Kuntzmann y crée la revue Chiffres en 1958.

La seconde section du CETA est alors créée à Grenoble. Et c'est au laboratoire de calcul de la faculté des sciences, avec le soutien du professeur Jean Kuntzmann qu'est créé le CETAG sous la direction de Bernard Vauquois.

Le CETAG comprend en 1960, quatre spécialistes de russe, une technicienne germaniste, et une technicienne spécialiste de japonais. En ce qui concerne les informaticiens, le directeur de la programmation a sous ses ordres deux programmeurs. Le groupe compte également deux ingénieurs mathématiciens préparant un doctorat de mathématiques appliquées.

Après la dissolution du CETAP, ne reste donc plus que le groupe de Grenoble, qui, tout en continuant à être rattaché à l'Institut Blaise-Pascal, devient laboratoire propre du CNRS en 1963, en gardant le nom de CETA.

1971 : le GETA

Malgré la crise induite par le rapport ALPAC (en), le CETA tient bon. Ses crédits sont augmentés et ses locaux agrandis. Toutefois, il faut pondérer cette impression de prospérité : le CETA se porte très bien en 1967, mais moins bien en 1971, date à laquelle il sera privé d'une partie de ses forces, chercheurs et moyens, et perd son statut privilégié de laboratoire propre du CNRS. Malgré cela, cette stabilité a permis au CETA, devenu GETA en 1971, de prendre un second souffle et de réaliser dès le début des années 1970 Ariane-78, un système multiniveaux fondé sur la méthode de transfert, considéré comme un des plus importants et des plus influents de l'époque. Il s'agissait alors de traduction automatique (TA) sans préédition ni postédition , que nous appelons aujourd'hui TA du veilleur. Cette période se caractérise par l'application éclairée de la théorie des langages formels et de leur compilation au problème de la TA, ainsi que par l'intégration de théories linguistiques de pointe, avec en particulier le passage par un "langage pivot"[3].

Le GETA a été dirigé par Bernard Vauquois jusqu'à son décès en 1985. Le GETA est membre de la fédération IMAG, depuis la création de cette dernière en 1986.

De 1971 à 1980, le GETA, se tournant vers la TA du réviseur, élabora et expérimenta une nouvelle méthodologie de la TAO (Traduction Assistée par Ordinateur) par approche transfert multiniveau et un générateur de systèmes de TAO (Ariane-78).

De 1981 à 1987-88, le GETA participa activement à des transferts de technologie vers l'industrie, tout en réalisant en interne un système "préopérationnel" russe-français pour la DRET, plusieurs études pour le projet Eurotra[4], et en aidant divers groupes étrangers à construire des maquettes ou des prototypes de systèmes de TA. Le système Ariane-78 fut profondément remanié et étendu, et donna naissance à Ariane-G5.

La disparition de Bernard Vauquois, au milieu du Projet National TAO, pour lequel sa participation était très importante, fut un grand choc. De 1986 à 1990, l'équipe s'efforça de mener à bien les diverses actions en cours, tout en se restructurant et en diminuant son activité de développement et d'expérimentation en vraie grandeur au profit d'une recherche plus fondamentale. À partir de 1988-90, considérant que le transfert technologique sur la TAO du réviseur avait été effectué, le GETA réorienta sa recherche vers la TAO individuelle, qui comporte deux volets, la TAO du traducteur et la TAO du rédacteur.

François Peccoud, à l'époque Professeur à l'Université Pierre Mendès-France, prit ensuite la direction du GETA de 1985 à 1995 avant de devenir président de l'Université de technologie de Compiègne[5].

1997 : rattachement au CLIPS

En 1997 est fondé le laboratoire CLIPS (Communication Langagière et Interaction Personne Système). Celui-ci regroupe 6 équipes dont le GETA et GEOD (Groupe d'Études sur l'Oral et le Dialogue). LE GETA perd son statut de laboratoire autonome pour devenir une équipe de ce nouveau laboratoire. Ce sera l'occasion pour le GETA de déménager dans les locaux du CLIPS. La distance n'est pas très grande (500 m) mais le changement suffit malheureusement à perdre l'organisation de la bibliothèque. Depuis cette époque, les personnels CNRS du GETA partant à la retraite ne seront plus remplacés. Le CLIPS est toujours membre de la fédération IMAG. L'équipe GETA est alors dirigée par Christian Boitet[6], Professeur à l'Université Joseph Fourier.

En 1997 également, le GETA commence à travailler sur le projet Universal Networking Language (UNL), fondé par l'Université des Nations unies, dans le but de mettre au point un langage formel informatique, servant de pivot interlingue sémantique et permettant de favoriser l'éclosion d'un véritable multilinguisme[7].

2007 : le GETALP, création du LIG

Le premier janvier 2007, les laboratoires qui composaient la fédération IMAG, dont le CLIPS, ont été dissous et les équipes de recherche se sont réparties dans de nouveaux laboratoires dont le Laboratoire d'Informatique de Grenoble (LIG). À cette occasion, les équipes GETA et GEOD ont fusionné pour donner naissance à l'actuelle équipe GETALP, dirigée par Hervé Blanchon, Maître de conférences habilité de l'Université Pierre Mendès-France (Grenoble 2) [8]. Le GETALP intègre alors le LIG dès sa fondation.

2011 : lancement de Aximag

L'équipe développe le concept de passerelle de traduction (iMAG, interactive Multilingual Access Gateway) qui permet de naviguer sur un site traduit dans sa langue alors que le site original ne l'est pas. Ainsi avec une passerelle de traduction, les textes seront traduits, mais les clics sur les différents liens "internes" du site, permettront de visiter les pages demandées tout en restant dans la passerelle, les liens externes restants inchangés.

En 2011, Aximag[9], une jeune pousse "en émergence" est créée entre le GETALP et la société de valorisation Floralis[10], filiale de l'Université Joseph Fourier. Aximag proposera des services par abonnement et des prestations spécifiques autour du concept d'iMAG. Il est possible de voir un exemple d'iMAG sur le site du laboratoire LIG.

Aujourd'hui le GETALP compte 14 enseignants-chercheurs issus des 5 établissements universitaires du PRES grenoblois (dont 12 informaticiens et 2 linguistes), 3 ingénieurs de recherche (dont 2 informaticiens et 1 linguiste), 1 collaborateur bénévole, 12 doctorants, 2 post-docs et 7 visiteurs et stagiaires.

Activités de recherche

Le but des travaux du GETALP est de contribuer de façon significative à l’émergence d’une informatique ubilingue, dans le contexte du développement de l’informatique ubiquitaire. Cet objectif nécessite de mener à bien des recherches à caractère souvent pluridisciplinaire, en informatique, en linguistique et psycholinguistique, en sémantique (lien avec les ontologies), en pragmatique (pour le dialogue), et en traitement de l’oral[11].

L'équipe GETALP est actuellement organisée autour de six thèmes de recherche principaux : 1 : Traduction Automatique (TA) et Automatisée (TAO); 2 : Traitement Automatique des Langues (TALN) et plates-formes associées; 3 : Collecte et construction de ressources linguistiques; 4 : Multilinguisme dans les systèmes d’information; 5 : Reconnaissance automatique de la parole, des locuteurs, des sons et des dialectes; 6 : Analyse sonore et interaction dans les environnements perceptifs.

Les activités de ces thèmes de recherche partagent cinq défis :

  • rendre l’informatique multilingue et "ubilingue"
  • informatiser les langues peu dotées[12] et peu écrites en adaptant des ressources existantes
  • rendre la communication langagière multimodale (texte, parole, geste)
  • trouver et implémenter des méthodes et outils d’évaluation liés à la tâche
  • utiliser l'interaction contributive pour collecter des ressources, améliorer des traductions et communiquer avec "sens garanti".

Voir aussi

Articles connexes

Liens externes

Notes et références

  1. Le CNRS et les débuts de la traduction automatique en France http://histoire-cnrs.revues.org/3461
  2. 50 ans d'histoire de l'ATALA http://www.atala.org/ATALA-cinquante-ans
  3. Histoire du GETA http://www.getalp.org/xwiki/bin/view/Main/HistoryGETA
  4. Anne-Marie Loffler-Laurian, La traduction automatique, Éditions Septentrion, Paris, 1998 (ISBN 978-2859395025), 156 p.
  5. CV de François Peccoud https://ged.aeres-evaluation.fr/guest.php?sole=Y&app=AERES_DIFFCV&action=AERES_DIFFCV_DOWNLOAD_CV&id=83748
  6. Études françaises, Marie Lebert, Entretien avec Chrisitian Boitet http://www.etudes-francaises.net/entretiens/boitet.htm
  7. Description du projet UNL, consulté sur www.getalp.org le 20 août 2011
  8. Page personnelle de Hervé Blanchon http://www-clips.imag.fr/geta/herve.blanchon/
  9. Site Web de Aximag http://www.aximag.fr/
  10. Site Web de la société Floralis http://www.floralis.fr
  11. Présentation du GETALP http://www.getalp.org/
  12. Thèse de Vincent Berment http://tel.archives-ouvertes.fr/docs/00/04/68/93/PDF/tel-00006313.pdf

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Groupe d'Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • Bernard Vauquois — (1929 – 30 septembre 1985) est un mathématicien et informaticien français. Il est le pionnier de la traduction automatique (TA) en France. Il fut professeur à la faculté des sciences de Grenoble où il fonda, avec l aide de Jean Kuntzmann, le… …   Wikipédia en Français