Séminaire de Pr Christian Boitet, UJF Grenoble, GETALP/LIG - Date : 31 octobre 2007, 10h00 - Lieu : Centre MICA

Intervenant :
Christian Boitet
Pr UJF, GETALP-LIG
Responsable de GETA
Chercheur en traduction automatique et environnements specialisés pour le traitement des langues naturelles. Responsable du projet Franco-Thai-NLP.

Date : Mercredi 31 Octobre 2007, 10h00
Lieu :
MICA Bâtiment C10, 4ème étage, salle polyvalente
Interprète traducteur : le séminaire sera présenté en francais ou en anglais, selon l'assistance 

Résume : 
Le langage UNL (Universal Networking Language) est un langage formel de graphes sémantiques capable de représenter en principe n'importe quel énoncé en langue naturelle.

Il ne s'agit pas d'une langue articicielle comme l'espéranto, qui présente en fait les problèmes majeurs de toute langue naturelle (ambiguïté, flou, réflexivité, productivité arbitraire), et celui de la création lexicale, notamment pour toute la terminologie moderne.

Un noeud d'un graphe UNL porte une UW (Universal Word) et des attributs sémantiques et pragmatiques. Un arc porte une relation sémantique. Une UW est constituée d'un terme anglais et de restrictions sémantiques. Elle représente un acception ou un groupe d'acceptions parmi l'ensemble de toutes les acceptions possibles dans l'ensemble de toutes les langues naturelles.

Les symboles d'UNL sont essentiellement construits à partir de termes anglais. C'est pourquoi on parle d'interlingue "anglo-sémantique". Cela présente l'énorme avantage que tous les développeurs dans le monde sont capables de comprendre un graphe UNL, et qu'UNL peut être utilisé comme "pivot" en traduction automatique, et comme langage d'indexation en RI translingue (crosslingual IR).

En traduction de parole, il convient d'utiliser des "pivots" sémantico-pragmatiques sans lien avec une langue naturelle, dans le cas d'applications restreintes à des tâches finalisées comme la réservation touristique (cas de l'IF pour CSTAR/Nespole!). Par contre, dans des contextes ouverts, cela est impossible, et le mieux est alors d'utiliser UNL. UNL peut être combiné à des annotations pragmatiques destinées à prendre en compte les actes de parole et autres informations liées à l'affect (VoiceUNL).

L'exposé consistera en 3 parties:
- lire UNL (comprendre un graphe UNL, i.e. le "déconvertir" dans sa langue)
- écrire UNL ("enconvertir" un énoncé en UNL)
- appliquer UNL (utilisations actuelles et perspectives).