Séminaire de Melle Do Ngoc Diep, doctorante du Centre MICA - Date : vendredi 23 octobre 2009, 14h00 - Lieu : Centre MICA

Intervenant :
Melle Do Ngoc Diep
Doctorante en co-tutelle Centre MICA/Laboratoire LIG

Date : vendredi 23 octobre 2009, 14h00
Lieu : Salle polyvalente, bâtiment C10; 4ème étage, Centre MICA
Interprète traducteur : l'exposé sera fait en français

Résumé :
Les travaux concerne de la construction d’un système de traduction probabiliste pour le couple de langue vietnamien-français. La langue vietnamienne étant considérée comme une langue peu dotée, une des difficultés réside dans la constitution des corpus parallèles, indispensable à l’apprentissage des modèles (le modèle de traduction et le modèle de la langue). Nous nous concentrons sur la constitution d’un grand corpus parallèle vietnamien-français.

Dans la première année, une méthode d’identification automatique des paires de documents parallèles fondée sur la date de publication, les mots spéciaux et les scores d’alignements des phrases est proposée, et les premiers systèmes de traduction sont construits.

Dans la deuxième année, quelques expérimentations sont réalisés sur l’opportunité d’utiliser des unités lexicales ou sous-lexicales pour la langue vietnamienne (syllabes, mots, ou leurs combinaisons). Il y a encore les expérimentations sur les directions comme l'utilisation le reseau de confusion pour combiner le syllable et le mot, l'apprentissage non-supervisé ... pour augmenter la qualité du système de traduction.