M. Nguyen Hong Quang, doctorant en co-tutelle entre le Centre MICA et le laboratoire LIA d'Avignon (France) a soutenu brillamment sa thèse à Avignon le mercredi 5 novembre 2008.

Titre : Reconnaissance automatique de la parole continue grand vocabulaire en vietnamien

Doctorant : NGUYEN Hong Quang
Co-directeur de thèse français : Dr. Pascal NOCERA,
Co-directeur de thèse vietnamien : Pr. TRINH Van Loan,
Co-encadrant :
Dr. Eric CASTELLI,

Résumé :
La reconnaissance de la parole vietnamienne est juste au début de son développement. Nous constatons que les différences entre la langue vietnamienne et les langues occidentales sont telles que les techniques de reconnaissance de la parole communément employées pour ces dernières (anglais, français par exemple.) ne suffisent pas pour développer directement un système de reconnaissance performant. Dans notre thèse, nous avons prise en compte des caractéristiques de la langue vietnamienne au niveau de la représentation des données (lexique, modèle de langage) et des modèles (modèle de tons) dans notre système de reconnaissance automatique de la parole continue grand vocabulaire pour le vietnamien. En cumulant les traitements de ces caractéristiques, les résultats ont été améliorés de pratiquement 50 % (par rapport au système initial). Ces résultats prouvent que l’ajout d’informations supplémentaires, caractéristiques de la langue vietnamienne, améliore considérablement les performances des systèmes de reconnaissance de la parole.


Abstract:
Development of the Vietnamese speech recognition has just started. This is due to the differences between Vietnamese language and Western languages, the speech recognition techniques broadly used for these languages (English, French for example.) are not enough for developing directly a powerful Vietnamese speech recognition system. In our thesis, we have taken into consideration the Vietnamese language characteristics in term of data (lexicon, language model) and model (tone model) representation in our Vietnamese Large Vocabulary Continuous Speech Recognition system. By integrating the processing of these characteristics, the results were improved by practically 50 % (compared to the baseline system). These results prove that the addition of supplementary information, characteristics of Vietnamese language, improves considerably the performances of the speech recognition system.