dans le cadre du projet APRIL et avec le LACITO, le 7 novembre 2014 dans les locaux de l'Institut MICA

 

Initié en 2013, le projet APRIL (Avancées dans le Prototypage Rapide pour l'Informatisation des Langues) est un projet de recherche financé par le programme PEPS CNRS multidisciplinaire HuMaIn et commun entre l'Institut MICA et le LACITO.

 

Après le succès de sa première année, une prolongation du projet pour une 2ème année a permis de compléter les missions de terrain et de valider les premiers résultats par la mise en place de quelques prototypes d’outils proposés pendant la première année.

Dans le cadre du projet APRIL (Avancées dans le Prototypage Rapide pour l'Informatisation des Langues), le workshop "APRIL" 2014 est organisé par les chercheurs du Département "Speech Communication" de l'Institut MICA avec leur partenaire LACITO (Paris, France) à l'Institut MICA le 7 Novembre 2014.

Objectifs du projet APRIL :
En vue de faciliter la tâche des linguistes confrontés à la sauvegarde urgente de langues en très grand danger, l’objectif est de travailler sur le développement de méthodologies en associant les connaissances issues du domaine linguistique avec celles des spécialistes du traitement du signal et de l’information, du traitement des grandes bases de données et de la conception d’outils informatiques adaptés.

Les principales étapes de l’informatisation des langues peu dotées se décrivent en 1) l’enregistrement de (très) grandes bases de données, l’annotation de ces bases de données, puis leur analyse, 2) l’utilisation de techniques informatiques et mathématiques d’apprentissage pour la réalisation des outils de reconnaissance, de synthèse, ou de traduction. Pour faire face à cet immense défi nous pensons qu’il est important de développer de nouvelles méthodologies, à la fois efficaces et éthiques, en réunissant des experts des technologies vocales, mais aussi des scientifiques de la parole experts linguistiques ou experts de la collecte/gestion/analyse des langues

 

Les participants :

  • Pr Alice Vittrant, professeur à l'Université d'Aix-Marseille, chercheur au laboratoire LACITO (CNRS - Université Sorbonne-Nouvelle, Paris 3)
  • Les chercheurs du Département Speech Communication de l'Institut MICA, à savoir : Tran Do Dat, Nguyen Viet Son, Alexis Michaud, Do Thi Ngoc Diep, Mac Dang Khoa, Tran Thi Anh xuan, Nguyen Thi Lan, Duong Hien Thanh et Eric Castelli
  • Des chercheurs invités : Fréderic Pain, Dinh Thi Hang, Nguyen Thi Minh Chau.

 

Le programme :

09h00-09h15
09h15-09h30
Réception et discussion libre
Do Thi Ngoc Diep Rappel des objectifs du projet APRIL et bilan des activités de la première année
09h30-10h00 Alexis Michaud Towards the automatic processing of yongning na (sino-tibetan):  developing a ‘light’ acoustic model of the target language and testing ‘heavyweight’ models from five national languages
10h00-10h30 Mac Dang-Khoa Generation audio metadata with Pangloss format for DoReMiFa project
10h30-11h00 Pause café
11h00-11h30 Tran Thi-Anh-Xuan Is-it matter of dynamic ?
11h30-12h00 Nguyen Viet-Son, Nguyen Tien-Thanh Phonetic toolkit
12h00-14h00 Lunch (Tout les participants)
14h00-14h30 Frederic Pain Tai Paw and Tai Yo, two Tai Mường sub-dialects from Nghệ An
14h30-15h00 Alice Vittrant Bilan de la mission terrain en Novembre
15h00-15h30 Pause café
15h30-17h00 Discussion finale

 

Quelques photos :