Séminaire de Pr René Carré, Directeur de Recherche du CNRS, Laboratoire DDL Lyon - Date : 29 novembre 2007, 9h00 - Lieu : Centre MICA

Intervenant :
René Carré
Directeur de Recherche du CNRS
Laboratoire DDL (Dynamique Du Langage) de Lyon

Date : Jeudi 29 novembre 2007, 9h00
Lieu : MICA Bâtiment C10, 4ème étage, salle polyvalente
Interprète traducteur : le séminaire sera présenté en anglais (slides en français)

Résumé :
La coarticulation en production de parole est un phénomène qui intéresse tous les phonologues et les phonéticiens. En effet, ce phénomène est central pour expliquer le passage d’une représentation abstraite à une réalisation périphérique. A ce niveau, on peut se poser la question de savoir si une partie de la coarticulation est planifiée. Au niveau périphérique, sur quelle échelle de temps observe-t-on des effets de coarticulation ? Sur des ensembles, CV, VCV, VCCCV,… Comment peut-on les interpréter ? Comment sont perçus les effets acoustiques liés au phénomène de coarticulation ? En fait, l’explication de ce phénomène aux facettes très variées et complexes reviendrait à proposer une théorie générale du mécanisme de la communication parlée. Notre contribution visera ici à apporter un éclairage particulier en nous appuyant le plus possible sur une approche déductive.

Dans un premier temps, nous rappellerons quelques uns des phénomènes les plus connus liées à la coarticulation, et nous développerons plus particulièrement les résultats obtenus concernant le locus equation (Lindblom, Sussman,…). Sussman estime que les paramètres du locus permettent de caractériser la consonne, Krull estime qu’ils donnent une mesure de la coarticulation.

Nous formulerons ensuite quelques premières remarques permettant d’analyser les diverses observations rapportées. Nous justifierons notre choix de retenir une commande de type syllabique par coproduction de gestes.

Nous développerons ensuite une démarche déductive pour développer un système de communication d’informations à partir des caractéristiques acoustiques d’un tube. Nous faisons l’hypothèse que le système de production de parole est optimal, qu’il est le résultat d’une évolution et qu’il vise à pouvoir utiliser un espace acoustique le plus grand possible, à être efficace en termes de critère de minimum d’énergie. Il doit aussi être le plus simple possible. C’est un système qui doit être bien adapté pour les tâches à réaliser : la réalisation doit correspondre à l’intention (et réciproquement). Cette approche nous permet de mettre en évidence un espace acoustique de travail qui correspond au triangle vocalique. Elle nous permet aussi de déterminer des gestes spécifiques de déformation du conduit vocal entrainant des trajectoires formantiques correspondantes dans l’espace acoustique. Ces déformations peuvent être modélisées simplement par le modèle en régions distinctives (DRM). Elles structurent le tube acoustique de même que les trajectoires structurent l’espace acoustique. Il se trouve que les régions correspondent aux lieux d’articulation des voyelles et des consonnes. De telles caractéristiques sont finalement intrinsèques au tube acoustique car elles ont été obtenues sans données spécifiques liées à la parole.

On utilise ce modèle avec une commande de type syllabique par coproduction de gestes pour étudier les résultats des travaux sur le locus equation de Sussman avec des ensembles V1CV2 pour trois degrés de coproduction. On retrouve les données de Sussman que l’on peut interpréter en termes de degrés de coproduction. Notre approche déductive met aussi en cause le statut des voyelles en termes de cibles statiques à atteindre. En effet, l’approche évolutive ne peut que chercher à accroitre le contraste acoustique selon des directions données (des cibles comme les angles du triangle vocalique sont inconnues). On a donc des informations de type direction de l’évolution dans l’espace acoustique.

Ce comportement nous a conduits à regarder le geste de transition V1V2 comme pouvant être caractérisé non pas par une cible V2 à atteindre mais par une direction dans l’espace acoustique et par une vitesse de transition. On peut ainsi reproduire les voyelles dans l’espace VF1/VF2 (VF1 est la vitesse de transition de F1,…). Une telle approche est justifiée par de nombreux travaux sur le rôle de la dynamique dans la perception des voyelles (citons les expériences sur le ‘silent center’ de Strange). Avec une telle approche, les caractéristiques formantiques des cibles vocaliques statiques pourraient être considérées comme extrinsèques ??? On pourra débattre des conséquences de cette approche sur l’analyse du phénomène de coarticulation.