CNRS

Rechercher




Accueil > Recherche > Thématiques de Recherche > TAL et Phonétique / phonologie de corpus

Travaux sur grands corpus

mis à jour le 6 octobre 2014

TRAVAUX SUR GRANDS CORPUS

Depuis 2007, de nombreux travaux ont été effectués au sein du Laboratoire de Phonétique et Phonologie dans l’axe TAL et Phonétique / Phonologie de corpus. Le recours aux techniques empruntées au Traitement Automatique a pris la forme de l’utilisation de corpus de grande taille (> 100 heures) transcrits et alignés automatiquement au niveau du phonème et du mot, et également celle de programmes d’automatisation de mesures phonétiques qui, jusqu’alors, étaient souvent effectuées manuellement. Des outils empruntés aux technologies de la reconnaissance automatique de la parole ont également été utilisés à des fins linguistiques, comme par exemple l’utilisation de Mel Frequency Cepstral Coefficients (MFCC) et de Dynamic Time Warping (DTW) afin d’analyser la réalisation phonétique des phonèmes en les comparant à une référence.
Les analyses automatiques sur grands corpus ne pouvaient s’effectuer sans une vérification de la précision des

  1. corpus alignés automatiquement
  2. des analyses automatiques en comparaison avec des performances humaines.

Grâce à ces outils automatiques ou semi-automatiques, l’accès à des corpus oraux transcrits et annotés devient abordable. Encore faut-il vérifier que la précision de la segmentation (en phonèmes ou en mots) soit suffisante pour des études fines telles que celles réalisées en phonétique (sur le voisement, la durée des phonèmes par exemple). Le recours à des transcripteurs humains, si coûteux soit-il, pourrait s’avérer irremplaçable si le taux d’erreurs d’une analyse automatique s’avérait trop important. Nous avons effectué des comparaisons avec des mesures manuelles afin de confirmer et de préciser les cadres d’utilisation de corpus alignés et transcrits automatiquement pour des études phonétiques. Plusieurs de ces travaux sur grands corpus sont développés plus en détail dans l’axe 1.

Dans l’ANR DesPhoApaDy (2009-2012), nous avons une nouvelle fois mis en place une étroite collaboration entre les Sciences et Technologies de l’Information et de la Communication (STIC), notamment via le Laboratoire d’Informatique d’Avignon et ses compétences en Reconnaissance automatique de la parole et du locuteur. Les analyses acoustiques et perceptives effectuées par des experts humains ont permis de guider et améliorer les performances des systèmes de reconnaissance automatique de la parole lorsqu’ils sont confronté à de la parole très altérée, comme dans le cas des dysarthries étudiées dans ce projet.