CNRS

Rechercher




Accueil > Recherche > Thématiques de Recherche > TAL et Phonétique / phonologie de corpus

Création et enrichissement de corpus

mis à jour le 6 octobre 2014

CREATION ET ENRICHISSEMENT DE CORPUS

Le laboratoire de Phonétique et Phonologie a été impliqué dans la création et l’enrichissement de corpus.

  • Corpus écrits et oraux : depuis quelques années, les corpus créés et déposés sur des sites publics tels que le Centre de Ressources pour la Description de l’Oral (CRDO) sont comptabilisés selon les critères de l’AERES. Ces corpus prennent toute leur importance en parole où les simples recueils et annotation de données prennent un temps considérable et peuvent être réutilisés avec grand intérêt par la communauté de parole.
  • ETAPE : apports de la linguistique (phonétique et syntaxe) pour l’amélioration de la reconnaissance automatique de la parole. L’implication de plusieurs communautés scientifiques, notamment du domaine des sciences humaines et sociales, l’enrichissement des annotations par des alignements phonétiques et des annotations syntaxiques ainsi que l’évaluation de tâches à la frontière entre traitement de la parole et traitement des langues sont autant de facteurs favorisant l’émergence d’axes de recherche transverses.
  • REVOIX  : Le projet REVOIX propose de réaliser une prothèse vocale susceptible de restituer leur voix d’origine aux personnes ayant perdu l’usage de la parole à la suite d’une laryngectomie totale ou partielle, ou d’une atteinte neurologique. Le rôle de l’équipe était notamment d’apporter les connaissances phonétiques pour constituer des corpus et mieux connaître les distributions réelles des segments en parole.