CNRS

Rechercher




Accueil > Annuaire > Adda-Decker Martine

[hal-01135042] Une étude quantitative des marqueurs discursifs, disfluences et chevauchements de parole dans des interviews politiques

À l’interface entre linguistique de corpus et traitement automatique, le travail présenté ici vise à éclairer les différences relevant de la variation diamésique, entre oral et transcriptions écrites à différents niveaux d’élaboration. Un corpus d’interviews télévisées a été utilisé (une dizaine d’émissions de L’heure de vérité), impliquant des journalistes et des hommes politiques ou des personnalités représentant la société civile. Les transcriptions bona fide réalisées à destination de la presse (où la plupart des disfluences et marqueurs discursifs ainsi que les chevauchements de parole ont été éliminés) ont été alignées avec les transcriptions fournies par un système de reconnaissance de la parole, facilitant la production de transcriptions verbatim où tous les événements audibles (y compris la parole superposée) ont été transcrits manuellement. Trois types de disfluences (les hésitations, les répétitions et les faux départs) ont été distingués et annotés, de même que les marqueurs discursifs. Ces derniers, ainsi que chaque type de disfluences, représentent environ 2 % des mots du corpus hors chevauchements de parole (8 % au total). Ils ont été analysés par type d’énoncé, de locuteur (selon le statut journaliste/invité) et de patrons les plus fréquents. Les chevauchements de parole ont également été annotés manuellement au moyen de quatre étiquettes, pour les régulateurs ou backchannels du type hmm, pour les prises de parole (avec interruption claire d’un locuteur par un autre), pour les anticipations de tour de parole (quand le locuteur qui intervient semble percevoir que son interlocuteur a terminé) et pour les chevauchements complémentaires (commentaires ou énoncés qui se suffisent à eux-mêmes, où le locuteur qui intervient ne prend pas la parole pour développer une argumentation). L’interaction entre chevauchements de parole, disfluences et marqueurs discursifs a ensuite été étudiée, et les taux d’occurrences observés ont été mis en relation avec le rôle des locuteurs. Les chevauchements de parole sont assez fréquents (en moyenne 3–4 par minute), même s’ils sont de courte durée (5 % des données), les chevauchements non-intrusifs comme les régulateurs de type hmm étant plus courts que les chevauchements intrusifs comme les prises de parole. Les disfluences sont deux fois plus nombreuses en parole superposée qu’en parole non-superposée : les répétitions, en particulier, sont concernées au premier chef. Enfin, des différences intéressantes ont été relevées entre les comportements actifs/passifs (de celui qui prend ou qui a la parole) des journalistes et des invités.

Voir en ligne : https://hal.archives-ouvertes.fr/ha...