Langues du monde: Description et Modélisation

Le projet scientifique de cette nouvelle thématique « Langue du monde : description et modélisation » hérite en grande partie des recherches menées au sein des thématiques 1 & 3 respectivement « Typologie : phonétique et phonologie » et « Traitements et unités de représentation » du quinquennat en cours.

Nos actions futures s’inscriront dans cette nouvelle réorganisation et viseront à renforcer les liens entre modélisations phonologiques et approches empiriques et typologiques, ces liens sont d’ailleurs renforcées par l’arrivée de Didier Demolin (PR) dans l’actuel quinquennat. Elles seront centrées sur l’analyse phonétique et phonologique des langues du monde et la typologie des systèmes sonores, tant sur le plan segmental que prosodique, en alliant questionnements théoriques, perspective synchronique et approche diachronique, et en s’appuyant sur divers types de corpus et différentes techniques d’analyse expérimentale.

Si certaines langues (notamment les langues romanes, le berbère, les langues d’Amazonie et les langues bantoues) constitueront toujours des sources fondamentales dans nos analyses, l’ouverture vers d’autres langues sera poursuivie et renforcée. C’est le cas notamment de certaines langues sudarabiques modernes (suite aux collaborations dans le cadre du LabEx EFL), du japonais (suite à l’intégration d’un nouveau membre spécialiste de cette langue), ainsi que de certaines langues chinoises, du saami et du tigrinya (grâce aux travaux en cours de plusieurs doctorants).

Les divers projets (impulsés notamment par Rachid Ridouane et Annie Rialland) au sein de cette thématique proposent des contributions à la modélisation phonétique et phonologique en examinant la structure et le contenu des unités de représentation phonologique, telles que les traits, les tons, les phonèmes, et les syllabes. Pour donner quelques exemples, nous proposons durant ce quinquennat de créer un groupe de travail sur la « Typologie de la gémination consonantique », qui regroupera des membres pleins et des doctorants. Un aspect de ce projet est lié au fait que la gémination dans les langues du monde est, à quelques exceptions, limitée à une distinction binaire entre consonnes courtes et consonnes longues. Notre objectif est d’identifier et de comprendre comment des contraintes de nature linguistique (inventaire segmental, spécificités prosodiques, etc.) interagissent avec des contraintes intrinsèques au système de production (i.e. des contraintes articulatoires, acoustiques, et perceptives) pour façonner les hiérarchies temporelles entre catégories phonémiques dans les langues du monde. Les travaux sur le langage sifflé, en collaboration avec des membres du Labex Aslan, fournissent un autre exemple de recherches futures qui ouvriront une nouvelle perspective permettant de mieux comprendre ce registre spécialisé de la parole qui consiste à imiter la voix parlée en sifflements. Un dernier exemple concerne la poursuite des analyses automatisées des langues bantoues. Les résultats déjà obtenus pour le mbochi (avec l’aide de Martine Adda-Decker par exemple) permettent d’envisager à terme d’améliorer l’adaptation des systèmes de traitement automatique de la parole existants à des langues informatiquement « sous-dotées » et développer ainsi des ressources informatisées pour les langues peu ou pas décrites.
Les projets présentés au sein de cette thématique s’inscrivent tous dans le cadre de coopérations aussi bien sur le plan local (dans le cadre du labex EFL), national (notamment avec le labex Aslan), qu’international (e.g. avec NINJAL à Tokyo concernant nos travaux sur la gémination, avec certaines universités sud-américaines pour les langues d’Amazonie, etc.).