Accueil > Recherche > Projets / Contrats > Projets / Contrats en cours > ANR SALSA

SALSA

Technologies de la parole et des langues pour des applications de sécurité

Responsable LPP : Martine Adda Decker

Projet financé par l’ANR Programme Liberté et protection des citoyens et des résidents (DS0901) 2014

Durée du projet : 2014-2016 (48 mois)

L’objectif du projet SALSA (Technologies de la parole pour des applications de sécurité) est de développer un ensemble d’outils de traitement du langage et de la parole spécifiquement étudiés pour assister les analystes en charge de l’exploitation des données audio dans un cadre judiciaire ou de lutte contre le terrorisme et la criminalité.

Le consortium SALSA est composé d’une part de 4 partenaires technologiques ayant des expertises complémentaires et reconnues dans leurs domaines respectifs et d’autre part d’un comité de suivi comprenant 3 partenaires utilisateurs. Le coordinateur, Vocapia Research (www.vocapia.com), est un éditeur de logiciels spécialisé dans le traitement de la parole. Le LIMSI-CNRS (Centre National de la Recherche Scientifique - Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur) apporte son expertise reconnue dans le domaine du traitement du langage parlé. Le LPP (Laboratoire de Phonétique et de Phonologie), unité mixte de recherche CNRS-Paris 3 en sciences humaines, apportera au projet ses compétences en phonétique acoustique et articulatoire pour la caractérisation des langues et des accents. Le quatrième partenaire, Intelligences est spécialisé dans l’utilisation des technologies du langage dans le cadre d’enquêtes judiciaires et apportera au projet les connaissances opérationnelles nécessaires. Le comité de suivi est composé de la DGA, de la DGPN et du ST(SI)2, ce dernier fédérant les besoins de la DCPJ, de l’IRCGN, de l’OCRIEST, de la PP et de la PTS. Ce comité de suivi veillera à ce que le projet SALSA couvre le large spectre des besoins de ces différentes organismes qui doivent être en mesure d’exploiter des quantités très importantes d’enregistrements audio dans de multiples langues.

Le filtrage des données audio est critique pour la sécurité nationale, qui doit assurer la protection des citoyens ; c’est aussi un besoin stratégique pour beaucoup d’agences gouvernementales. Dans le cadre du projet SALSA, les technologies de traitement de la langue actuellement à l’état de l’art seront améliorées afin de développer des aides pour les analystes, aujourd’hui dans l’incapacité de traiter des volumes de données qui augmentent exponentiellement. Les principaux objectifs du projet sont d’améliorer l’efficacité des analyses tout en réduisant leur charge de travail. Dans ce but, seront explorées les innovations techniques suivantes : réduction du coût de développement des systèmes ; adaptation des modèles pour cibler des besoins spécifiques des utilisateurs ; développement de technologies gérant les changements de langue dans les enregistrements ; création d’une interface pour l’analyse des données audio dans les applications de sécurité. Les utilisateurs finaux seront impliqués dans la boucle de développement et d’évaluation afin d’assurer l’adéquation avec leurs besoins.