Présentation et contact
Je suis doctorante à l’Université Sorbonne Nouvelle – Paris 3 depuis 2018, sous la direction de Martine Adda-Decker et Kim Gerdes.
I’m a PhD student at University Sorbonne Nouvelle – Paris 3, supervised by Martine Adda-Decker and Kim Gerdes.
Contact :
Email : marine.courtin (at) sorbonne-nouvelle.fr
Adresse postale: Maison de la Recherche, 4 Rue des Irlandais, 75005 Paris
Github : @marinecourtin
Google scholar : Marine Courtin
Profil et recherches
Après une formation d’angliciste à l’Université Rennes 2 j’ai effectué le master plurital en Traitement Automatique des Langues (co-habilité par les Universités Paris 3, Nanterre et Inalco). Je m’intéresse à la syntaxe en dépendance et à la création d’outils permettant de faciliter le développement et l’exploitation de corpus annotés en syntaxe, ainsi qu’à la manière dont ces outils permettent de revisiter les théories syntaxiques. Ma thèse porte sur le développement de méthodes non-supervisées pour l’analyse syntaxique automatique de grands corpus.
Tags: Traitement Automatique des Langues; TAL; apprentissage non-supervisé; Syntaxe de dépendance; Corpus arborés; Linguistique outillée; Syntaxe de l’oral.
After my undegraduate degree in English at the University of Rennes 2 I pursued a master’s in Natural Language Processing (co-habilitated between the Universities of Paris 3, Nanterre and Inalco). My research interests are centered around dependency syntax, tools for treebank development, and thinking about how these tools provide a new and interesting way to revisit syntactic theories. I’m pursuing that line of work in my PhD which focusses on unsupervised syntactic structure discovery and parsing.
Tags: Natural Language Processing; Dependency Syntax; Computational Linguistics; Treebanks; Unsupervised Learning; Syntax of Spoken Languages.
Publications
Ján Mačutek, Radek Čech, Marine Courtin. The Menzerath-Altmann law in syntactic structure revisited: Combining linearity of language with dependency syntax. Proceedings of the Second Workshop on Quantitative Syntax (Quasy), SyntaxFest 2021. [code]
Courtin, Marine. Extraction de fragments syntaxiques en français à partir d’une mesure d’autonomie basée sur l’entropie. Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2: 23e REncontres jeunes Chercheurs en Informatique pour le TAL (RECITAL). 2021.
Xinying Chen, Kim Gerdes, Sylvain Kahane, Marine Courtin. The Co-Effect of Menzerath-Altmann Law and Heavy Constituent Shift in Natural Languages. Qualico 2021. (accepted)
Gaël Guibon, Marine Courtin, Kim Gerdes, Bruno Guillaume. (2020). When Collaborative Treebank Curation Meets Graph Grammars. Proceedings of The 12th Language Resources and Evaluation Conference (LREC), Marseille. [code] [demo website]
Courtin Marine, Yan Chunxiao. (2019). What can we learn from natural and artificial dependency trees. Proceedings of the First Workshop on Quantitative Syntax, SyntaxFest, Paris. [code] [slides]
Bernard Caron, Marine Courtin, Kim Gerdes and Sylvain Kahane. (2019). A Surface-Syntactic UD Treebank for Naija, Proceedings of the 17th international conference on Treebanks and Linguistic Theories (TLT), SyntaxFest, Paris. [slides]
Kahane Sylvain, Courtin Marine, Gerdes Kim. (2018). Multi-word annotation in syntactic treebanks: Propositions for Universal Dependencies, Proceedings of the 16th international conference on Treebanks and Linguistic Theories (TLT), Prague.
Courtin Marine, Caron Bernard, Gerdes Kim, Kahane Sylvain. (2018). Establishing a language by annotating a corpus: The case of Naija, a post-creole spoken in Nigeria, Proceedings of the workshop on Annotation in Digital Humanities (AnnDH), Sofia.
Mémoire de Master 2 : Mesures de distances syntaxiques entre langues à partir de treebanks. [annexe (scripts, tableaux de données, plots interactifs)]
Enseignement
- Linguistique de corpus (TD, L3) (2019-2020, 2020-2021)
- Prosodie & interfaces (TD, L2) (2019-2020, 2020-2021)