Publications
2024
- Alice Millour, Lorenza Brasile, Alberto Ghia, and Laurent Kevers. 2024. Agettivu, Aggitivu o Aghjettivu? POS Tagging Corsican Dialects. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pages 600–608, Torino, Italia. ELRA and ICCL. →
- Alice Millour, Yoann Dupont, Karen Fort, and Liam Duignan. 2024. Unveiling Strengths and Weaknesses of NLP Systems Based on a Rich Evaluation Corpus: The Case of NER in French. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pages 17217–17224, Torino, Italia. ELRA and ICCL. →
2023
- Marina Seghier, Alice Millour, Jean-Yves Antoine. Descripteurs Linguistiques et Caractérisation Objective des Catégories Textuelles. 5èmes journées du Groupement de Recherche CNRS « Linguistique Informatique, Formelle et de Terrain », GdR LIFT, CNRS, Nov 2023, Nancy, France. pp.106-112.
2022
- Laurent Kevers, Alice Millour. Réalisations, obstacles et perspectives pour l’outillage du corse. Journées Jointes des Groupements de Recherche Linguistique Informatique, Formelle et de Terrain (LIFT) et Traitement Automatique des Langues (TAL), novembre 2022, Marseille, France. pp.154-161.
- Alice Millour, Yoann Dupont, Alexane Jouglar, Karën Fort. FENEC : un corpus à échantillons équilibrés pour l’évaluation des entités nommées en français. Actes de la 29e conférence sur le Traitement Automatique des Langues Naturelles (TALN), juin 2022, Avignon, France
2021
- Yoann Dupont, Carlos-Emiliano González-Gallardo, Gaël Lejeune, Alice Millour, Jean-Baptiste Tanguy. QUEER@DEFT2021 : Identification du Profil Clinique de Patients et Notation Automatique de Copies d’Étudiants (QUEER@DEFT2021 : Patients Clinical Profile Identification and Automatic Student Grading), Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Atelier DÉfi Fouille de Textes (DEFT)
2020
- Alice Millour, Karën Fort and Pierre Magistry. Répliquer et étendre pour l’alsacien “Étiquetage en parties du discours de langues peu dotées par spécialisation des plongements lexicaux”. ETeRNAL 2, Atelier de JEP-TALN-RECITAL 2020, June 2020, JEP-TALN-RECITAL 2020, Nancy, France →
- Alice Millour and Karën Fort. Text Corpora and the Challenge of Newly Written Languages. 1st Joint SLTU and CCURL Workshop (SLTU-CCURL 2020), May 2020, Marseille, France (canceled) →
- Alice Millour and Karën Fort. Sciences participatives et diversité linguistique : retours d’expériences In revue Culture et Recherche, vol. 140, ministère de la Culture, France, hiver 2019-2020, 104 pages. Dossier conçu et coordonné par les membres du réseau Particip-Arc. →
- Lionel Nicolas, Verena Lyding, Claudia Borg, Corina Forascu, Karën Fort, Katerina Zdravkova, Iztok Kosem, Jaka Čibej, Špela Arhar Holdt, Alice Millour, Alexander König, Christos Rodosthenous, Federico Sangati, Umair ul Hassan, Anisia Katinskaia, Anabela Barreiro and Yaakov HaCohen-Kerner. A Generic Approach for Mass-Producing Language Resources by Combining Implicit Crowdsourcing and Language Learning. LREC 2020, May 11-16, Marseille, France (canceled) →
2019
- Alice Millour and Karën Fort. Production participative de ressources linguistiques variées pour l’alsacien, New Ways of Analyzing Dialectal Variation (NWADV_2019), November 21-23, Paris, France
- Alice Millour and Karën Fort. Unsupervised Data Augmentation for Less-Resourced Languages with no Standardized Spelling. RANLP 2019, September 02-04, Varna, Bulgaria →
- Alice Millour, Marianne Grace Araneta, Ivana Lazić Konjik, Annalisa Raffone, Yann-Alan Pilatte and Karën Fort. Katana and Grand Guru: a Game of the Lost Words. 9th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, May 17-19, 2019, Poznań, Poland. →
- Alice Millour. Getting to Know the Speakers: a Survey of a Non-Standardized Language Digital Use. 9th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, May 17-19, 2019, Poznań, Poland. →
2018
- Alice Millour and Karën Fort. À l’écoute des locuteurs : production participative de ressources langagières pour des langues non standardisées. Revue TAL, numéro spécial traitement automatique des langues peu dotées, 59-3. →
- Alice Millour, Karën Fort, Krik: First Steps into Crowdsourcing POS tags for Kréyòl Gwadloupéyen, Proc. of the LREC workshop CCURL 2018, Miyazaki, Japan, May 2018. →
- Alice Millour, Karën Fort, Toward a Lightweight Solution for Less-resourced Languages: Creating a POS Tagger for Alsatian Using Voluntary Crowdsourcing, Language Resources and Evaluation Conference (LREC), Miyazaki, Japan, May 2018. →
2017
- Alice Millour, Karën Fort, Delphine Bernhard et Lucie Steiblé. Vers une solution légère de production de données pour le TAL : création d’un tagger de l’alsacien par crowdsourcing bénévole. Actes de Traitement Automatique des Langues Naturelles (TALN), Orléans, France, juin 2017- Présentation orale. →
- Alice Millour and Karën Fort. Why do we Need Games? Analysis of the Participation on a Crowdsourcing Annotation Platform. Symposium Games4NLP, Valencia, Spain, April 2017. →
- 26 avril : Séminaire invité «Recherches linguistiques et corpus» organisé par Franck Neveu à l’Université Paris Sorbonne : « Construire un corpus annoté pour une langue peu dotée : annotation collaborative en partie du discours d’un corpus de l’alsacien.»
2016