Past Session
Thursday, October 30, 2025
12:15h

Identification d’argument : identifier des segments sémantiques avec Qwen, sur la base du “grand débat”

Abstract

Nous analysons 87 562 contributions du Grand Débat National sur la transition écologique, en focalisant l’étude sur la question ouverte “Que faites‑vous pour protéger l’environnement ?” et leur variation selon le type de commune. Au cœur du projet, nous concevons un pipeline NLP rule‑based avec spaCy (tokenisation/lemmatisation) et extraction d’expressions multi‑mots par patrons syntaxiques (NOM+ADJ, VERBE+OBJ), complété par TF‑IDF, co‑occurrences et analyse de tonalité. Cette approche met en évidence des “signatures thématiques” territoriales robustes et interprétables. Des LLM viendront enrichir le pipeline (normalisation/synthèse, codage thématique assisté).

About this workshop

The aim of this workshop is to promote technical and practical exchanges between researchers who use NLP methods. There is no hesitation in detailing the code (r/python), sharing tips, and discovering new methods and models.

Periodicity: Thursdays from 12h15 to 13h30, by videoconference.