Évaluation linguistique de résultats de parsing syntaxique dépendanciel automatique (spaCy) d'un corpus de poèmes en prose de Pierre Reverdy
Beckers, Xavier
Promotor(s) :
Mazziotta, Nicolas
Date of defense : 16-Jun-2022/25-Jun-2022 • Permalink : http://hdl.handle.net/2268.2/14775
Details
Title : | Évaluation linguistique de résultats de parsing syntaxique dépendanciel automatique (spaCy) d'un corpus de poèmes en prose de Pierre Reverdy |
Author : | Beckers, Xavier ![]() |
Date of defense : | 16-Jun-2022/25-Jun-2022 |
Advisor(s) : | Mazziotta, Nicolas ![]() |
Committee's member(s) : | Purnelle, Gérald ![]() Badir, Sémir ![]() |
Language : | French |
Number of pages : | 126 |
Keywords : | [fr] Traitement Automatique des Langues [fr] Parsing syntaxique [fr] Évaluation linguistique [fr] spaCy [fr] Universal Dependencies [fr] Pierre Reverdy [fr] Grammaire dépendancielle |
Discipline(s) : | Arts & humanities > Languages & linguistics |
Target public : | Researchers Professionals of domain Student |
Institution(s) : | Université de Liège, Liège, Belgique |
Degree: | Master en langues et lettres françaises et romanes, orientation générale, à finalité approfondie |
Faculty: | Master thesis of the Faculté de Philosophie et Lettres |
Abstract
[fr] Ce travail a pour objectif de montrer l'intérêt d'une évaluation linguistique des résultats d'analyses syntaxiques effectuées par les modèles statistiques développés pour le Traitement Automatique des Langues (TAL), dans ce cas le modèle fr-dep-news-trf de spaCy. Nous montrons également l'intérêt de réaliser cette évaluation sur un corpus littéraire contenant de nombreuses difficultés syntaxiques, le recueil Flaques de verre de Pierre Reverdy. Dans un premier temps, nous réalisons une évaluation automatique des résultats pour situer les performances du modèle par rapport aux données déjà disponibles à son sujet. Nous analysons ensuite les erreurs individuellement selon divers paramètres linguistiques, notamment la cohérence, la longueur des dépendances et le flux de dépendance, puis dressons une typologie des erreurs selon des structures et fonctions syntaxiques. Nous montrons que l'analyse est perturbée par des particularités syntaxiques de notre corpus littéraire, mais également qu'elle semble être limitée par les règles d'annotation sélectionnées pour l'entrainement du modèle, Universal Dependencies. Enfin, nous terminons l'exposé par une discussion concernant l'intérêt du TAL pour les études littéraires, en particulier la stylistique.
File(s)
Document(s)
Annexe(s)
Cite this master thesis
APA
Beckers, X. (2022). Évaluation linguistique de résultats de parsing syntaxique dépendanciel automatique (spaCy) d'un corpus de poèmes en prose de Pierre Reverdy. (Unpublished master's thesis). Université de Liège, Liège, Belgique. Retrieved from https://matheo.uliege.be/handle/2268.2/14775
Chicago
The University of Liège does not guarantee the scientific quality of these students' works or the accuracy of all the information they contain.