Évaluation linguistique de résultats de parsing syntaxique dépendanciel automatique (spaCy) d'un corpus de poèmes en prose de Pierre Reverdy
Beckers, Xavier
Promoteur(s) :
Mazziotta, Nicolas
Date de soutenance : 16-jui-2022/25-jui-2022 • URL permanente : http://hdl.handle.net/2268.2/14775
Détails
| Titre : | Évaluation linguistique de résultats de parsing syntaxique dépendanciel automatique (spaCy) d'un corpus de poèmes en prose de Pierre Reverdy |
| Auteur : | Beckers, Xavier
|
| Date de soutenance : | 16-jui-2022/25-jui-2022 |
| Promoteur(s) : | Mazziotta, Nicolas
|
| Membre(s) du jury : | Purnelle, Gérald
Badir, Sémir
|
| Langue : | Français |
| Nombre de pages : | 126 |
| Mots-clés : | [fr] Traitement Automatique des Langues [fr] Parsing syntaxique [fr] Évaluation linguistique [fr] spaCy [fr] Universal Dependencies [fr] Pierre Reverdy [fr] Grammaire dépendancielle |
| Discipline(s) : | Arts & sciences humaines > Langues & linguistique |
| Public cible : | Chercheurs Professionnels du domaine Etudiants |
| Institution(s) : | Université de Liège, Liège, Belgique |
| Diplôme : | Master en langues et lettres françaises et romanes, orientation générale, à finalité approfondie |
| Faculté : | Mémoires de la Faculté de Philosophie et Lettres |
Résumé
[fr] Ce travail a pour objectif de montrer l'intérêt d'une évaluation linguistique des résultats d'analyses syntaxiques effectuées par les modèles statistiques développés pour le Traitement Automatique des Langues (TAL), dans ce cas le modèle fr-dep-news-trf de spaCy. Nous montrons également l'intérêt de réaliser cette évaluation sur un corpus littéraire contenant de nombreuses difficultés syntaxiques, le recueil Flaques de verre de Pierre Reverdy. Dans un premier temps, nous réalisons une évaluation automatique des résultats pour situer les performances du modèle par rapport aux données déjà disponibles à son sujet. Nous analysons ensuite les erreurs individuellement selon divers paramètres linguistiques, notamment la cohérence, la longueur des dépendances et le flux de dépendance, puis dressons une typologie des erreurs selon des structures et fonctions syntaxiques. Nous montrons que l'analyse est perturbée par des particularités syntaxiques de notre corpus littéraire, mais également qu'elle semble être limitée par les règles d'annotation sélectionnées pour l'entrainement du modèle, Universal Dependencies. Enfin, nous terminons l'exposé par une discussion concernant l'intérêt du TAL pour les études littéraires, en particulier la stylistique.
Fichier(s)
Document(s)
Annexe(s)
Citer ce mémoire
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.

Master Thesis Online


Tous les fichiers (archive ZIP)
BECKERS Xavier - TFE.pdf