Feedback

Faculté de Philosophie et Lettres
Faculté de Philosophie et Lettres
MASTER THESIS
VIEW 68 | DOWNLOAD 215

Évaluation linguistique de résultats de parsing syntaxique dépendanciel automatique (spaCy) d'un corpus de poèmes en prose de Pierre Reverdy

Download
Beckers, Xavier ULiège
Promotor(s) : Mazziotta, Nicolas ULiège
Date of defense : 16-Jun-2022/25-Jun-2022 • Permalink : http://hdl.handle.net/2268.2/14775
Details
Title : Évaluation linguistique de résultats de parsing syntaxique dépendanciel automatique (spaCy) d'un corpus de poèmes en prose de Pierre Reverdy
Author : Beckers, Xavier ULiège
Date of defense  : 16-Jun-2022/25-Jun-2022
Advisor(s) : Mazziotta, Nicolas ULiège
Committee's member(s) : Purnelle, Gérald ULiège
Badir, Sémir ULiège
Language : French
Number of pages : 126
Keywords : [fr] Traitement Automatique des Langues
[fr] Parsing syntaxique
[fr] Évaluation linguistique
[fr] spaCy
[fr] Universal Dependencies
[fr] Pierre Reverdy
[fr] Grammaire dépendancielle
Discipline(s) : Arts & humanities > Languages & linguistics
Target public : Researchers
Professionals of domain
Student
Institution(s) : Université de Liège, Liège, Belgique
Degree: Master en langues et lettres françaises et romanes, orientation générale, à finalité approfondie
Faculty: Master thesis of the Faculté de Philosophie et Lettres

Abstract

[fr] Ce travail a pour objectif de montrer l'intérêt d'une évaluation linguistique des résultats d'analyses syntaxiques effectuées par les modèles statistiques développés pour le Traitement Automatique des Langues (TAL), dans ce cas le modèle fr-dep-news-trf de spaCy. Nous montrons également l'intérêt de réaliser cette évaluation sur un corpus littéraire contenant de nombreuses difficultés syntaxiques, le recueil Flaques de verre de Pierre Reverdy. Dans un premier temps, nous réalisons une évaluation automatique des résultats pour situer les performances du modèle par rapport aux données déjà disponibles à son sujet. Nous analysons ensuite les erreurs individuellement selon divers paramètres linguistiques, notamment la cohérence, la longueur des dépendances et le flux de dépendance, puis dressons une typologie des erreurs selon des structures et fonctions syntaxiques. Nous montrons que l'analyse est perturbée par des particularités syntaxiques de notre corpus littéraire, mais également qu'elle semble être limitée par les règles d'annotation sélectionnées pour l'entrainement du modèle, Universal Dependencies. Enfin, nous terminons l'exposé par une discussion concernant l'intérêt du TAL pour les études littéraires, en particulier la stylistique.


File(s)

Document(s)

File
Access BECKERS Xavier - TFE.pdf
Description:
Size: 5.81 MB
Format: Adobe PDF

Annexe(s)

File
Access M.2 Paires.txt
Description:
Size: 2.84 kB
Format: Text
File
Access M.3 Squelettes.xlsx
Description:
Size: 78.18 kB
Format: Microsoft Excel XML
File
Access M.4 Reverdy - Prédiction.conllu
Description:
Size: 135.31 kB
Format: Unknown
File
Access M.5 Reverdy - Correction.conllu
Description:
Size: 137.57 kB
Format: Unknown
File
Access M.1 Visualisations des arbres.pdf
Description:
Size: 26.45 MB
Format: Adobe PDF

Author

  • Beckers, Xavier ULiège Université de Liège > Master lang. & lettres fr. & rom., or. gén., à finalité

Promotor(s)

Committee's member(s)

  • Purnelle, Gérald ULiège Université de Liège - ULiège > Département de langues et littératures romanes > Poésie moderne et contemporaine de la LF
    ORBi View his publications on ORBi
  • Badir, Sémir ULiège Université de Liège - ULiège > Département de langues et littératures romanes > Sciences du langage - Rhétorique
    ORBi View his publications on ORBi
  • Total number of views 68
  • Total number of downloads 215










All documents available on MatheO are protected by copyright and subject to the usual rules for fair use.
The University of Liège does not guarantee the scientific quality of these students' works or the accuracy of all the information they contain.