Feedback

Faculté de Philosophie et Lettres
Faculté de Philosophie et Lettres
Mémoire

Évaluation linguistique de résultats de parsing syntaxique dépendanciel automatique (spaCy) d'un corpus de poèmes en prose de Pierre Reverdy

Télécharger
Beckers, Xavier ULiège
Promoteur(s) : Mazziotta, Nicolas ULiège
Date de soutenance : 16-jui-2022/25-jui-2022 • URL permanente : http://hdl.handle.net/2268.2/14775
Détails
Titre : Évaluation linguistique de résultats de parsing syntaxique dépendanciel automatique (spaCy) d'un corpus de poèmes en prose de Pierre Reverdy
Auteur : Beckers, Xavier ULiège
Date de soutenance  : 16-jui-2022/25-jui-2022
Promoteur(s) : Mazziotta, Nicolas ULiège
Membre(s) du jury : Purnelle, Gérald ULiège
Badir, Sémir ULiège
Langue : Français
Nombre de pages : 126
Mots-clés : [fr] Traitement Automatique des Langues
[fr] Parsing syntaxique
[fr] Évaluation linguistique
[fr] spaCy
[fr] Universal Dependencies
[fr] Pierre Reverdy
[fr] Grammaire dépendancielle
Discipline(s) : Arts & sciences humaines > Langues & linguistique
Public cible : Chercheurs
Professionnels du domaine
Etudiants
Institution(s) : Université de Liège, Liège, Belgique
Diplôme : Master en langues et lettres françaises et romanes, orientation générale, à finalité approfondie
Faculté : Mémoires de la Faculté de Philosophie et Lettres

Résumé

[fr] Ce travail a pour objectif de montrer l'intérêt d'une évaluation linguistique des résultats d'analyses syntaxiques effectuées par les modèles statistiques développés pour le Traitement Automatique des Langues (TAL), dans ce cas le modèle fr-dep-news-trf de spaCy. Nous montrons également l'intérêt de réaliser cette évaluation sur un corpus littéraire contenant de nombreuses difficultés syntaxiques, le recueil Flaques de verre de Pierre Reverdy. Dans un premier temps, nous réalisons une évaluation automatique des résultats pour situer les performances du modèle par rapport aux données déjà disponibles à son sujet. Nous analysons ensuite les erreurs individuellement selon divers paramètres linguistiques, notamment la cohérence, la longueur des dépendances et le flux de dépendance, puis dressons une typologie des erreurs selon des structures et fonctions syntaxiques. Nous montrons que l'analyse est perturbée par des particularités syntaxiques de notre corpus littéraire, mais également qu'elle semble être limitée par les règles d'annotation sélectionnées pour l'entrainement du modèle, Universal Dependencies. Enfin, nous terminons l'exposé par une discussion concernant l'intérêt du TAL pour les études littéraires, en particulier la stylistique.


Fichier(s)

Document(s)

File
Access BECKERS Xavier - TFE.pdf
Description:
Taille: 5.81 MB
Format: Adobe PDF

Annexe(s)

File
Access M.2 Paires.txt
Description:
Taille: 2.84 kB
Format: Text
File
Access M.3 Squelettes.xlsx
Description:
Taille: 78.18 kB
Format: Microsoft Excel XML
File
Access M.4 Reverdy - Prédiction.conllu
Description:
Taille: 135.31 kB
Format: Unknown
File
Access M.5 Reverdy - Correction.conllu
Description:
Taille: 137.57 kB
Format: Unknown
File
Access M.1 Visualisations des arbres.pdf
Description:
Taille: 26.45 MB
Format: Adobe PDF

Auteur

  • Beckers, Xavier ULiège Université de Liège > Master lang. & lettres fr. & rom., or. gén., à finalité

Promoteur(s)

Membre(s) du jury

  • Purnelle, Gérald ULiège Université de Liège - ULiège > Département de langues et littératures romanes > Poésie moderne et contemporaine de la LF
    ORBi Voir ses publications sur ORBi
  • Badir, Sémir ULiège Université de Liège - ULiège > Département de langues et littératures romanes > Sciences du langage - Rhétorique
    ORBi Voir ses publications sur ORBi








Tous les documents disponibles sur MatheO sont protégés par le droit d'auteur et soumis aux règles habituelles de bon usage.
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.