Automatic Abstractive Text Summarization : A deeper look into convolutional sequence-to-sequence networks

Automatic Abstractive Text Summarization : A deeper look into convolutional sequence-to-sequence networks

Vermeylen, Valentin

Date of defense : 6-Sep-2021/7-Sep-2021 • Permalink : `http://hdl.handle.net/2268.2/13292`

Details

Title :	Automatic Abstractive Text Summarization : A deeper look into convolutional sequence-to-sequence networks
Translated title :	[fr] Synthétisation Abstractive et Automatique de Textes : Un examen des réseaux séquence-vers-séquence convolutionnels
Author :	Vermeylen, Valentin
Date of defense :	6-Sep-2021/7-Sep-2021
Advisor(s) :	Ittoo, Ashwin Doloris, Samy
Committee's member(s) :	Fontaine, Pascal Gribomont, Pascal
Language :	English
Number of pages :	65
Keywords :	[en] abstractive summarization [en] convolutional sequence-to-sequence
Discipline(s) :	Engineering, computing & technology > Computer science
Funders :	NRB
Target public :	General public
Institution(s) :	Université de Liège, Liège, Belgique
Degree:	Master en ingénieur civil en informatique, à finalité spécialisée en "intelligent systems"
Faculty:	Master thesis of the Faculté des Sciences appliquées

Abstract

[en] As the amount of information produced everyday continually increases, the desire for summaries containing only the most salient parts of the texts continues to gain traction. Even though the possibility to extract parts of texts and gluing them together already exists, we usually prefer fluent, human-like summaries.

That is the concern of the Artificial Intelligence subfield of Automatic Abstractive Summarization. Although the task is typically solved using recurrent neural networks, that architecture comes with several challenges, the biggest being the amount of time and computational power required to train the models. Fortunately, another less computationally intensive paradigm exists, based on convolutional networks, even though it has not been as extensively studied.

This thesis is concerned with that convolutional framework, and explores questions and assumptions that have not been answered previously, such as the advantages and drawbacks of using pretrained embeddings, or the tradeoff between performance gains and the added complexity of mechanisms such as reinforcement learning or pointing-generation. Experiments about the abstractiveness of the models, their fine-tuning on a different dataset, and their ability to capture long-distanced dependencies are also performed through the use of both the CNN/DailyMail dataset, and the XSUM dataset.

Those experiments show that using more convolutional blocks in the model makes sense up to a certain point, that the use of pretrained embeddings is advisable, as is the use of the pointer-generator network implemented in this work. The use of reinforcement learning is also advisable at the end of the model training.

Finally, this thesis is concluded with additional experiments that could be implemented in future works, as well as practical advises regarding the use of abstractive summarization in the context of general terms and conditions summarization.

File(s)

Document(s)

Master_Thesis_Vermeylen_Valentin.pdf
Description:
Size: 1.47 MB
Format: Adobe PDF

Abstract_Vermeylen_Valentin.pdf
Description: Résumé
Size: 191.8 kB
Format: Adobe PDF

Cite this master thesis

All documents available on MatheO are protected by copyright and subject to the usual rules for fair use.
The University of Liège does not guarantee the scientific quality of these students' works or the accuracy of all the information they contain.

Nom	Provider / Domaine	Expiration	Description
JSESSIONID	Oracle Corporation www.uliege.be	Session	Cookie de session de plate-forme à usage général, utilisé par les sites écrits en JSP. Habituellement utilisé pour maintenir une session utilisateur anonyme par le serveur.
CookieScriptConsent	CookieScript .uliege.be	1 an	Ce cookie est utilisé par le service Cookie-Script.com pour mémoriser les préférences de consentement des visiteurs en matière de cookies. Il est nécessaire pour que la bannière de cookies Cookie-Script.com fonctionne correctement.

Nom	Provider / Domaine	Expiration	Description
_pk_id	InnoCraft Ltd .uliege.be	1 an	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_id est suivi d'une courte série de chiffres et de lettres, qui est censé être un code de référence pour le domaine définissant le cookie.
_pk_ses	InnoCraft Ltd .uliege.be	30 minutes	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ses est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.
_pk_ref	InnoCraft Ltd .uliege.be	6 mois	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ref est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.

MASTER THESIS

Automatic Abstractive Text Summarization : A deeper look into convolutional sequence-to-sequence networks

Vermeylen, Valentin

Promotor(s) : Ittoo, Ashwin ; Doloris, Samy

Date of defense : 6-Sep-2021/7-Sep-2021 • Permalink : http://hdl.handle.net/2268.2/13292

Details

Abstract

File(s)

Document(s)

Author

Promotor(s)

Committee's member(s)

Cite this master thesis

APA

Chicago

Date of defense : 6-Sep-2021/7-Sep-2021 • Permalink : `http://hdl.handle.net/2268.2/13292`