Feedback

Faculté des Sciences appliquées
Faculté des Sciences appliquées
Mémoire

Automated Generation of Impactful Text Formatting Using Large Language Models

Télécharger
La Rocca, Lionel ULiège
Promoteur(s) : Louppe, Gilles ULiège
Date de soutenance : 30-jui-2025/1-jui-2025 • URL permanente : http://hdl.handle.net/2268.2/23373
Détails
Titre : Automated Generation of Impactful Text Formatting Using Large Language Models
Titre traduit : [fr] Génération automatisée de mise en forme impactante de textes à l'aide de grands modèles de langage
Auteur : La Rocca, Lionel ULiège
Date de soutenance  : 30-jui-2025/1-jui-2025
Promoteur(s) : Louppe, Gilles ULiège
Membre(s) du jury : Mahiat, Nicolas 
Wehenkel, Louis ULiège
Boigelot, Bernard ULiège
Langue : Anglais
Discipline(s) : Ingénierie, informatique & technologie > Sciences informatiques
URL complémentaire : https://bitbucket.org/nmahiat/zeiko-ai/src/dev/
Institution(s) : Université de Liège, Liège, Belgique
Diplôme : Master en sciences informatiques, à finalité spécialisée en "management"
Faculté : Mémoires de la Faculté des Sciences appliquées

Résumé

[en] This master's thesis aims to develop an automated system for generating structured and visually impactful content for Zeiko, a Belgian start-up that offers a software for interactive document creation. The project addresses the need for a solution that helps Zeiko’s users transform long and unstructured textual content into concise, structured, and visually engaging formats compatible with Zeiko's software.

The proposed solution uses large language models to analyze and summarize input text while preserving coherence and key elements. A central component of the system is a fine-tuned Mistral 7B model, trained specifically for structured JSON generation. This model extracts key information such as titles, summaries, and highlights from unstructured text, and returns a structured JSON designed for infographic templates.

The fine-tuning process was managed using custom datasets and its effectiveness was validated through evaluations. The generated outputs are mapped into predefined infographic templates known as z-blocks, a format specific to the company. Additionally, a complementary management platform was developed to allow Zeiko’s design team to deploy new templates with associated metadata.

The entire solution is deployed on Google Cloud using Docker and Kubernetes to ensure scalability and reliability. Evaluations demonstrate that the system significantly improves the speed and consistency of content creation. It also confirms that fine-tuning models like Mistral 7B is an effective method for extracting and structuring information from raw text, providing a practical tool to simplify document production.


Fichier(s)

Document(s)

File
Access summary.pdf
Description:
Taille: 35.68 kB
Format: Adobe PDF
File
Access Masterthesis.pdf
Description:
Taille: 8.15 MB
Format: Adobe PDF

Auteur

  • La Rocca, Lionel ULiège Université de Liège > Master sc. inform. fin. spéc. manag.

Promoteur(s)

Membre(s) du jury

  • Mahiat, Nicolas
  • Wehenkel, Louis ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Méthodes stochastiques
    ORBi Voir ses publications sur ORBi
  • Boigelot, Bernard ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Informatique
    ORBi Voir ses publications sur ORBi








Tous les documents disponibles sur MatheO sont protégés par le droit d'auteur et soumis aux règles habituelles de bon usage.
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.