Master thesis : Generative AI methods to create comic strips

Master thesis : Generative AI methods to create comic strips

Charles, Romain

Date de soutenance : 26-jan-2024 • URL permanente : `http://hdl.handle.net/2268.2/19591`

Détails

Titre :	Master thesis : Generative AI methods to create comic strips
Titre traduit :	[fr] Méthodes d'IA générative pour créer des bandes dessinées
Auteur :	Charles, Romain
Date de soutenance :	26-jan-2024
Promoteur(s) :	Geurts, Pierre Roekens, Joachim
Membre(s) du jury :	Van Droogenbroeck, Marc Huynh-Thu, Vân Anh
Langue :	Anglais
Nombre de pages :	144
Discipline(s) :	Ingénierie, informatique & technologie > Sciences informatiques
Institution(s) :	Université de Liège, Liège, Belgique
Diplôme :	Master : ingénieur civil en science des données, à finalité spécialisée
Faculté :	Mémoires de la Faculté des Sciences appliquées

Résumé

[en] The recent surge in interest surrounding generative AI, particularly stable diffusion, highlights their transformative potential in creating realistic content across various domains, from images to text and music. These advancements promise to revolutionize content generation, opening up new creative possibilities. However, challenges persist, notably in ensuring high image quality and consistency.

The challenges addressed include generating minimally pixelated, high-resolution images swiftly, and maintaining consistency across characters, scenes, and style within comic panels. Achieving 100% consistency in stable diffusion remains elusive due to the inherent randomness in AI models trained on diverse datasets.

The research aims to create a tool enabling individuals with limited drawing skills to produce comics using generative AI. Key findings are presented, starting with an exploration of generative AI and stable diffusion, comparing older models with newer SDXL1.0 models, and selecting ComfyUI as the ideal user interface. The study delves into workflows, testing image generation for text-to-image, text-to-image with ControlNet, inpainting, and maintaining consistency through effective prompts.

The research explores alternative solutions, focusing on LoRAs for fine-tuning models and achieving both consistency and flexibility. Tests reveal LoRAs' potential in altering character appearances, generating cartoon-style images, and providing conclusive results for prompt-driven modifications. The integration of LoRAs into ComfyUI is discussed.

In conclusion, the research successfully achieves its primary objectives, showcasing the tool's capability to generate consistent, high-quality comic panels. Despite challenges, the findings contribute to advancing generative AI applications. The implications extend to potential uses in the creative industry, emphasizing the tool's adaptability and user-friendly nature.

Fichier(s)

Document(s)

master_thesis_s174788.pdf
Description:
Taille: 105 MB
Format: Adobe PDF

Citer ce mémoire

Tous les documents disponibles sur MatheO sont protégés par le droit d'auteur et soumis aux règles habituelles de bon usage.
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.

Nom	Provider / Domaine	Expiration	Description
JSESSIONID	Oracle Corporation www.uliege.be	Session	Cookie de session de plate-forme à usage général, utilisé par les sites écrits en JSP. Habituellement utilisé pour maintenir une session utilisateur anonyme par le serveur.
CookieScriptConsent	CookieScript .uliege.be	1 an	Ce cookie est utilisé par le service Cookie-Script.com pour mémoriser les préférences de consentement des visiteurs en matière de cookies. Il est nécessaire pour que la bannière de cookies Cookie-Script.com fonctionne correctement.

Nom	Provider / Domaine	Expiration	Description
_pk_id	InnoCraft Ltd .uliege.be	1 an	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_id est suivi d'une courte série de chiffres et de lettres, qui est censé être un code de référence pour le domaine définissant le cookie.
_pk_ses	InnoCraft Ltd .uliege.be	30 minutes	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ses est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.
_pk_ref	InnoCraft Ltd .uliege.be	6 mois	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ref est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.

Mémoire

Master thesis : Generative AI methods to create comic strips

Charles, Romain

Promoteur(s) : Geurts, Pierre ; Roekens, Joachim

Date de soutenance : 26-jan-2024 • URL permanente : http://hdl.handle.net/2268.2/19591

Détails

Résumé

Fichier(s)

Document(s)

Auteur

Promoteur(s)

Membre(s) du jury

Citer ce mémoire

APA

Chicago

Date de soutenance : 26-jan-2024 • URL permanente : `http://hdl.handle.net/2268.2/19591`