Feedback

Faculté des Sciences appliquées
Faculté des Sciences appliquées
Mémoire
VIEW 30 | DOWNLOAD 10

Balancing Durability, Performance, and Interpretability in Unbalanced Data as Fraud Detection

Télécharger
Saulas, Adrien ULiège
Promoteur(s) : Debruyne, Christophe ULiège
Date de soutenance : 5-sep-2024/6-sep-2024 • URL permanente : http://hdl.handle.net/2268.2/21035
Détails
Titre : Balancing Durability, Performance, and Interpretability in Unbalanced Data as Fraud Detection
Titre traduit : [fr] Équilibrer la durabilité, la performance et l'interprétabilité dans les données déséquilibrées pour la détection de la fraude
Auteur : Saulas, Adrien ULiège
Date de soutenance  : 5-sep-2024/6-sep-2024
Promoteur(s) : Debruyne, Christophe ULiège
Membre(s) du jury : Geurts, Pierre ULiège
Louppe, Gilles ULiège
Langue : Anglais
Nombre de pages : 111
Mots-clés : [en] MLOps
[en] Machine Learning
[en] Fraud detection
[en] Imbalance
[en] Interpretability
Discipline(s) : Ingénierie, informatique & technologie > Sciences informatiques
Organisme(s) subsidiant(s) : Intech S.A
Public cible : Autre
Institution(s) : Université de Liège, Liège, Belgique
Diplôme : Master : ingénieur civil en science des données, à finalité spécialisée
Faculté : Mémoires de la Faculté des Sciences appliquées

Résumé

[en] The problem of fraud detection is one of the most discussed topics in the field of
machine learning. This study addresses four key areas essential for a fraud detection
platform: prediction accuracy in imbalanced datasets, interpretability of predictions,
deployment and sustainability of the platform, monetary costs associated with model
errors. To tackle these issues, we first conducted extensive research in the field,
then proposed and evaluated our solutions. We introduce methods such as using a
WCGAN (Wasserstein Conditional Generative Adversarial Network) for sampling
or cost-sensitive learning with new models like Light Gradient Boosting, employing
interpretable models like Explainable Boosting, deploying and automating training
processes with Kubernetes and Kubeflow, and utilizing approaches like thresholding
or tuning metrics that account for monetary costs. Each of these solutions shows
promising results and improves upon existing research in the field.


Fichier(s)

Document(s)

File
Access TFE_SAULAS_ADRIEN-1-70.pdf
Description:
Taille: 5.62 MB
Format: Adobe PDF
File
Access TFE_resume_SAULAS_Adrien.pdf
Description:
Taille: 485.46 kB
Format: Adobe PDF

Annexe(s)

File
Access TFE_SAULAS_ADRIEN-71-111.pdf
Description:
Taille: 6.56 MB
Format: Adobe PDF

Auteur

  • Saulas, Adrien ULiège Université de Liège > Mast. ing. civ. sc. don. fin. spéc.

Promoteur(s)

Membre(s) du jury

  • Geurts, Pierre ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Algorith. des syst. en interaction avec le monde physique
    ORBi Voir ses publications sur ORBi
  • Louppe, Gilles ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Big Data
    ORBi Voir ses publications sur ORBi
  • Nombre total de vues 30
  • Nombre total de téléchargements 10










Tous les documents disponibles sur MatheO sont protégés par le droit d'auteur et soumis aux règles habituelles de bon usage.
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.