Balancing Durability, Performance, and Interpretability in Unbalanced Data as Fraud Detection
Saulas, Adrien
Promoteur(s) : Debruyne, Christophe
Date de soutenance : 5-sep-2024/6-sep-2024 • URL permanente : http://hdl.handle.net/2268.2/21035
Détails
Titre : | Balancing Durability, Performance, and Interpretability in Unbalanced Data as Fraud Detection |
Titre traduit : | [fr] Équilibrer la durabilité, la performance et l'interprétabilité dans les données déséquilibrées pour la détection de la fraude |
Auteur : | Saulas, Adrien |
Date de soutenance : | 5-sep-2024/6-sep-2024 |
Promoteur(s) : | Debruyne, Christophe |
Membre(s) du jury : | Geurts, Pierre
Louppe, Gilles |
Langue : | Anglais |
Nombre de pages : | 111 |
Mots-clés : | [en] MLOps [en] Machine Learning [en] Fraud detection [en] Imbalance [en] Interpretability |
Discipline(s) : | Ingénierie, informatique & technologie > Sciences informatiques |
Organisme(s) subsidiant(s) : | Intech S.A |
Public cible : | Autre |
Institution(s) : | Université de Liège, Liège, Belgique |
Diplôme : | Master : ingénieur civil en science des données, à finalité spécialisée |
Faculté : | Mémoires de la Faculté des Sciences appliquées |
Résumé
[en] The problem of fraud detection is one of the most discussed topics in the field of
machine learning. This study addresses four key areas essential for a fraud detection
platform: prediction accuracy in imbalanced datasets, interpretability of predictions,
deployment and sustainability of the platform, monetary costs associated with model
errors. To tackle these issues, we first conducted extensive research in the field,
then proposed and evaluated our solutions. We introduce methods such as using a
WCGAN (Wasserstein Conditional Generative Adversarial Network) for sampling
or cost-sensitive learning with new models like Light Gradient Boosting, employing
interpretable models like Explainable Boosting, deploying and automating training
processes with Kubernetes and Kubeflow, and utilizing approaches like thresholding
or tuning metrics that account for monetary costs. Each of these solutions shows
promising results and improves upon existing research in the field.
Fichier(s)
Document(s)
Annexe(s)
Citer ce mémoire
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.