Feedback

Faculté des Sciences appliquées
Faculté des Sciences appliquées
Mémoire
VIEW 217 | DOWNLOAD 41

Master's Thesis : Machine Learning Techniques for Money Laundering Detection

Télécharger
L'hoest, Julien ULiège
Promoteur(s) : Geurts, Pierre ULiège
Date de soutenance : 7-sep-2020/9-sep-2020 • URL permanente : http://hdl.handle.net/2268.2/10720
Détails
Titre : Master's Thesis : Machine Learning Techniques for Money Laundering Detection
Titre traduit : [fr] Techniques d'apprentissage automatique pour la détection du blanchiment d'argent
Auteur : L'hoest, Julien ULiège
Date de soutenance  : 7-sep-2020/9-sep-2020
Promoteur(s) : Geurts, Pierre ULiège
Membre(s) du jury : Louveaux, Quentin ULiège
Marée, Raphaël ULiège
Marcos, Alejandro 
Langue : Anglais
Nombre de pages : 99
Mots-clés : [en] money laundering
[en] machine learning
[en] imbalance problem
[en] data generation
[en] F1 score
[en] outlier detection
Discipline(s) : Ingénierie, informatique & technologie > Sciences informatiques
Institution(s) : Université de Liège, Liège, Belgique
Diplôme : Master : ingénieur civil en informatique, à finalité spécialisée en "management"
Faculté : Mémoires de la Faculté des Sciences appliquées

Résumé

[en] Some economic phenomena have a significant negative impact on financial institutions. Money laundering is one of them. Money laundering is the processing of illicit funds into the financial system to make them appeared from legitimate sources. It is usually detected through rule based monitoring. Unfortunately, it does not exploit the potential of data. Machine leaning approaches learn automatically from data patterns that cannot be captured by rule-based ones. Money laundering in transaction logs are defined as an imbalance problem with regard to machine learning. The challenge is to detect few fraudulent transactions over a huge population which compose a financial database.

This thesis presents the design of a simulator for transaction data generation to answer to the lack of available data needed for machine learning algorithms. Then a theoretical research has been done in order to identify machine learning algorithm designed for classification problem with skew class distribution. The machine learning models which have been selected from this research are the Hellinger Distance Decision Tree (HDDT), the Isolation Forest (iForest), the One-Class SVM (ocSVM) and an approach based on successive hypothesis testing using the Fisher, George and Pearson methods.

These approaches have been tested over synthetic data from the simulator. The model with the highest F1 score is a Random Forest composing of fully expended decision trees using the Gini split criterion. The second best performing model was the Isolation Forest.


Fichier(s)

Document(s)

File
Access master_thesis_s150703.pdf
Description:
Taille: 17.9 MB
Format: Adobe PDF

Annexe(s)

File
Access summary.pdf
Description:
Taille: 57.37 kB
Format: Adobe PDF

Auteur

  • L'hoest, Julien ULiège Université de Liège > Master ingé. civ. info., à fin.

Promoteur(s)

Membre(s) du jury

  • Louveaux, Quentin ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation : Optimisation discrète
    ORBi Voir ses publications sur ORBi
  • Marée, Raphaël ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Méthodes stochastiques
    ORBi Voir ses publications sur ORBi
  • Marcos, Alejandro
  • Nombre total de vues 217
  • Nombre total de téléchargements 41










Tous les documents disponibles sur MatheO sont protégés par le droit d'auteur et soumis aux règles habituelles de bon usage.
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.