
Faculté des Sciences appliquées
Faculté des Sciences appliquées

Master thesis : On the Design and Implementation of an ETL Configuration DSL for Non-programming Experts

Duchateau, Jakub ULiège
Promotor(s) : Debruyne, Christophe ULiège ; Duquenne, Frédéric
Date of defense : 26-Jun-2023/27-Jun-2023 • Permalink :
Title : Master thesis : On the Design and Implementation of an ETL Configuration DSL for Non-programming Experts
Author : Duchateau, Jakub ULiège
Date of defense  : 26-Jun-2023/27-Jun-2023
Advisor(s) : Debruyne, Christophe ULiège
Duquenne, Frédéric 
Committee's member(s) : Fontaine, Pascal ULiège
Boigelot, Bernard ULiège
Language : English
Keywords : [en] ETL
[en] Extract-Transform-Load
[en] Domain Specific Language
[en] DSL
[en] Design
[en] Usability
Discipline(s) : Engineering, computing & technology > Computer science
Funders : FundProcess
Complementary URL :
Institution(s) : Université de Liège, Liège, Belgique
Degree: Master en sciences informatiques, à finalité spécialisée en "computer systems security"
Faculty: Master thesis of the Faculté des Sciences appliquées


[en] Extract-transform-load (ETL) tools are used in the business to ingest external data into their operational database. The design of an ETL process can be achieved through either code and libraries or a graphical tool featuring a graph of operations. However, the former is only accessible to programmers, while the latter lacks extensibility.
This thesis proposes an approach to ETL configuration, based on a projectional domain-specific language (DSL), implemented with JetBrains MPS, and targeting ETL.NET.
The ETL process is designed using a language that represents data as tables manipulated through sequences of operations. A prototype implementation is evaluated with a small user study, which shows that the DSL is accessible to non-programmers, and programmers prefer it over a tool based on graphs.

[fr] Les outils Extract-Transform-Load (ETL) sont utilisés dans les entreprises pour importer des données externes dans leur base de données opérationnelle. La conception de processus ETL, se fait principalement avec du code textuel et des bibliothèques logicielles ou avec des interfaces graphiques présentant un graphe d'opérations. La première convient bien aux programmeurs tandis que la seconde est plus difficile à étendre en fonctionnalité.
Nous proposons ici une méthode intermédiaire basée sur un langage de programmation spécifique (DSL) projectionnel, implémenté avec JetBrains MPS, et intégré à ETL.NET.
Le processus ETL est exprimé dans un langage qui modélise les données sous forme de tableaux qui sont transformés avec des séquences d'opérations. Le prototype est évalué avec une petite étude utilisateur, qui montre que le DSL est accessible aux non-programmeurs, et que les programmeurs le préfèrent à une interface basée sur des graphes.



Access ETLang_Jakub_Duchateau_thesis.pdf
Size: 1.45 MB
Format: Adobe PDF
Access ETLang_Jakub_Duchateau_abstract.pdf
Size: 38.31 kB
Format: Adobe PDF


  • Duchateau, Jakub ULiège Université de Liège > Master sc. informatiques, à fin.


Committee's member(s)

  • Fontaine, Pascal ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes informatiques distribués
    ORBi View his publications on ORBi
  • Boigelot, Bernard ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Informatique
    ORBi View his publications on ORBi
  • Total number of views 100
  • Total number of downloads 197

All documents available on MatheO are protected by copyright and subject to the usual rules for fair use.
The University of Liège does not guarantee the scientific quality of these students' works or the accuracy of all the information they contain.