Master thesis : On the Design and Implementation of an ETL Configuration DSL for Non-programming Experts
Duchateau, Jakub
Promotor(s) : Debruyne, Christophe ; Duquenne, Frédéric
Date of defense : 26-Jun-2023/27-Jun-2023 • Permalink : http://hdl.handle.net/2268.2/17649
Details
Title : | Master thesis : On the Design and Implementation of an ETL Configuration DSL for Non-programming Experts |
Author : | Duchateau, Jakub |
Date of defense : | 26-Jun-2023/27-Jun-2023 |
Advisor(s) : | Debruyne, Christophe
Duquenne, Frédéric |
Committee's member(s) : | Fontaine, Pascal
Boigelot, Bernard |
Language : | English |
Keywords : | [en] ETL [en] Extract-Transform-Load [en] Domain Specific Language [en] DSL [en] Design [en] Usability |
Discipline(s) : | Engineering, computing & technology > Computer science |
Funders : | FundProcess |
Complementary URL : | https://gitlab.uliege.be/etlang/etlang https://etlang.gitlabpages.uliege.be/etlang/ |
Institution(s) : | Université de Liège, Liège, Belgique |
Degree: | Master en sciences informatiques, à finalité spécialisée en "computer systems security" |
Faculty: | Master thesis of the Faculté des Sciences appliquées |
Abstract
[en] Extract-transform-load (ETL) tools are used in the business to ingest external data into their operational database. The design of an ETL process can be achieved through either code and libraries or a graphical tool featuring a graph of operations. However, the former is only accessible to programmers, while the latter lacks extensibility.
This thesis proposes an approach to ETL configuration, based on a projectional domain-specific language (DSL), implemented with JetBrains MPS, and targeting ETL.NET.
The ETL process is designed using a language that represents data as tables manipulated through sequences of operations. A prototype implementation is evaluated with a small user study, which shows that the DSL is accessible to non-programmers, and programmers prefer it over a tool based on graphs.
[fr] Les outils Extract-Transform-Load (ETL) sont utilisés dans les entreprises pour importer des données externes dans leur base de données opérationnelle. La conception de processus ETL, se fait principalement avec du code textuel et des bibliothèques logicielles ou avec des interfaces graphiques présentant un graphe d'opérations. La première convient bien aux programmeurs tandis que la seconde est plus difficile à étendre en fonctionnalité.
Nous proposons ici une méthode intermédiaire basée sur un langage de programmation spécifique (DSL) projectionnel, implémenté avec JetBrains MPS, et intégré à ETL.NET.
Le processus ETL est exprimé dans un langage qui modélise les données sous forme de tableaux qui sont transformés avec des séquences d'opérations. Le prototype est évalué avec une petite étude utilisateur, qui montre que le DSL est accessible aux non-programmeurs, et que les programmeurs le préfèrent à une interface basée sur des graphes.
File(s)
Document(s)
Cite this master thesis
The University of Liège does not guarantee the scientific quality of these students' works or the accuracy of all the information they contain.