Master thesis : On the Design and Implementation of an ETL Configuration DSL for Non-programming Experts
Duchateau, Jakub
Promoteur(s) : Debruyne, Christophe ; Duquenne, Frédéric
Date de soutenance : 26-jui-2023/27-jui-2023 • URL permanente : http://hdl.handle.net/2268.2/17649
Détails
Titre : | Master thesis : On the Design and Implementation of an ETL Configuration DSL for Non-programming Experts |
Auteur : | Duchateau, Jakub |
Date de soutenance : | 26-jui-2023/27-jui-2023 |
Promoteur(s) : | Debruyne, Christophe
Duquenne, Frédéric |
Membre(s) du jury : | Fontaine, Pascal
Boigelot, Bernard |
Langue : | Anglais |
Mots-clés : | [en] ETL [en] Extract-Transform-Load [en] Domain Specific Language [en] DSL [en] Design [en] Usability |
Discipline(s) : | Ingénierie, informatique & technologie > Sciences informatiques |
Organisme(s) subsidiant(s) : | FundProcess |
URL complémentaire : | https://gitlab.uliege.be/etlang/etlang https://etlang.gitlabpages.uliege.be/etlang/ |
Institution(s) : | Université de Liège, Liège, Belgique |
Diplôme : | Master en sciences informatiques, à finalité spécialisée en "computer systems security" |
Faculté : | Mémoires de la Faculté des Sciences appliquées |
Résumé
[en] Extract-transform-load (ETL) tools are used in the business to ingest external data into their operational database. The design of an ETL process can be achieved through either code and libraries or a graphical tool featuring a graph of operations. However, the former is only accessible to programmers, while the latter lacks extensibility.
This thesis proposes an approach to ETL configuration, based on a projectional domain-specific language (DSL), implemented with JetBrains MPS, and targeting ETL.NET.
The ETL process is designed using a language that represents data as tables manipulated through sequences of operations. A prototype implementation is evaluated with a small user study, which shows that the DSL is accessible to non-programmers, and programmers prefer it over a tool based on graphs.
[fr] Les outils Extract-Transform-Load (ETL) sont utilisés dans les entreprises pour importer des données externes dans leur base de données opérationnelle. La conception de processus ETL, se fait principalement avec du code textuel et des bibliothèques logicielles ou avec des interfaces graphiques présentant un graphe d'opérations. La première convient bien aux programmeurs tandis que la seconde est plus difficile à étendre en fonctionnalité.
Nous proposons ici une méthode intermédiaire basée sur un langage de programmation spécifique (DSL) projectionnel, implémenté avec JetBrains MPS, et intégré à ETL.NET.
Le processus ETL est exprimé dans un langage qui modélise les données sous forme de tableaux qui sont transformés avec des séquences d'opérations. Le prototype est évalué avec une petite étude utilisateur, qui montre que le DSL est accessible aux non-programmeurs, et que les programmeurs le préfèrent à une interface basée sur des graphes.
Fichier(s)
Document(s)
Citer ce mémoire
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.