Master thesis : Toward functional and distributed R2RML processor

Master thesis : Toward functional and distributed R2RML processor

Saillez, Brieuc

Date of defense : 4-Sep-2023/5-Sep-2023 • Permalink : `http://hdl.handle.net/2268.2/18377`

Details

Title :	Master thesis : Toward functional and distributed R2RML processor
Author :	Saillez, Brieuc
Date of defense :	4-Sep-2023/5-Sep-2023
Advisor(s) :	Debruyne, Christophe
Committee's member(s) :	Louveaux, Quentin Fontaine, Pascal
Language :	English
Number of pages :	58
Discipline(s) :	Engineering, computing & technology > Computer science
Complementary URL :	https://gitlab.uliege.be/Brieuc.Saillez/tfe
Institution(s) :	Université de Liège, Liège, Belgique
Degree:	Master en sciences informatiques, à finalité spécialisée en "intelligent systems"
Faculty:	Master thesis of the Faculté des Sciences appliquées

Abstract

[en] Resource Description Framework (RDF) offers multiple advantages for data storage. Transforming data from relational databases into RDF datasets can be interesting. One prominent approach for generating RDF datasets from relational databases is the W3C relational database to RDF (R2RML) mapping language. Existing R2RML processors face challenges related to computing time and memory consumption, particularly when dealing with large-scale relational databases. This master's thesis presents a functional and distributed solution for implementing an R2RML processor working on cluster. A Scala solution based on Apache Spark that is purely functional is proposed. This approach involves an updated Java Parser from an existing implementation, a transformation of Java objects into Scala Abstract Data Type (ADT), a preprocessing to rewrite referencing object map into new triples map, and the generation and writing of the data. In this solution, the distribution of the task is based on relational data rows. For modestly-sized databases, this solution is slow due to an overhead introduced by Apache Spark. While being computed on cluster, the solution is fast for generation and will not consume too much memory. But, on too large-scale data, it suffers from memory problems that can be solved.

File(s)

Document(s)

TFE.pdf
Description:
Size: 708.78 kB
Format: Adobe PDF

Ask a request copy

TFE_Abstract.pdf
Description:
Size: 61.62 kB
Format: Adobe PDF

Ask a request copy

Cite this master thesis

All documents available on MatheO are protected by copyright and subject to the usual rules for fair use.
The University of Liège does not guarantee the scientific quality of these students' works or the accuracy of all the information they contain.

Nom

Provider / Domaine

Expiration

Description

JSESSIONID

Oracle Corporation

www.uliege.be

Session

Cookie de session de plate-forme à usage général, utilisé par les sites écrits en JSP. Habituellement utilisé pour maintenir une session utilisateur anonyme par le serveur.

CookieScriptConsent

CookieScript

.uliege.be

1 an

Ce cookie est utilisé par le service Cookie-Script.com pour mémoriser les préférences de consentement des visiteurs en matière de cookies. Il est nécessaire pour que la bannière de cookies Cookie-Script.com fonctionne correctement.

Nom

Provider / Domaine

Expiration

Description

_pk_id

InnoCraft Ltd

.uliege.be

1 an

Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_id est suivi d'une courte série de chiffres et de lettres, qui est censé être un code de référence pour le domaine définissant le cookie.

_pk_ses

InnoCraft Ltd

.uliege.be

30 minutes

Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ses est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.

_pk_ref

InnoCraft Ltd

.uliege.be

6 mois

Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ref est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.

Nom	Provider / Domaine	Expiration	Description
JSESSIONID	Oracle Corporation www.uliege.be	Session	Cookie de session de plate-forme à usage général, utilisé par les sites écrits en JSP. Habituellement utilisé pour maintenir une session utilisateur anonyme par le serveur.
CookieScriptConsent	CookieScript .uliege.be	1 an	Ce cookie est utilisé par le service Cookie-Script.com pour mémoriser les préférences de consentement des visiteurs en matière de cookies. Il est nécessaire pour que la bannière de cookies Cookie-Script.com fonctionne correctement.

Nom	Provider / Domaine	Expiration	Description
_pk_id	InnoCraft Ltd .uliege.be	1 an	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_id est suivi d'une courte série de chiffres et de lettres, qui est censé être un code de référence pour le domaine définissant le cookie.
_pk_ses	InnoCraft Ltd .uliege.be	30 minutes	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ses est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.
_pk_ref	InnoCraft Ltd .uliege.be	6 mois	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ref est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.

MASTER THESIS

Master thesis : Toward functional and distributed R2RML processor

Saillez, Brieuc

Promotor(s) : Debruyne, Christophe

Date of defense : 4-Sep-2023/5-Sep-2023 • Permalink : http://hdl.handle.net/2268.2/18377

Details

Abstract

File(s)

Document(s)

Author

Promotor(s)

Committee's member(s)

Cite this master thesis

APA

Chicago

Date of defense : 4-Sep-2023/5-Sep-2023 • Permalink : `http://hdl.handle.net/2268.2/18377`