Master thesis : Drone control through a vocal interface

Master thesis : Drone control through a vocal interface

Pirlet, Matthias

Date of defense : 5-Sep-2022/6-Sep-2022 • Permalink : `http://hdl.handle.net/2268.2/15850`

Details

Title :	Master thesis : Drone control through a vocal interface
Translated title :	[fr] Contrôle de drone à travers une interface vocale
Author :	Pirlet, Matthias
Date of defense :	5-Sep-2022/6-Sep-2022
Advisor(s) :	Louppe, Gilles
Committee's member(s) :	Debruyne, Christophe Wehenkel, Louis Greffe, Christophe
Language :	English
Discipline(s) :	Engineering, computing & technology > Computer science
Institution(s) :	Université de Liège, Liège, Belgique
Degree:	Master : ingénieur civil en science des données, à finalité spécialisée
Faculty:	Master thesis of the Faculté des Sciences appliquées

Abstract

[en] Today the use of drones is widely spread for many tasks, but for some of these,
such as firefighting, it is vital that the operator’s hands are kept free to do their job
properly. Hopefully speech recognition is an exploding discipline in deep learning. This
work therefore focuses on finding a deep learning model that recognises spoken com-
mands to control a drone from a pre-defined set.
The first part of the work was to build a training dataset of commands with the
combination of complete commands generated through the use of text-to-speech APIs
and hand-crafted commands. These were created thanks to the concatenation of an
open source spoken words dataset and another set of spoken words acquired through a
web platform created in order to complete the missing words of the vocabulary com-
mand set. The testing set was acquired by asking people to record complete commands
under real conditions.
The second part of the work focuses more on the different models that could be
developed and all the techniques that can be used. These are presented as an ablation
study, in order to improve the results on a test set in real conditions. Several meth-
ods were applied in order to achieve the final goal: the first is the use of computer
vision models where the input of these models is a simple spectrogram of the different
commands. The results using these types of models were not as good as those of the
new models which take directly the raw waveform as input and combines vision, atten-
tion and self-supervised learning. The best version of this model obtains a F1-Score of
0.9973 on a real conditions dataset.

File(s)

Document(s)

TFE_PIRLET_Matthias.pdf
Description:
Size: 3.25 MB
Format: Adobe PDF

Annexe(s)

Abstract_PIRLET_Matthias.pdf
Description:
Size: 194.51 kB
Format: Adobe PDF

Cite this master thesis

All documents available on MatheO are protected by copyright and subject to the usual rules for fair use.
The University of Liège does not guarantee the scientific quality of these students' works or the accuracy of all the information they contain.

Nom	Provider / Domaine	Expiration	Description
JSESSIONID	Oracle Corporation www.uliege.be	Session	Cookie de session de plate-forme à usage général, utilisé par les sites écrits en JSP. Habituellement utilisé pour maintenir une session utilisateur anonyme par le serveur.
CookieScriptConsent	CookieScript .uliege.be	1 an	Ce cookie est utilisé par le service Cookie-Script.com pour mémoriser les préférences de consentement des visiteurs en matière de cookies. Il est nécessaire pour que la bannière de cookies Cookie-Script.com fonctionne correctement.

Nom	Provider / Domaine	Expiration	Description
_pk_id	InnoCraft Ltd .uliege.be	1 an	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_id est suivi d'une courte série de chiffres et de lettres, qui est censé être un code de référence pour le domaine définissant le cookie.
_pk_ses	InnoCraft Ltd .uliege.be	30 minutes	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ses est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.
_pk_ref	InnoCraft Ltd .uliege.be	6 mois	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ref est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.

MASTER THESIS

Master thesis : Drone control through a vocal interface

Pirlet, Matthias

Promotor(s) : Louppe, Gilles

Date of defense : 5-Sep-2022/6-Sep-2022 • Permalink : http://hdl.handle.net/2268.2/15850

Details

Abstract

File(s)

Document(s)

Annexe(s)

Author

Promotor(s)

Committee's member(s)

Cite this master thesis

APA

Chicago

Date of defense : 5-Sep-2022/6-Sep-2022 • Permalink : `http://hdl.handle.net/2268.2/15850`