Feedback

Faculté des Sciences appliquées
Faculté des Sciences appliquées
Mémoire
VIEW 163 | DOWNLOAD 238

Master thesis : Drone control through a vocal interface

Télécharger
Pirlet, Matthias ULiège
Promoteur(s) : Louppe, Gilles ULiège
Date de soutenance : 5-sep-2022/6-sep-2022 • URL permanente : http://hdl.handle.net/2268.2/15850
Détails
Titre : Master thesis : Drone control through a vocal interface
Titre traduit : [fr] Contrôle de drone à travers une interface vocale
Auteur : Pirlet, Matthias ULiège
Date de soutenance  : 5-sep-2022/6-sep-2022
Promoteur(s) : Louppe, Gilles ULiège
Membre(s) du jury : Debruyne, Christophe ULiège
Wehenkel, Louis ULiège
Greffe, Christophe 
Langue : Anglais
Discipline(s) : Ingénierie, informatique & technologie > Sciences informatiques
Institution(s) : Université de Liège, Liège, Belgique
Diplôme : Master : ingénieur civil en science des données, à finalité spécialisée
Faculté : Mémoires de la Faculté des Sciences appliquées

Résumé

[en] Today the use of drones is widely spread for many tasks, but for some of these,
such as firefighting, it is vital that the operator’s hands are kept free to do their job
properly. Hopefully speech recognition is an exploding discipline in deep learning. This
work therefore focuses on finding a deep learning model that recognises spoken com-
mands to control a drone from a pre-defined set.
The first part of the work was to build a training dataset of commands with the
combination of complete commands generated through the use of text-to-speech APIs
and hand-crafted commands. These were created thanks to the concatenation of an
open source spoken words dataset and another set of spoken words acquired through a
web platform created in order to complete the missing words of the vocabulary com-
mand set. The testing set was acquired by asking people to record complete commands
under real conditions.
The second part of the work focuses more on the different models that could be
developed and all the techniques that can be used. These are presented as an ablation
study, in order to improve the results on a test set in real conditions. Several meth-
ods were applied in order to achieve the final goal: the first is the use of computer
vision models where the input of these models is a simple spectrogram of the different
commands. The results using these types of models were not as good as those of the
new models which take directly the raw waveform as input and combines vision, atten-
tion and self-supervised learning. The best version of this model obtains a F1-Score of
0.9973 on a real conditions dataset.


Fichier(s)

Document(s)

File
Access TFE_PIRLET_Matthias.pdf
Description:
Taille: 3.25 MB
Format: Adobe PDF

Annexe(s)

File
Access Abstract_PIRLET_Matthias.pdf
Description:
Taille: 194.51 kB
Format: Adobe PDF

Auteur

  • Pirlet, Matthias ULiège Université de Liège > Master ingé. civ. sc. don. à . fin.

Promoteur(s)

Membre(s) du jury

  • Debruyne, Christophe ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Représentation et ingénierie des données
    ORBi Voir ses publications sur ORBi
  • Wehenkel, Louis ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Méthodes stochastiques
    ORBi Voir ses publications sur ORBi
  • Greffe, Christophe Generix
  • Nombre total de vues 163
  • Nombre total de téléchargements 238










Tous les documents disponibles sur MatheO sont protégés par le droit d'auteur et soumis aux règles habituelles de bon usage.
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.