Feedback

Faculté des Sciences appliquées
Faculté des Sciences appliquées
Mémoire
VIEW 48 | DOWNLOAD 0

Study of agent performance on ground terrain mission using reward shaping

Télécharger
Derroitte, Natan ULiège
Promoteur(s) : Ernst, Damien ULiège
Date de soutenance : 24-jan-2020 • URL permanente : http://hdl.handle.net/2268.2/8655
Détails
Titre : Study of agent performance on ground terrain mission using reward shaping
Titre traduit : [fr] Etude de la performance des agents sur une mission au sol en utilisant le façonnage des récompenses
Auteur : Derroitte, Natan ULiège
Date de soutenance  : 24-jan-2020
Promoteur(s) : Ernst, Damien ULiège
Membre(s) du jury : Wehenkel, Louis ULiège
Vecoven, Nicolas ULiège
Leroy, Pascal ULiège
Pisane, Jonathan 
Langue : Anglais
Mots-clés : [en] Reinforcement Learning
[en] Reward Shaping
[en] Defence application
Discipline(s) : Ingénierie, informatique & technologie > Sciences informatiques
Institution(s) : Université de Liège, Liège, Belgique
Diplôme : Master en ingénieur civil en informatique, à finalité spécialisée en "intelligent systems"
Faculté : Mémoires de la Faculté des Sciences appliquées

Résumé

[en] The aim of this work is to study the reward functions of reinforcement learning problems through reward shaping.
The results were obtained by introducing specific maps corresponding to military mission scenarios. For each situation, the most appropriate reward shaping technique was used and its performance is analysed. Beyond the victory rate of a mission, the actions that had the greatest impact on the success of the mission are studied.


Fichier(s)

Document(s)

File
Access Summary.pdf
Description: -
Taille: 115.63 kB
Format: Adobe PDF
File
Access master_thesis_derroitte_natan.pdf
Description: -
Taille: 7.52 MB
Format: Adobe PDF

Annexe(s)

File
Access code.tar.gz
Description: -
Taille: 10.85 MB
Format: Unknown

Auteur

  • Derroitte, Natan ULiège Université de Liège > Master ingé. civ. info., à fin.

Promoteur(s)

Membre(s) du jury

  • Wehenkel, Louis ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Méthodes stochastiques
    ORBi Voir ses publications sur ORBi
  • Vecoven, Nicolas ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation
    ORBi Voir ses publications sur ORBi
  • Leroy, Pascal ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Smart grids
    ORBi Voir ses publications sur ORBi
  • Pisane, Jonathan John Cockerill
  • Nombre total de vues 48
  • Nombre total de téléchargements 0










Tous les documents disponibles sur MatheO sont protégés par le droit d'auteur et soumis aux règles habituelles de bon usage.
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.