Feedback

Faculté des Sciences appliquées
Faculté des Sciences appliquées
Mémoire
VIEW 89 | DOWNLOAD 3

Master's Thesis : Coordination on the battlefield by multi-agent reinforcement learning.

Télécharger
Fombellida-Lopez, Arnaud ULiège
Promoteur(s) : Ernst, Damien ULiège
Date de soutenance : 25-jui-2020/26-jui-2020 • URL permanente : http://hdl.handle.net/2268.2/9072
Détails
Titre : Master's Thesis : Coordination on the battlefield by multi-agent reinforcement learning.
Auteur : Fombellida-Lopez, Arnaud ULiège
Date de soutenance  : 25-jui-2020/26-jui-2020
Promoteur(s) : Ernst, Damien ULiège
Membre(s) du jury : Geurts, Pierre ULiège
Wehenkel, Louis ULiège
Leroy, Pascal ULiège
Vanlerberghe, Shani 
Langue : Anglais
Discipline(s) : Ingénierie, informatique & technologie > Sciences informatiques
Institution(s) : Université de Liège, Liège, Belgique
Diplôme : Master en science des données, à finalité spécialisée
Faculté : Mémoires de la Faculté des Sciences appliquées

Résumé

[en] This study investigates Multi-Agent Reinforcement Learning algorithms that improve agent cooperation and coordination through agent-to-agent communication. The basics of Reinforcement Learning are presented after introducing the IRIS project and the high-level objectives of this work. Multi-Agent Reinforcement Learning's State-of-the-Art methods are then presented with a focus on algorithms which allow agents to learn to communicate. An algorithm designed to allow use different methods to aggregate messages and that is able to learn when to send message is presented. Moreover, the possibility to leverage Multi-Agent critics is shown. Within the Starcraft II Multi-Agent Challenge, variations of the communicating algorithm are tested on a hand-crafted scenario. Various performance and behavior metrics are analyzed and compared with a non-communicating algorithm. Results show that, although final performance is similar, allowing agents to communicate increases the learning rate and leads to behaviorally different agents.


Fichier(s)

Document(s)

File
Access Master Thesis - Fombellida.pdf
Description: -
Taille: 18.21 MB
Format: Adobe PDF

Annexe(s)

File
Access Code.zip
Description: -
Taille: 102.57 MB
Format: Unknown

Auteur

  • Fombellida-Lopez, Arnaud ULiège Université de Liège > Mast. sc. don. à fin.

Promoteur(s)

Membre(s) du jury

  • Geurts, Pierre ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Algorith. des syst. en interaction avec le monde physique
    ORBi Voir ses publications sur ORBi
  • Wehenkel, Louis ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Méthodes stochastiques
    ORBi Voir ses publications sur ORBi
  • Leroy, Pascal ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Smart grids
    ORBi Voir ses publications sur ORBi
  • Vanlerberghe, Shani John Cockerill Defence
  • Nombre total de vues 89
  • Nombre total de téléchargements 3










Tous les documents disponibles sur MatheO sont protégés par le droit d'auteur et soumis aux règles habituelles de bon usage.
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.