Feedback

Faculté des Sciences appliquées
Faculté des Sciences appliquées
Mémoire
VIEW 378 | DOWNLOAD 57

Application of DeepLearning Algorithm on Minecraft

Télécharger
Van de Goor, Elodie ULiège
Promoteur(s) : Ernst, Damien ULiège
Date de soutenance : 8-sep-2016/9-sep-2016 • URL permanente : http://hdl.handle.net/2268.2/1686
Détails
Titre : Application of DeepLearning Algorithm on Minecraft
Titre traduit : [fr] Application d'une méthode d'apprentissage profond dans Minecraft
Auteur : Van de Goor, Elodie ULiège
Date de soutenance  : 8-sep-2016/9-sep-2016
Promoteur(s) : Ernst, Damien ULiège
Membre(s) du jury : Geurts, Pierre ULiège
Wehenkel, Louis ULiège
Gemine, Quentin ULiège
François-Lavet, Vincent ULiège
Langue : Anglais
Nombre de pages : 73
Mots-clés : [en] deep learning
[en] Machine learning
[en] Minecraft
[en] Deer
[en] DeepMind
[en] deep Q-network
[en] reinforcement learning
Discipline(s) : Ingénierie, informatique & technologie > Sciences informatiques
Public cible : Chercheurs
Professionnels du domaine
Etudiants
Institution(s) : Université de Liège, Liège, Belgique
Diplôme : Master en ingénieur civil en informatique, à finalité approfondie
Faculté : Mémoires de la Faculté des Sciences appliquées

Résumé

[en] Some years ago, Google DeepMind released a paper describing an agent architecture, DQN. This agent was able to learn to play better than humans in 49 different Atari game while receiving only the game screen and scores as inputs. With these kinds of results we can ask ourselves how well this agent could do in the environment of a new game. The purpose of this thesis is to make the DeepMind agent evolve into Minecraft and make it easily adaptable to many kinds of tasks. Its task is to destroy as many mobs as possible in a room.
The implementation of a DeepMind agent has been carried out in the game Minecraft through the ULg program Deer. The communication between Deer and minecraft was designed in a modular way so it can be adapted to other tasks or even other games. A number of experiments have been conducted to test different combination of parameters.
The learning speed of the agent was impressive when we consider the small learning phase it has comparing to the Atari learning phases. It made good results and when we increase the number of step to 80,000 it was as good as a human player, even developing strategies to find and trap the mobs. However it still has a stability problem.

These results are encouraging and more tests should help to reach an even better score. Once this is done, the difficulty of the task can be increased to a moving agent for example. Step by step, it is possible to test more and more complex tasks by making the agent evolve with other paper results or other machine learning mechanisms. This environment will allow making both the agents architecture and the tasks evolve to whatever one would want.


Fichier(s)

Document(s)

File
Access Application of a Deep Learning algorithm on Minecraft.pdf
Description:
Taille: 9.42 MB
Format: Adobe PDF

Annexe(s)

File
Access run_minecraft.py
Description:
Taille: 4.27 kB
Format: Unknown
File
Access minecraft_env.py
Description:
Taille: 7.28 kB
Format: Unknown
File
Access Summary.pdf
Description:
Taille: 306.68 kB
Format: Adobe PDF

Auteur

  • Van de Goor, Elodie ULiège Université de Liège > Master ingé. civ. info., fin. appr. (ex 2e master)

Promoteur(s)

Membre(s) du jury

  • Geurts, Pierre ULiège Université de Liège - ULg > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Algorith. des syst. en interaction avec le monde physique
    ORBi Voir ses publications sur ORBi
  • Wehenkel, Louis ULiège Université de Liège - ULg > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation
    ORBi Voir ses publications sur ORBi
  • Gemine, Quentin ULiège Université de Liège - ULg > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Smart grids
    ORBi Voir ses publications sur ORBi
  • François-Lavet, Vincent ULiège Université de Liège - ULg > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Dép. d'électric., électron. et informat. (Inst.Montefiore)
    ORBi Voir ses publications sur ORBi
  • Nombre total de vues 378
  • Nombre total de téléchargements 57










Tous les documents disponibles sur MatheO sont protégés par le droit d'auteur et soumis aux règles habituelles de bon usage.
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.