flappy-RL

Voici un algorithme de deep q learning apprenant à jouer à une version de flappy Bird homemade. J'ai essayé de coller le plus possible aux méchaniques de base du jeu tout en négligeant volontairement la partie graphique.

Le modèle en lui même est composé de 3 convolution et deux fully connected. Il prend en entrée une image de 80x80x4 => 20x20*32 => 5x5x64 => 3x3x64 puis un fully connected de [1600,512] et un autre de [512,2] pour l'estimation de la q value des deux actions possibles

Après 3,6m de timesteps l'algorithme atteint un niveau plus que décent, son record est de 203 à l'heure actuelle.

Voici en exclusivité un superbe 83: https://www.youtube.com/watch?v=X7Q_cX7BxoU&feature=youtu.be

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
__pycache__		__pycache__
model/test_0		model/test_0
21.mp4		21.mp4
README.md		README.md
flappyBird.py		flappyBird.py
inference.py		inference.py
main.py		main.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

flappy-RL

About

Releases

Packages

Languages

Smirkey/flappy-RL

Folders and files

Latest commit

History

Repository files navigation

flappy-RL

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages