Le stage de Rémi Leluc portera sur l’étude des méthodes de Monte-Carlo adaptatives dans le cadre de l’apprentissage par renforcement d’un point de vue théorique (convergence et inégalités, bornes théoriques) et d’un point de vue pratique (implémentation de nouvelles méthodes et comparaisons avec les méthodes de l’état de l’art). Il est supervisé par François Portier, maître de conférence à Télécom Paris et Pascal Bianchi professeur à Télécom Paris.
Mots-clés: apprentissage par renforcement d’un point de vue théorique, convergence et inégalités, bornes théoriques, méthodes de l’état de l’art