Étude des fondements théoriques des algorithmes d’apprentissage par renforcement en établissant des liens avec des disciplines connexes: recherche opérationnelle, simulations et optimisation stochastiques, commande optimale.