Description:J'aimerai remercier Agnès Guillot d'avoir accepté de co-diriger cette thèse avec une .. D.2 Expérience de Roberts et Pearce (1999) . Figure 2.2 – Les deux référentiels utilisés par les animaux. wT ij, appris au moyen d'un algorithme de Q-learning (Sutton et Barto, 1998) : selection probl