Journées « Problèmes Décisionnels de Markov et Intelligence Artificielle » 2005
- 10h10-12h10 : session 1 : 4 exposés :
- Navigation, fonctions harmoniques et contrôle optimal stochastique, A. Boumaza, B. Scherrer, LORIA
- Taylor-based pseudo-metrics for random process fitting in dynamic programming: expected loss minimization and risk management, S. Gelly, J. Mary, O. Teytaud, LRI (Univ Paris-Sud) et INRIA-Futurs
- Dynamic composition of MDPs for an adaptive control of resource-bounded agents, S. Le Gloannec, A-I. Mouaddib, F. Charpillet, GREYC (Univ Caen) et LORIA
- Geometric variance reduction in Markov chains, Application to value function and gradient estimation, R. Munos, CMAP (École Polytechnique)
- 14h-15h30 : session 2 : 3 exposés :
- Induction of macro-actions based on local features in reinforcement learning, P. Garcia, IRISA
- Décomposition en somme d'une fonction valeur : quelques résultats expérimentaux sur le problème du nageur, N. Langlois, R. Coulom, Ph. Preux, GRAPPA (Univ. Lille 3)
- Algorithmes d'itération de la politique symboliques et heuristiques pour les problèmes de planification d'exploration structurés, F. Teichtel-Königsbuch, P. Fabiani, ONERA, Toulouse
- 16h - 17h : session 3 : 2 exposés :
- 9h-10h30 : session 4 : 3 exposés :
- A Java Platform for reinforcement learning experiments, F. De Comité, GRAPPA (Univ. Lille 3)
- BOSAR : Bibliothèque d'outils simulink pour l'apprentissage par renforcement, G. Laurent, E. Piat, C. Adda, N. Le Fort-Piat, Lab. Automatique de Besançon
- Apprentissage par renforcement continu pour les jeux-vidéos : approche case-base ou instance-based ?, Th. Gourdin, O. Sigaud, LIP6 (Univ. Paris 6)
- 11h-12h30 : session 5 : 3 exposés :
- Apprentissage par renforcement dans une approche Monte Carlo du jeu de Go, G. Chaslot, R. Coulom, B. Bouzy, Ph. Preux, GRAPPA (Univ. Lille 3) et CRIP5 (Univ. Paris 5)
- Solving efficiently DEC-MDPs with temporal constraints, A. Beynier, A-I. Mouaddib, S. Zilberstein, GREYC (Univ Caen) et Univ. Massachussetts
- Apprentissage de l'organisation dans les environnements multi-agents : une approche basée sur la dominance d'équilibres, J. Laumonier, B. Chaib-Draa, DAMAS (Univ. Laval, Québec)
- 14h-15h30 : session 6 : 3 exposés :