Projet ABC

C'est un pré-projet sélectionné en 2002
du programme interdisciplinaire CNRS Robea

Participants

Quatre laboratoires sont impliqués dans le projet ABC :


Contexte

À l'heure actuelle, dans le domaine de l'animation, le mouvement des artefacts repose principalement sur des techniques de capture de mouvements. Ainsi, toutes les séquences de mouvements doivent être prévues à l'avance et les scénarii décrits exhaustivement et de manière très précise. Un scénario est ensuite joué en mettant bout à bout des séquences comportementales des différents agents composant la scène ; les agents ont un ensemble de comportements fixé à l'avance ; l'adaptation de leur comportement face à des changements dans l'environnement est une tâche difficile. Par exemple, voulant saisir un objet, il serait bon que l'entité puisse la saisir quelle que soit sa position, pas forcément envisagée lors de la capture ; se déplaçant d'un point à un autre, il serait bon que l'entité adapte sa démarche à des sols de différentes natures, pas forcément envisagés lors de la capture ; ou encore, adapte sa trajectoire si des obstacles surgissent ou d'autres entités la rencontre ; ...

Objectifs du pré-projet

L'objectif du pré-projet ABC est de combiner les techniques de capture de mouvements avec des techniques d'apprentissage automatique. L'algorithme d'apprentissage sera alimenté avec des comportements capturés et ses capacités de généralisation seront ensuite mises à profit pour que l'algorithme soit apte à adapter son comportement dans un ensemble de situations étendu. La capacité de généraliser son expérience est l'une des caractéristiques clés des algorithmes d'apprentissage automatique ; par exemple, elle a bien été mise en évidence dans le domaine des réseaux de neurones pour la reconnaissance de formes.

Ce pré-projet consistera donc essentiellement en une définition précise, une mise en oeuvre et une évaluation de cette technique.

Plus précisément, dans un premier temps, nous travaillerons sur le mouvement d'atteinte d'un bras articulé composé de deux segments et de deux articulations (épaule et coude) en trois dimensions. La position de l'épaule étant fixe, nous allons capturer des séquences d'images pour des mouvements d'atteinte de différentes points. Ces séquences d'images seront analysées pour obtenir des suites de points correspondants à la trajectoire. Ces trajectoires seront ensuite apprises à un bras virtuel ; nous agirons alors dans un mode d'apprentissage essentiellement supervisé. Des corrections seront appliquées pour que les mouvements capturés (sur un véritable bras, donc déformable) soit corrects pour le bras virtuel (non déformable : il n'est pas recouvert de peau ou de muscles). L'apprentissage prendra en compte des effets physiques tels que la gravité et l'inertie dans le mouvement et des effets énergétiques liés à la contraction musculaire. Une fois cette phase effectuée, le bras virtuel sera mis à l'épreuve face à de nouvelles situations ; dans cette situation, il s'agira pour lui d'atteindre des points qui n'ont pas été appris. L'apprentissage par renforcement sera utilisé dans cette phase. La même architecture sera utilisée dans les deux cas (réseau de neurones), cette architecture supportant naturellement ces deux modes d'apprentissage. Lors de son fonctionnement autonome (non supervisé), le bras virtuel aura tendance à minimiser ses efforts pour atteindre la cible, donc à optimiser les trajectoires qu'il effectue, y compris les trajectoires qui lui auront été apprises initialement ; en effet, en apprentissage par renforcement, un apprentissage n'est jamais figé mais en perpétuelle adaptation à son milieu.

Une fois cette première phase réalisée avec succès, nous envisageons de nous intéresser au mouvement de locomotion sur deux jambes. Cela permettra de valider la technique mise en oeuvre précédemment sur un autre type de comportements, plus complexes.

Lecture

présentation préparée pour les journées Robea 2004

Contact

Courrier électronique :  cliquez ici