next up previous contents index
suivant: Principe du traitement visuel monter: Apprentissage sur le modèle précédent: L'APPORT DE LA COUCHE   Table des matières   Index


Application à la robotique autonome

Un séjour d'une semaine au laboratoire ETIS (ENSEA, Cergy-Pontoise) a permis de mettre en place l'algorithme d'apprentissage dans le cadre d'une tâche de repérage d'un robot mobile dans son environnement [100]. Ce travail est par ailleurs soutenu financièrement par un projet GIS ``Sciences de la Cognition'' dont le titre est ``Codage dynamique par réseaux de neurones récurrents asymétriques'', collaboration qui inclut l'ETIS (Cergy-Pontoise), L'ONERA-Centre de Toulouse, l'INSERM U455 (Toulouse) et l'INLN (Institut non linéaire de Nice).

Le robot utilisé à l'ETIS pour les expérimentations est de modèle Koala. Il possède 6 roues, une caméra frontale et une boussole. Il possède de plus un système d'évitement d'obstacles automatique. Le robot est capable de se déplacer dans toutes les directions à différentes vitesses. Un mouvement se décompose en général en une man\oeuvre de rotation, et une translation à vitesse constante. Ce robot est représenté figure [*].

Figure: Le robot Koala utilisé à l'ETIS.
\includegraphics[]{koala.eps}

La problématique est la suivante : étant données les informations disponibles sur les capteur, le système doit apprendre à se repérer en explorant son environnement. Le choix des mouvements nécessite un système de traitement qui analyse de façon détaillée des données de l'environnement, et prend également en compte des indicateurs internes qui décrivent l'évolution des ``besoins'' du système. Le système fonde son action à la fois sur des données externes et des données internes. L'apprentissage, par exploration, essai et erreur, doit permettre au système de se forger des représentations plus précises de son environnement qui lui permettent alors de mettre en \oeuvre des actions menant plus sûrement aux buts recherchés.

Le groupe neuro-cybernétique de l'ETIS possède déjà une solide expérience en la matière, et consacre sa recherche à l'implantation d'architectures neurales d'inspiration biologique pour le traitement visuel et la mémorisation de lieux et de séquences d'action dans le cadre d'une exploration non-supervisée de l'environnement. Le modèle de mémoire mis en \oeuvre s'inspire en particulier du fonctionnement de l'hippocampe (mémoire des lieux) et du cortex frontal (planification) [101] [102] [74].

Les algorithmes de traitement visuel (pré-attentif) déjà implantés ont été utilisés tels quels, dans le cadre du logiciel Prométhée, qui réalise l'interface avec le robot et implémente la partie contrôle. L'utilisation de la bibliothèque de procédures de ce logiciel a permis de se consacrer exclusivement à la mise en place d'un système récurrent avec interface visuelle et interface motrice, et d'avancer assez vite.

Les échelles de temps ne sont pas les mêmes entre une simulation où l'on peut faire défiler des milliers de pas de temps et une expérimentation sur robot où chaque itération se traduit par un mouvement et met entre 2 et 5 secondes pour s'effectuer. L'expérimentation sur robot nous oblige à travailler sur des échelles de temps très réduites, avec des conditions de convergence limites, c'est à dire avec un risque supplémentaire. On a pu constater que l'algorithme d'apprentissage se comporte de façon très robuste dans des conditions de convergence limites (c'est à dire des transitoires et des temps d'apprentissage courts). En particulier, pour l'application de repérage qu'on s'est fixée, 20 pas d'apprentissage (correspondant à 6 présentations de la séquence d'entrée) ont suffi à provoquer le comportement adéquat.

Pour cette première expérience sur un robot, on a mis en place une architecture à trois couches, comprenant une couche primaire visuelle (population 1), une couche dynamique (population 2) et une couche primaire sensori-motrice (population 3) qui retranscrit la commande motrice. On a fixé une tâche motrice simple : la rotation. L'exploration visuelle de l'environnement repose sur un mouvement rotatif du robot. le robot apprend donc à associer à certaines vues des commandes motrices (angle de rotation) spécifiques. Cette séquence de commandes motrices est prédéfinie avant apprentissage. Elle agit comme une stimulation périodique pendant l'apprentissage. L'environnement perçu au cours de ces rotations est alors associé aux mouvements imposés. Après apprentissage, la commande périodique est supprimée, et le robot se fonde uniquement sur l'information visuelle pour choisir le mouvement adéquat.



Sous-sections
next up previous contents index
suivant: Principe du traitement visuel monter: Apprentissage sur le modèle précédent: L'APPORT DE LA COUCHE   Table des matières   Index
Dauce Emmanuel 2003-05-07