suivant: CONCLUSION LOCALE
monter: Adaptation dynamique
précédent: Exemple
  Table des matières
  Index
Cette expérience a montrá la faisabilité d'une implémentation de notre système dans le cadre d'une application à la robotique mettant en jeu des données réelles.
Certains des comportements observés peuvent être mis en rapport avec ceux que l'on a obtenus en simulation.
Le comportement de recalage différé a déjà été observé en cas de conflit entre l'information disponible en entrée et les pré-représentations de la couche dynamique (voir page
).
Dans le premier cas, le conflit aboutissait à une mise en conformité de la séquence évoquée en retour sur la couche visuelle.
Ici, la mise en conformité repose sur une action effective qui vise à recaler l'entrée visuelle sur ce que le système ``souhaite voir''.
La séquence qui est produite par la couche dynamique est capable de se maintenir quelques pas de temps lorsqu'il y a contradiction avec l'entrée visuelle, puis finit par s'adapter à cette entrée.
On n'est donc pas dans le cadre d'une simple association entre stimulus d'entrée et stimulus de sortie.
Le système a intégré un séquencement des actions, et effectue un compromis entre le défilement de sa séquence interne et son entrée.
Lorsque l'information en entrée est non cohérente par rapport à la séquence apprise, le système produit un comportement irrégulier (chaotique) au sein duquel des éléments de la séquence apprise peuvent apparaître.
On peut l'interpréter comme une exploration d'un environnement inconnu, et le système cherche à projeter sur cet environnement un élément de séquence connu :
- Dans le cas d'une dérive, le comportement exploratoire permet de se recaler sur la bonne séquence lorsque la séquence de mouvements proposée correspond à nouveau au bon séquencement des entrées visuelles.
- Lorsque l'on met un cache sur la caméra, il n'y a plus de cohérence entre l'entrée visuelle et les commandes visuelles produites.
L'activité exploratoire se poursuit alors indéfiniment.
Les résultats obtenus dans ce cadre restreint permettent d'entrevoir de nombreux développements possibles :
- Faire des apprentissages de séquences de mouvements différentes dans des pièces différentes, ou à des endroits différents de la même pièce. Suivant son environnement, le robot ne choisit pas la même séquence (il tourne vers la droite lorsqu'il est près de la télé, et il tourne vers la gauche lorsqu'il est près de la table...).
(il est probable que pour réussir cela, il faudra prendre une entrée visuelle plus élaborée, c'est à dire augmenter la vigilance).
- Ajouter des motifs conditionnants, qui représenteraient la motivation du moment (faim, soif...).
En fonction de cette entrée ``interne'', le robot ne fait pas le même mouvement au même endroit (s'il a soif, il tourne vers la gauche près de la table, s'il a faim, il tourne vers la droite près de la table).
Dans un premier temps, les associations motif conditionnant/lieu/mouvement seraient imposées au système.
- Faire de l'apprentissage sur des mouvements complets (rotation/translation) et plus seulement sur des mouvements de rotation.
Il faut faire un choix entre un codage analogique de la vitesse (fondé sur l'intensité du signal dynamique), et un codage binaire (choix d'une vitesse parmi un ensemble discret de vitesses possibles), moins plausible biologiquement.
Avec (rotation/translation), les combinaisons à apprendre sont beaucoup plus nombreuses.
On pourrait dans un premier temps se contenter de (pas de mouvement/un mouvement), avec un déplacement de longueur constante lorsque le mouvement est effectué.
- En dernier lieu, il faudrait mettre en place un modèle permettant l'apprentissage non-supervisé, soit en mixant le modèle dynamique avec des modules d'apprentissage par renforcement, soit en étendant la règle d'apprentissage du modèle afin de prendre en compte des stimulations de type récompense/punition.
suivant: CONCLUSION LOCALE
monter: Adaptation dynamique
précédent: Exemple
  Table des matières
  Index
Dauce Emmanuel
2003-05-07