suivant: Approche champ moyen
monter: Un enjeu : l'apprentissage
précédent: Apprentissage en ligne de
  Table des matières
  Index
Un système ouvert est un système dynamique
(c'est à dire un ensemble d'opérateurs agissant sur des
variables d'état)
en couplage permanent avec son environnement.
Au sens des systèmes dynamiques, c'est un système non-autonome
(c'est à dire que le flot (voir page
) dépend du temps).
On s'intéresse ici au cas d'un automate en interaction avec son
environnement.
On considère le système, constitué par le réseau d'opérateurs
et placé sous influence de signaux sensoriels et sensori-moteurs.
Ces signaux sont conditionnés par l'état de l'environnement.
Dans un système ouvert, on doit prendre en considération les
boucles de rétroaction entre le système et son environnement.
Les actions produites modifient en retour la nature des signaux perçus.
Dans ce cadre, la notion d'attracteur et de bassin d'attraction
propre au système n'est plus pertinente, et une description
exhaustive de l'interaction entre le système et son environnement
nécessiterait de modéliser le système global, constitué par
le système ouvert et son environnement.
C'est essentiellement dans le domaine de la robotique dite "autonome"
que cette approche se développe à l'heure actuelle.
Dans ce cadre, le système, constitué d'opérateurs distribués
d'inspiration neuronale, effectue son apprentissage en interaction
avec son environnement.
- Une première approche, dite de "neural field",
tire son inspiration d'un article d'Amari [67],
où est décrit le comportement à la limite thermodynamique
d'une chaîne de neurones à inhibitions latérales et soumises à
un signal externe non stationnaire.
Le neural field est principalement utilisé en robotique pour stabiliser
les ordres moteurs [68,69].
Un ordre moteur (direction et vitesse) correspond alors à
un "attracteur" de type point fixe, qui reste stable sur une certaine durée.
La transition d'un état moteur stable à un autre (pivotement)
s'opère de manière continue,
en fonction des évolutions intervenues dans les signaux de l'environnement.
- Une autre approche cherche à produire au sein du système des structures
spatio-temporelles stables lorsque ce système expérimente
de façon répétitive son environnement.
Un comportement moteur stable tend à émerger face aux situations les plus
courantes. Par ailleurs, le système tend, face à un stimulus donné,
à produire par résonance le comportement correspondant
à l'expérience inscrite la plus similaire [70,71,72].
En particulier, Tani met en évidence, sur un système constitué
de plusieurs réseaux récurrents couplés
des régimes dynamiques différents (cycle/chaos), dont
la nature dépend
de l'adéquation entre l'environnement
dans lequel le système est plongé et l'environnement appris précédemment.
- Une troisième approche prend inspiration d'études effectuées sur le
fonctionnement de l'hippocampe, en particulier de l'existence
d'un réseau de "cellules de lieu" dont la structure de connexions
représente la topologie des transitions d'un lieu à l'autre.
Une telle approche permet d'implémenter une planification
des actions en fonction du but recherché [73,74].
Un autre modèle, également inspiré de la structure de l'hippocampe,
permet d'apprendre des séquences temporelles par imitation [75].
suivant: Approche champ moyen
monter: Un enjeu : l'apprentissage
précédent: Apprentissage en ligne de
  Table des matières
  Index
Dauce Emmanuel
2003-05-07