next up previous contents index
suivant: Banc de tests monter: Une architecture pour l'apprentissage précédent: Choix des paramètres   Table des matières   Index


Réponse du système

De nombreux travaux de neurophysiologie sur les animaux mettent en avant la capacité du cerveau à anticiper les événements correspondant aux perceptions et aux actions effectuées par l'animal dans son environnement. Cette anticipation nécessite qu'une séquence similaire d'événements ait au préalable été inscrite dans le système nerveux. L'inscription d'une telle séquence d'actions/perceptions permet alors à l'animal de reproduire la même séquence dans les mêmes conditions. L'animal est en quelque sorte assuré du résultat de l'action mise en \oeuvre. Cette mémoire séquentielle pourrait être stockée à moyen terme dans la structure fortement récurrente de l'hippocampe, et projetée pour le long terme dans l'ensemble du cortex [44].

Au delà de cette forme immédiate d'anticipation, des hypothèses récentes mettent en avant chez les mammifères les plus évolués la capacité à simuler l'environnement [17]. Dans ce cadre, l'animal est capable de tester plusieurs hypothèses, c'est à dire d'évoquer, en l'absence de toute mise en \oeuvre effective, plusieurs séquences d'actions, et d'effectuer un choix en faveur de celle qui apparaît la plus efficace. Ces capacités cognitives ``supérieures'' permettraient par exemple à un prédateur de choisir parmi plusieurs stratégies d'attaque possibles. À ce stade, on est très loin du simple comportement réactif.

On constate de façon générale que plus on monte dans l'échelle de l'intelligence, plus la mise en \oeuvre de l'action s'éloigne du simple conditionnement. Les données de l'environnement sont insuffisantes pour décrire le comportement, dans la mesure où le cerveau confronte en permanence les données de l'environnement à des modèles préexistants, avec lesquels la ``mise en conformité'' s'effectue de façon dynamique. Il devient alors possible d'ignorer certaines données de l'environnement en cas de désaccord avec le modèle interne (idée fixe), ou au contraire de reproduire à partir d'un petit élément d'information sensorielle un contexte beaucoup plus général.

Le modèle que nous proposons ne vise pas à reproduire les fonctions cognitives les plus hautes décrites ci-dessus, mais plutôt à illustrer quelques capacités d'anticipation simple qui peuvent être obtenues au sein d'un modèle qui possède une dynamique interne propre. Ce modèle peut alors confronter les données de l'expérience avec cette source dynamique interne. Dans ce cas, la reconnaissance s'apparente à une mise en conformité entre les séquences perçues et les séquences ``intérieures''.

Dans le cadre du paradigme de Freeman, nous nous sommes jusqu'à présent essentiellement intéressés aux modifications des propriétés dynamiques du système. Il a été établi que l'apprentissage permet d'associer un régime dynamique spécifique à chaque motif appris, et que la présentation d'une partie de l'information apprise permet d'évoquer le régime dynamique associé au motif complet. Nos réseaux à une population pouvaient alors apprendre un comportement dynamique (une configuration spatio-temporelle des activations). Notre travail est à présent de relier ce comportement à une action effective sur l'environnement, ou à une prédiction sur l'état futur de l'environnement.

Le développement d'un modèle à couches primaires vise précisément à permettre le déchiffrage de la réponse du réseau, grâce aux liens retour. Ces liens sont, comme on l'a vu, initialisés à zéro. Les couplages entre la couche dynamique et les couches primaires se mettent en place au cours de l'apprentissage. L'apprentissage tend à établir une correspondance à double sens entre le signal en entrée et le régime de la couche dynamique. Il devient alors intéressant de corrompre le signal d'entrée afin d'estimer dans quelles conditions et pour quelles durées d'apprentissage une information bruitée ou incomplète en entrée parvient néanmoins à ``faire sens'', c'est à dire à s'accorder à une représentation dynamique interne. Dans ce cas, l'image évoquée sur les neurones de la couche primaire via les liens retour doit permettre de reconstituer les parties manquantes de l'information.

Il faut noter avant d'aller plus loin que tous les apprentissages effectués impliquant une stimulation dynamique mettent également en jeu un motif conditionnant. L'utilisation de plusieurs motifs conditionnants permet de produire sur un même réseau plusieurs configurations, chacune d'entre elles étant dédiée à la reconnaissance d'une séquence dynamique apprise. En ce sens, la capacité à reconnaître une entrée dynamique dépend d'un contexte plus général, considéré comme interne au système, qui rend le système particulièrement sensible à cette entrée.


Sur notre modèle, la stimulation test peut prendre deux aspects :

La réponse du système est alors analysée, soit :


next up previous contents index
suivant: Banc de tests monter: Une architecture pour l'apprentissage précédent: Choix des paramètres   Table des matières   Index
Dauce Emmanuel 2003-05-07