CATEGORII DOCUMENTE
Afaceri Calculatoare Casa masina Didactica pedagogie Diverse Educatie Finante Geografie Istorie & politica Legislatie Limba Management Sanatate Tehnologie

Bulgara	Ceha slovaca	Croata	Engleza	Estona	Finlandeza	Franceza
Germana	Italiana	Letona	Lituaniana	Maghiara	Olandeza	Poloneza
Sarba	Slovena	Spaniola	Suedeza	Turca	Ucraineana

Administration	Animaux	Art	Comptabilité	Diverses	Droit	éducation	électronique
Films	L'économie	L'histoire	L'informatique	La biologie	La géographie	La grammaire	La littérature
La médecine	La musique	La politique	La psychologie	La sociologie	Le tourisme	Les mathématiques	Management
Personnalités	Physique	Recettes	Sport	Technique

Réseaux de neurones auto-organisateurs

management

+ Font mai mare | - Font mai mic


DOCUMENTE SIMILARE

Réseaux de neurones auto-organisateurs

Les RN abordés dans les chapitres précédants permettent une transformation

F : RⁿÞR^m, en utilisant des couples de forme modÃˆle d’entrée - modÃˆle de sortie désiré. Il y a des problÃˆmes dont on ne dispose pas de modÃˆles désirés, mais seulement de l’ensemble de modÃˆles d’entrée.

1 Le principe de l’apprentissage compétitif

L'architecture d'un réseau avec un apprentissage compétitif est présentée dans la Fig.6.1. Dans un RN compétitif tous les neurones sont complets connectés. Tous les neurones reçoivent des entrées excitatrices de la couche précédante et transmettent des signaux inhibiteurs vers les neurones de leur couche. Les vecteurs poids sont initialisés aléatoirement usuellement aux modÃˆles d’entrée. On suppose que toutes les entrées et tous les poids sont normalisés, ayant le mÃŠme nombre N des éléments (le nombre des neurones de la couche précédante). Si tous les modÃˆles d’entrée ont le mÃŠme nombre des éléments N, ils ont la mÃŠme longueur. On peut interpréter chaque modelé d’entrée et chaque vecteur poids comme un point sur une sphÃˆre (N dimensionnelle). Quand on applique un modÃˆle à l’entrée chaque neurone calcule son activation :

(6.1)

Puis c’est sélectionné le neurone gagnant, celui avec la plus grande (ou petite) activation, ou avec l’intensité d’entrée plus réduite. L’intensité d’entrée est définie comme une distance métrique :

(6.2)

Dans le sous chapitre 6.4 sont introduites quelques distances métriques plus souvent utilisées.

Fig.6.1 L'architecture d'un réseau compétitif

Par une inhibition latérale ( en anglais de type “on center – off sorround”) pendant un procÃˆs d’apprentissage itératif le neurone avec la plus grande activation initiale reste actif, pendant que tous les autres neurones convergent vers une activation nulle. À la fin un seul neurone reste actif, avec une sortie de 1, et tous les autres sont inactives avec une sortie nulle. Cette stratégie est connue sur le nome de 'le gagneur prend tout'. Ce principe a dénommé les réseaux auto-organisateurs aussi comme des réseaux compétitifs. Pendant les années plusieurs chercheurs élaboraient des modÃˆles compétitifs, ayant diverses lois d'apprentissage: von der Malsburg (1973), Grossberg (1972,1976), Fukushima (1975), Bienenstock, Cooper et Munro (1980), Rumelhart et Ziepser (1985).

Par exemple, conformément à la rÃˆgle du Kohonen les poids du neurone gagnant k se modifie avec la rÃˆgle:

(6.3)

Ainsi le vecteur poids se déplace avec une fractionne h vers le vecteur d’entrée x. C’est recommandable une vitesse d’apprentissage initiale h=0.8 qui décroit vers une valeur h=0.1 ou plus petite. Pour tous les autres neurones les poids restent constants :

(6.4)

Dans les paragraphes suivants on présente des autres lois d’apprentissage.

6.2 L’interprétation géométrique

On peut représenter les vecteurs poids et les modÃˆles d’entrée par des points sur une sphÃˆre N dimensionnelle, s’ils sont normalisés. La rÃˆgle d’apprentissage spécifie que chaque fois qu’un neurone gagne la compétition son vecteur poids converge vers le modÃˆle d’entrée. C’est à dire que son vecteur poids se déplace de la location courante vers la location du vecteur d’entrée sur la sphÃˆre, comme on voit dans la Fig.6.2.

Fig.6.2 Représentation du déplacement du vecteur poids

Dans Fig.6.3 les modÃˆles d’entrée (stimuli) sont représentés par des rectangles et les poids par des cercles.. Les stimuli similaires sont situés dans des points proches sur la sphÃˆre.

Dans la Fig.6.3a on peut voir huit stimuli. Les modÃˆles similaires d’entrée sont emplasés dans des points proches sur la sphÃˆre.

Quand a l’entrée s’applique un modÃˆle, comme dans la Fig.6.3b, le neurone avec le vecteur poids plus proche de modÃˆle d’entrée gagnera la compétition. Sur la sphÃˆre, le vecteur poids se dirige vers le modÃˆle d’entrée.

Fig.6.3 Une interprétation géométrique des réseaux compétitifs

S’il y a trois neurones et trois groupes dans l’espace des modÃˆles d’entrée, chaque neurone gagnera la compétition pour une des trois groupes, comme dans la Fig.6.3c.

Pendant le temps les vecteurs poids deviendront plus denses pour les régions de l’espace d’entrée ou les modÃˆles sont plus denses et dispersés ou mÃŠme absents pour les régions avec des modÃˆles rares. C’est a dire que le RN s’adapte pou mesurer la fonction densité de probabilité des modÃˆles d’entrée.

6.3 Quelques distances métriques

Quelques distances métriques plus souvent utilisées sont les suivantes :

La norme euclidienne, donnée par l’amplitude du vecteur différence :

(6.5)

Fig.6.4 Le vecteur différence

Le carré de l’amplitude du vecteur différence :

(6.6)

Relation (6.7) représente une simplification du cas précÃˆdent.

Distance Manhattan, qui est la somme des valeurs absolue des coordonnées du vecteur différence :

(6.7)

La projection du vecteur d’entrée x sur le vecteur v. Ca c’est la plus simple mesure du rassemblement des deux vecteurs :

Fig.6.5 La projection du vecteur x sur le vecteur v

(6.8)

ou α est l’ongle entre les deux vecteurs

La distance mesurée comme produit :

(6.9)

On recommande que les deux vecteurs sont normalisés || x ||=|| v ||=1.

Distance Hamming est le nombre des positions dont deux vecteurs sont différents:

(6.10)

La distance arc de sphÃˆre :

(6.11)

ou α est l’ongle entre le vecteur poids v et x, en considÃˆrent que le vecteurs v et x ont la mÃŠme longueur.

Exemples:

On calcule quelques distances, antérieurement présentées pour les vecteurs

x = [1 1 -1 1] si v = [1 -1 -1 -1].

distance euclidien = sqrt(0² + 2² + 0² + 2²) = 2.83

distance Manhattan = 0 + 2 + 0 + 2 = 4

distance Hamming = 0 + 1 + 0 + 1 = 2

distance comme produit = [1 1 -1 1] [1 -1 -1 -1]^T = 0

Pour le neurone gagnant a été utilisée une rÃˆgle de type Kohonen :

(6.16)

oÃ™ a_W est la constante d’apprentissage avec une valeur entre 0 et 1.

Les vecteurs poids des autres neurones qui ont perdu la compétition se modifient avec un rÃˆgle similaire a relation (6.16), mais avec une constante d’apprentissage plus petit que pour le neurone gagnant :

(6.17)

oÃ™ a_W est la constante d’apprentissage des neurones perdants avec valeur entre o et 1_.

La fonction densité de probabilité est trÃˆs importante parce qu’elle contienne presque toutes les informations nécessaires sur les modÃˆles d’entrée dans quelques domaines, comme par exemples : la théorie d’information, la reconnaissance des formes, statistique.

6.6 Le réseau MAXNET

6.6.1 Des notions théorétiques

Dans ce réseau chaque neurone est couplé excitateur avec lui-mÃŠme et inhibiteur avec tous les autres :

(6.18)

oÃ™ a = < 1 est une constante positive petit N le nombre des neurones dans RN.

On peut écrire la relation (6.18) comme une matrice de dimension NxN:

(6.19)

Le vecteur d’entrée est actif seulement pendant le moment initial. Chaque neurone calcule son entrée nette avec la relation (6.1), qui dans une forme matricielle devienne:

(6.20)

Puis on calcule la sortie par l’application de la fonction d’activation:

(6.21)

La fonction d’activation est souvent définie par la relation :

(6.22)

Les sorties des tous neurones au moment t+1 sont utilisées pour déterminer les entrées nettes au moment successif t+2. On peut démontrer que par l’application récurrente des relations (6.20) et (6.21) ce réseau converge vers une situation quand un seul neurone, celui avec la plus élevée activation initiale restera actif, tandis que tous les autres activations convergÃˆrent vers zéro. C’est pourquoi ce réseau a été dénommé Maxnet, c’est à dire avec une activation NETte MAXimum. Le réseau est connu aussi sur le nome de réseau de type 'le gagneur prend tout' (GPT). Une réseau similaire est MINNET qui a aussi un seul neurone actif, celui avec la plus petite activation initiale.

Typiquement un réseau de neurones compétitif a deux couches de neurones, comme il est représenté dans la Fig.6.8:

la couche qui mesure la distance métrique ;

la couche compétitif de type Maxnet (ou Minnet);

Une fois sélectionné le neurone gagnant k, son vecteur poids change avec une rÃˆgle d’apprentissage. Soit, par exemple la loi suivante :

(6.22)

oÃ™ le terme sous fraction assure la normalisation des vecteurs poids.

Fig.6.8 La structure d’un réseau compétitif typique

Le vecteur poids se dirige vers le vecteur d’entrée x. Chaque fois, quand s’applique une entrée x le plus proche vecteur poids se tourne vers lui. En conséquence les vecteurs poids se tournent vers les zones dont il y a beaucoup modÃˆles d’entrée, c’est à dire vers les groupes des modÃˆles.

La normalisation est essentielle pour l’apprentissage du réseau Maxnet. Dans la Fig.6.9 le vecteur d’entrée et vecteur poids ont la mÃŠme orientation, mais dans le cas a ils sont normalisés et dans le cas b ils ne sont pas normalisés.

Pour le cas de Fig.6.9a, le stimulus x est plus proche de w₁ , ainsi que si on utilise la distance métrique donnée par le produit, le vecteur w₁gagne la compétition parce que:

(6.23)

Pour le cas de Fig.6.9b le vecteur w₂ est plus proche de x. Parce que la relation au-dessus présentée est encore valable, le vecteur w₁gagnera aussi la compétition et l'algorithme ratera la solution.

On désire changer l'algorithme ainsi qu'il peut opérer avec des données d'entrée qui ne sont pas normalisées. Pour choisir le neurone gagnant on peut utiliser la distance euclidienne:

(6.24)

Le neurone gagnant est le neurone k.

En place de se tourner le vecteur poids vers l'entrée (conformément à relation (6.22)), le poids est actualisé pour le neurone k gagnant avec la relation suivante:

(6.25)

4. Une loi d’apprentissage qui évite tous ces problÃˆmes et des autres qui peuvent apparaitre utilise la relation (6.25) pour le neurone gagnant et pour tous les neurones perdantes une relation similaire:

pour tous les neurones l¹k (6.27)

oÃ™ g<<g est la constante d’apprentissage.

6.7 Classificateur de lettres avec un réseau compétitif

Soit un classificateur de neurones pour quelques caractÃˆres, réalisé avec une couche de type Hamming suivie d’une couche Maxnet, avec des seuils nulles. Soient les lettres C, I, T les modÃˆles prototypes. Le RN donnera la classe dont appartient le modelé appliqué à l’entrée, respectivement la classe avec la plus petite distance Hamming du modÃˆle d’entrée. .

La couche Hamming aura un neurone avec la plus élevée activation si la distance Hamming entre le modÃˆle d’entrée et la catégorie représentée par le neurone est minimum. Le réseau MAXNET supprime les sorties des tous les autres neurones excluant le neurone avec la plus grande activation initiale. Soit le modÃˆle prototype pour une classe m :

(6.32)

La matrice des poids pour la couche Hamming qui classifie les modÃˆles d’entrée dans p classes est donnée par la relation:

(6.33)

Pour la lettre C, le modÃˆle prototype est s=[1 1 1 1 -1 -1 1 1 1 1], conformément à la figure suivante:

Fig.6.10 Les modÃˆles prototypes

Pour la lettre I le modÃˆle prototype est s=[-1 1 -1 -1 1 -1 1 -1 1 ] et pour la lettre T le modÃˆle prototype est s=[1 1 1 -1 1 -1 -1 1 -1 ]. La matrice des poids du réseau Hamming est:

(6.34)

L’entrée nette dans le réseau Hamming est donnée par la relation :

, pour m=1,2, … , p (6.35)

ou par :

(6.36)

oÃ™ HD est la distance Hamming, le nombre des positions dont les deux vecteurs diffÃˆrent. Pratiquement l’entrée nette donne le nombre des positions dont les deux vecteurs rassemblent:

(6.37)

Les entrées nettes du réseau Hamming sont données par :

(6.38)

(6.39)

(6.40)

Les sorties du réseau Hamming sont aussi les entrées dans le réseau Maxnet au moment 0 :

(6.41)

Dans une forme vectorielle :

(6.42)

Si on choit ε=0.2 (qui respecte la condition ε<1/3), la matrice W_N est :

(6.43)

L’entrée nette dans le réseau MAXNET est au moment initial :

(6.44)

Les sorties du réseau MAXNET et les entrées nettes sont successivement :

(6.45)

(6.46)

(6.47)

(6.48)

(6.49)

(6.50)

(6.51)

La sortie du réseau MAXNET est pour la quatriÃˆme itération et pour toutes les itérations ultérieures :

(6.52)

Le plus proche modÃˆle prototype est celui de la lettre C :

La décision du réseau est que le modÃˆle d’entrée distorsioné avec du bruit est la lettre C.

Politica de confidentialitate | Termeni si conditii de utilizare

DISTRIBUIE DOCUMENTUL

Vizualizari: 940
Importanta:

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Distribuie URL
https://www.scrigroup.com/limba/franceza/151/Rseaux-de-neurones-autoorganis94122.php

Adauga cod HTML in site
<a href="https://www.scrigroup.com/limba/franceza/151/Rseaux-de-neurones-autoorganis94122.php" target="_blank" title=" - https://www.scrigroup.com/limba/franceza/151/Rseaux-de-neurones-autoorganis94122.php">Réseaux de neurones auto-organisateurs</a>

Réseaux de neurones auto-organisateurs

management

DOCUMENTE SIMILARE

Réseaux de neurones auto-organisateurs

Fig.6.2 Représentation du déplacement du vecteur poids

Fig.6.3 Une interprétation géométrique des réseaux compétitifs

Fig.6.4 Le vecteur différence

Fig.6.5 La projection du vecteur x sur le vecteur v

La fonction densité de probabilité est trÃˆs importante parce qu’elle contienne presque toutes les informations nécessaires sur les modÃˆles d’entrée dans quelques domaines, comme par exemples : la théorie d’information, la reconnaissance des formes, statistique.

6.6 Le réseau MAXNET

Fig.6.8 La structure d’un réseau compétitif typique

6.7 Classificateur de lettres avec un réseau compétitif

Fig.6.10 Les modÃˆles prototypes

DISTRIBUIE DOCUMENTUL

Comenteaza documentul: