|
Classification avec Neuro One
|
Accueil Précédent Suivant |
|
|
| Présentation
|
|
|
| La Suite Neuro One permet de réaliser des classifieurs à plusieurs classes. Ces classifieurs donnent la probabilité d'appartenance à chacune des classes, avec la contrainte que la somme des probabilités est égale à 1.
|
|
|
| Si le problème posé comprend deux classes, Neuro One propose directement un réseau adapté.
|
| Si le problème comprend plus de deux classes, la méthodologie proposée est la suivante :
|
| · Développer autant de classifieurs à deux classes que de paires de classes,
|
| · Fusionner les classifieurs obtenus en un seul avec Neuro Shop.
|
| Par exemple, un problème comprenant trois classes a, b et g nécessite de créer 3*2/2 =3 classifieurs. Ces classifieurs sont a contre b, a contre g, et b contre g.
|
|
|
| Cette méthodologie n'est pas la seule envisageable. En effet, il est possible de développer des classifieurs à une classe contre toutes les autres. Dans la plupart des cas, cette méthode est beaucoup moins précise ; c'est pourquoi nous ne la décrivons pas en détail.
|
|
|
| Classification à 2 classes
|
|
|
| On note
|
| · | A un ensemble de points appartenant à la classe A,
|
| · | NA le nombre de points de l'ensemble A,
|
| · | B un ensemble de points appartenant à la classe B,
|
| · | NB le nombre de points de l'ensemble B,
|
| · | x le vecteur de variables des répartitions étudiées,
|
| · |
| · | fA(x) la fonction de densité de probabilité des points de A,
|
| · | fB(x) la fonction de densité de probabilité des points de B.
|
|
|
| La fonction |
| Pour modéliser la probabilité a posteriori d'appartenance à la classe A connaissant x, |
|
| La fonction d'activation du neurone de sortie est une sigmoïde ; ainsi la sortie est comprise entre 0 et 1.
|
| De plus, Neuro One ajoute une synapse fixe entre le biais et la sortie. Le poids de cette synapse est défini à partir de la probabilité a priori d'appartenance à la classe A ou B (rapport des nombres de points des ensembles A et B).
|
|
|
|
|
| Neuro Shop permet de supprimer cette synapse après apprentissage. On obtient directement un réseau qui modélise le rapport des fonctions de répartition des deux ensembles de points A et B, indépendamment du rapport des nombres de points de chaque classe dans l'ensemble d'apprentissage :
|
|
|
|
|
| D'autre part, si l'on cherche à modéliser le rapport des fonction de densité de probabilité, soit la fonction suivante :
|
|
|
|
|
| Le nouveau réseau est obtenu avec Neuro Shop en apportant les modifications suivantes au précèdent réseau :
|
| · Remplacer la fonction d'activation sigmoïde du neurone de sortie par une fonction identité,
|
| · Ajouter une nouvelle couche de sortie contenant un neurone de fonction d'activation exponentielle, connecté à l'ancien neurone de sortie par une synapse fixe de poids 2.
|
|
|
| Le schéma du réseau de neurones devient :
|
|
|
|
|
|
| L'apprentissage d'un réseau de classification se passe de la même manière que pour un réseau standard. Il est recommandé de commencer par l'analyse des entrées, afin de limiter autant que faire se peut le nombre d'entrées pertinentes.
|
|
|
| Classification à N classes
|
|
|
| Pour un problème à N classes, nous disposons donc de N(N-1)/2 classifieurs à deux classes. On montre que la probabilité d'appartenance à la classe I parmi les N classes connaissant x, est donnée par :
|
|
|
|
| où |
|
|
Cette relation peut s'écrire
|
ou encore
|
|
|
| La réalisation du classifieur à N classes donnant sur ses N sorties les probabilités d'appartenance à chacune ces classes se déduit de cette relation.
|
|
|
| Pour tenir compte de la relation |
|
|
|
|
|
|
|
| On utilise ces réseaux comme éléments de base pour réaliser le réseau classifieur général.
|
|
|
| Exemple de classifieur à trois classes
|
| Cet exemple est réalisé à l'aide de N.NetShop
|
|
|
|
|
|
| On voit facilement que ce réseau vérifie |
| La précision de cette relation étant très inférieure à la précision de calcul de la machine, il est possible d'améliorer ce résultat en utilisant le réseau suivant :
|
|
|
|
|
|
|
|
|
|
| Cette structure n'est pas symétrique par rapport aux trois classes car il n'y a que les probabilités d'appartenance aux classes A et B qui soient calculées directement. La probabilité d'appartenance à la classe C est déduite des deux précédentes.
|
|
|
|
|
| Si l'on souhaite une structure symétrique, on peut alors utiliser le réseau suivant :
|
|
|
|
|
|
| Dans ce réseau, les valeurs des probabilités sont calculées directement, puis le résultat est divisé par la somme des trois. Ce résultat est obtenu en calculant la somme des résultats provisoires, puis en injectant cette somme en facteur Pi diviseur dans les neurones de la couche de sortie.
|
|
|
|
|