Quels sont les critères de validation d'une méthode ?

 

 

Une fois l’étude des données effectuée, il existe des méthodes permettant de connaître la qualité des résultats et de les valider.

 

Table de confusion:

Une table de confusion est un outil permettant d’évaluer la qualité d’une classification. Elle est obtenue en comparant les données classées avec les données de référence.

Les données de référence sont acquises sur le terrain. Pour pouvoir réaliser une comparaison, il faut qu’elles soient dans la même typologie que la classification.

La matrice de confusion se construit en mettant respectivement sur les lignes et sur les colonnes les données de référence et la classification. Ceci permet de calculer :

- la précision totale : nombre d’éléments bien classés divisé par le nombre total d'individus.

- l'erreur d'excédents : pourcentage d’éléments d'une classe issue de la classification qui appartiennent, en fait à d'autres classes dans les données de référence.

- la précision pour l'utilisateur : pourcentage d’éléments d'une classe issue de la classification correspondant à la même classe dans les données de référence.

- l'erreur de déficits : pourcentage d’éléments d'une classe de référence affectés à d'autres classes par la classification.

- la précision pour le réalisateur : pourcentage d’éléments d'une classe de référence affectés à la même classe par la classification.

 

Source information: https://tice.agroparistech.fr/coursenligne/courses/TELEDETECTION/document/cours_teledetection/CONFUSMA.html

 

 

Courbe ROC:

La courbe de ROC, Receiver Operating Characteristics, est une courbe qui mesure la performance d’un classificateur binaire (système qui classe des éléments en deux groupes distincts selon des caractéristiques). Cette courbe est très utilisée dans le domaine pharmaceutique, en biologie ou en radiologie. La courbe représente en général le taux de vrais positifs (positifs effectivement détectés) au taux de faux positifs (négatifs détectés).Cette courbe est utilisée pour faire des tests diagnostiques quantitatifs. La surface sous la courbe est la probabilité que le diagnostic soit correct.

 

 

Validation croisée:

La validation croisée est une méthode pour estimer la qualité du modèle.

Elle se base par des méthodes d’échantillonnage pour calculer l’erreur.

 

 

Article publié le 2 novembre 2015 par Comité de Caritat.

Posez votre question, nos experts vous répondront