Używam klasyfikatora, który zwraca prawdopodobieństwa. Aby obliczyć AUC, używam pakietu pROC R. Prawdopodobieństwa wyjściowe z klasyfikatora są następujące:
probs=c(0.9865780,
0.9996340,
0.9516880,
0.9337157,
0.9778576,
0.8140116,
0.8971550,
0.8967585,
0.6322902,
0.7497237)
probs
pokazuje prawdopodobieństwo zaliczenia do klasy „1”. Jak pokazano, klasyfikator sklasyfikował wszystkie próbki w klasie „1”.
Prawdziwy wektor etykiety to:
truel=c(1, 1, 1, 1, 1, 0, 0, 0, 0, 0)
Jak pokazano, klasyfikator błędnie sklasyfikował 5 próbek. Ale AUC to:
pROC::auc(truel, probs)
Area under the curve: 1
Czy możesz mi wyjaśnić, dlaczego tak się dzieje?