Chciałbym porównać 2 różne klasyfikatory dla problemu klasyfikacji tekstów wieloklasowych, które wykorzystują duże zestawy danych szkoleniowych. Wątpię, czy powinienem użyć krzywych ROC, czy krzywych uczenia się, aby porównać 2 klasyfikatory.
Z jednej strony krzywe uczenia się są przydatne do decydowania o wielkości zbioru danych szkoleniowych, ponieważ można znaleźć rozmiar zbioru danych, w którym klasyfikator przestaje się uczyć (a może degraduje). Zatem najlepszym klasyfikatorem w tym przypadku może być ten, który osiąga najwyższą dokładność przy najmniejszym rozmiarze zestawu danych.
Z drugiej strony krzywe ROC pozwalają znaleźć punkt z właściwym kompromisem między czułością / swoistością. Najlepszy klasyfikator w tym przypadku to ten, który jest bliżej lewej górnej części, z najwyższym TPR dla dowolnego FPR.
Czy powinienem stosować obie metody oceny? Czy jest możliwe, że metoda o lepszej krzywej uczenia się ma gorszą krzywą ROC i odwrotnie?