Poza oczywistymi cechami klasyfikatora, takimi jak
- koszt obliczeniowy,
- oczekiwane typy danych funkcji / etykiet i
- przydatność do określonych rozmiarów i wymiarów zbiorów danych,
jakich pięciu najlepszych (lub 10, 20?) klasyfikatorów wypróbowuje najpierw na nowym zbiorze danych , o którym jeszcze niewiele wiadomo (np. semantyka i korelacja poszczególnych cech)? Zwykle wypróbowuję Naive Bayes, Nearest Neighbor, drzewo decyzyjne i SVM - chociaż nie mam żadnego dobrego powodu do tego wyboru, poza tym, że je znam i w większości rozumiem, jak działają.
Myślę, że należy wybrać klasyfikatory, które obejmują najważniejsze ogólne podejścia klasyfikacyjne. Który wybór poleciłbyś według tego kryterium lub z innego powodu?
AKTUALIZACJA: Alternatywnym sformułowaniem tego pytania może być: „Jakie są ogólne podejścia do klasyfikacji i jakie konkretne metody obejmują te najważniejsze / popularne / obiecujące?”