Mam problem z klasyfikacją binarną:
- Około 1000 próbek w zestawie treningowym
- 10 atrybutów, w tym binarne, numeryczne i kategoryczne
Który algorytm jest najlepszym wyborem dla tego rodzaju problemu?
Domyślnie zacznę od SVM (wstępne posiadanie nominalnych wartości atrybutów przekonwertowanych na funkcje binarne), ponieważ jest uważane za najlepsze dla stosunkowo czystych i nie zaszumionych danych.