Studiujemy uczenie maszynowe za pośrednictwem uczenia maszynowego: perspektywa probabilistyczna (Kevin Murphy). Chociaż tekst wyjaśnia teoretyczne podstawy każdego algorytmu, rzadko mówi, w którym przypadku algorytm jest lepszy, a kiedy to robi, nie mówi, jak powiedzieć, w którym przypadku jestem.
Na przykład przy wyborze jądra powiedziano mi, aby przeprowadzić eksploracyjną analizę danych, aby ocenić stopień złożoności moich danych. W prostych danych dwuwymiarowych mogę wykreślić i sprawdzić, czy właściwe jest jądro liniowe czy radialne. Ale co robić w wyższym wymiarze?
Mówiąc bardziej ogólnie, co ludzie mają na myśli, mówiąc „poznaj swoje dane” przed wybraniem algorytmu? W tej chwili mogę jedynie odróżnić algorytm klasyfikacji od regresji i algorytm liniowy od nieliniowego (którego nie mogę sprawdzić).
EDYCJA: Mimo że moje pierwotne pytanie dotyczy uniwersalnej reguły ogólnej, poproszono mnie o podanie dodatkowych informacji na temat mojego konkretnego problemu.
Dane: panel z każdym rzędem przypadającym na miesiąc kraju (łącznie około 30 000 wierszy, obejmujący ~ 165 krajów w ciągu ~ 15 lat).
Odpowiedź: 5 interesujących zmiennych binarnych (tj. Czy protest / zamach stanu / kryzys itp. Zdarzy się w tym miesiącu).
Cechy: ~ 400 zmiennych (połączenie ciągłego, kategorycznego, binarnego) wyszczególniających garść cech charakterystycznych dla 2 poprzednich miesięcy krajowych (można utworzyć dłuższe opóźnienie). Używamy tylko zmiennych opóźnionych, ponieważ celem jest przewidywanie.
Przykłady obejmują kurs walutowy, wzrost PKB (ciągły), poziom wolnej prasy (kategoryczny), demokrację, konflikt sąsiada (binarny). Należy pamiętać, że wiele z tych 400 funkcji to zmienne opóźnione.