Jestem nowicjuszem w uczeniu maszynowym (także niektóre statystyki), od dłuższego czasu uczę się wiedzy (algorytmy uczenia nadzorowanego / bez nadzoru, odpowiednie metody optymalizacji, regularyzacje, niektóre filozofie (takie jak kompromis odchylenie biasu?). Wiem, że bez prawdziwej praktyki nie uzyskałbym głębokiego zrozumienia tych rzeczy związanych z uczeniem maszynowym.
Zacznę więc od pewnego problemu z klasyfikacją rzeczywistych danych, na przykład odręcznej klasyfikacji cyfr (MNIST). Ku mojemu zaskoczeniu, bez uczenia się / inżynierii cech , dokładność osiąga 0,97 przy użyciu klasyfikatora losowego lasu z wartościami surowych pikseli jako danych wejściowych. Próbowałem także innych algorytmów uczenia się, takich jak SVM, LR z dostrajanymi parametrami.
Potem się zgubiłem, czy byłoby to zbyt łatwe, czy coś mi tu brakuje? Wystarczy pobrać algorytm uczenia się z zestawu narzędzi i dostroić niektóre parametry?
Gdyby w praktyce chodziło o uczenie maszynowe, straciłbym zainteresowanie tym zagadnieniem. Przez kilka dni myślałem i czytałem blogi i doszedłem do kilku wniosków:
Najważniejszą częścią uczenia maszynowego w praktyce jest inżynieria funkcji , to znaczy biorąc pod uwagę dane, znaleźć lepszą reprezentację funkcji.
Ważny jest również to, który algorytm uczenia się ma być użyty, także dostrajanie parametrów, ale ostateczny wybór dotyczy bardziej eksperymentów.
Nie jestem pewien, czy rozumiem to poprawnie, mając nadzieję, że każdy może mnie poprawić i dać mi sugestie dotyczące uczenia maszynowego w praktyce.