Niedawno na zajęciach uczenia maszynowego u profesora Oriola Pujola z UPC / Barcelona opisał najczęstsze algorytmy, zasady i koncepcje do wykorzystania w szerokim zakresie zadań związanych z uczeniem maszynowym. Tutaj dzielę się nimi z tobą i pytam:
- czy istnieją jakieś kompleksowe ramy dopasowujące zadania z podejściami lub metodami związanymi z różnymi rodzajami problemów związanych z uczeniem maszynowym?
Jak nauczyć się prostego gaussowskiego? Prawdopodobieństwo, zmienne losowe, rozkłady; estymacja, zbieżność i asymptotyka, przedział ufności.
Jak nauczyć się mieszanki Gaussów (MoG)? Prawdopodobieństwo, Oczekiwanie-Maksymalizacja (EM); uogólnienie, wybór modelu, walidacja krzyżowa; k-średnie, ukryte modele Markowa (HMM)
Jak nauczyć się jakiejkolwiek gęstości? Estymacja parametryczna a nieparametryczna, Sobolejew i inne przestrzenie funkcjonalne; błąd l ́ 2; Szacowanie gęstości jądra (KDE), optymalne jądro, teoria KDE
Jak przewidzieć zmienną ciągłą (regresję)? Regresja liniowa, regularyzacja, regresja kalenicowa i LASSO; lokalna regresja liniowa; estymacja gęstości warunkowej.
Jak przewidzieć zmienną dyskretną (klasyfikację)? Klasyfikator Bayesa, naiwny Bayesa, generatywny vs. dyskryminacyjny; perceptron, rozkład masy, liniowa maszyna wektora nośnego; najbliższy sąsiad klasyfikator i teoria
Z jakiej funkcji utraty należy korzystać? Teoria szacowania maksymalnego prawdopodobieństwa; oszacowanie l -2; Oszacowanie Bayessa; teoria minimaks i teorii decyzji, bayesianizm a częstość
Którego modelu powinienem użyć? AIC i BIC; Teoria Vapnika-Chervonenskisa; teoria walidacji krzyżowej; ładowanie; Teoria prawdopodobnie w przybliżeniu poprawna (PAC); Granice pochodzące od Hoeffdinga
Jak mogę nauczyć się bardziej zaawansowanych (połączonych) modeli? Teoria uczenia się w zespole; wzmocnienie; parcianka; układanie w stosy
Jak mogę nauczyć się bardziej wyszukanych (nieliniowych) modeli? Uogólnione modele liniowe, regresja logistyczna; Twierdzenie Kołmogorowa, uogólnione modele addytywne; jądro, odtwarzanie przestrzeni jądra Hilberta, nieliniowa SVM, regresja procesu Gaussa
Jak mogę nauczyć się bardziej wytwornych (kompozytowych) modeli? Modele rekurencyjne, drzewa decyzyjne, hierarchiczne grupowanie; sieci neuronowe, propagacja wsteczna, sieci głębokiej wiary; modele graficzne, mieszanki HMM, warunkowe pola losowe, maksymalne marże sieci Markowa; modele logarytmiczno-liniowe; gramatyki
Jak zmniejszyć lub powiązać funkcje? Wybór cech a redukcja wymiarów, metody owijania do wyboru cech; przyczynowość a korelacja, korelacja częściowa, uczenie się struktury netto Bayesa
Jak utworzyć nowe funkcje? analiza głównych składników (PCA), niezależna analiza składników (ICA), skalowanie wielowymiarowe, różnorodne uczenie się, nadzorowana redukcja wymiarów, uczenie metryczne
Jak zmniejszyć lub powiązać dane? Klastrowanie, bi-klastrowanie, klastrowanie ograniczone; zasady stowarzyszenia i analiza koszyka rynkowego; regresja rankingowa / porządkowa; analiza linków; dane relacyjne
Jak traktować szeregi czasowe? ARMA; Filtr Kalmana i modele w przestrzeni statycznej, filtr cząstek; funkcjonalna analiza danych; wykrywanie punktu zmiany; cross-validation dla szeregów czasowych
Jak leczyć nie idealne dane? przesunięcie współzmienne; brak równowagi klas; brakujące dane, nieregularnie próbkowane dane, błędy pomiarowe; wykrywanie anomalii, odporność
Jak zoptymalizować parametry? Optymalizacja nieograniczona a ograniczona / wypukła, metody bez pochodnych, metody pierwszego i drugiego rzędu, dopasowanie; naturalny gradient; związana optymalizacja i EM
Jak zoptymalizować funkcje liniowe? obliczeniowa algebra liniowa, inwersja macierzy dla regresji, rozkład wartości osobliwych (SVD) dla redukcji wymiarowości
Jak zoptymalizować z ograniczeniami? Wypukłość, mnożniki Lagrange'a, warunki Karusha-Kuhna-Tuckera, metody punktów wewnętrznych, algorytm SMO dla SVM
Jak ocenić głęboko zagnieżdżone kwoty? Dokładne wnioskowanie o modelu graficznym, ograniczenia wariacyjne sum, przybliżone wnioskowanie o modelu graficznym, propagacja oczekiwań
Jak oceniać duże kwoty i wyszukiwania? Uogólnione problemy z ciałem N (GNP), hierarchiczne struktury danych, wyszukiwanie najbliższego sąsiada, szybka metoda wielokrotna; Integracja z Monte Carlo, Markov Chain Monte Carlo, Monte Carlo SVD
Jak leczyć jeszcze większe problemy? Równoległe / rozproszone EM, równoległe / rozproszone PNB; stochastyczne metody podporządkowania, nauka online
Jak zastosować to wszystko w prawdziwym świecie? Przegląd części ML, wybór między metodami stosowanymi do każdego zadania, wcześniejszą wiedzą i założeniami; eksploracyjna analiza danych i wizualizacja informacji; ocena i interpretacja, z wykorzystaniem przedziałów ufności i testu hipotez, krzywych ROC; gdzie są problemy badawcze w ML