Ponieważ jesteś zdezorientowany, pozwól mi zacząć od przedstawienia problemu i zadawania pytań jeden po drugim. Masz próbkę o wielkości 10.000 i każda próbka jest opisana przez wektor cech . Jeśli chcesz przeprowadzić regresję za pomocą radialnych funkcji bazowych Gaussa, to szukasz funkcji w postaci gdzie są podstawowymi funkcjami. W szczególności musisz znaleźć wagi , aby dla danych parametrów i zminimalizować błąd między a odpowiednią prognozą =x∈R31
f(x)=∑jwj∗gj(x;μj,σj),j=1..m
gimwjμjσjyy^f(x^) - zazwyczaj zminimalizujesz błąd najmniejszych kwadratów.
Czym dokładnie jest parametr J indeksu dolnego Mu?
Musisz znaleźć podstawowe funkcje . (Trzeba jeszcze ustalić liczbę ) Każda funkcja podstawą będzie miał i (także nieznane). dolny wynosi od do .mgjmμjσjj1m
Czy jest wektorem?μj
Tak, jest to punkt . Innymi słowy, jest to punkt gdzieś w przestrzeni cech i A musi być określony dla każdego z funkcji bazowych.R31μm
Czytałem, że to rządzi lokalizacjami podstawowych funkcji. Czy to nie oznacza czegoś?
Podstawowa funkcja jest wyśrodkowana na . Musisz zdecydować, gdzie są te lokalizacje. Więc nie, niekoniecznie jest to środek czegokolwiek (ale poniżej znajdziesz sposoby na określenie tego)jthμj
Teraz sigma, która „rządzi skalą przestrzenną”. Co to dokładnie jest?
σ jest łatwiejsza do zrozumienia, jeśli przejdziemy do samych podstawowych funkcji.
Pomaga myśleć o radialnych funkcjach podstawy Gaussa w niższych dimensonach, np. Mathbb lub . W Gaussowską radialną funkcją bazową jest po prostu dobrze znana krzywa dzwonowa. Dzwon może oczywiście być wąski lub szeroki. Szerokość jest określana przez - im większa tym węższy kształt dzwonu. Innymi słowy, skaluje szerokość kształtu dzwonu. Więc dla = 1 nie mamy skalowania. W przypadku dużego mamy znaczne skalowanie.R1R2R1σσσσσ
Możesz zapytać, jaki jest tego cel. Jeśli pomyślisz o dzwonku pokrywającym pewną część przestrzeni (linia w ) - wąski dzwonek zakrywa tylko niewielką część linii *. Punkty pobliżu środka dzwonu będą miały większą wartość . Punkty daleko od centrum będą miały mniejszą wartość . Skalowanie powoduje przesuwanie punktów dalej od środka - gdy dzwonek zwęża się, punkty będą znajdować się dalej od środka - zmniejszając wartośćR1xgj(x)gj(x)gj(x)
Każda funkcja podstawowa przekształca wektor wejściowy x w wartość skalarną
Tak, oceniasz funkcje podstawowe w pewnym momencie .x∈R31
exp(−∥x−μj∥222∗σ2j)
W rezultacie otrzymujesz skalar. Wynik skalarny zależy od odległości punktu od centrum podanej przezi skalar .xμj∥x−μj∥σj
Widziałem niektóre implementacje, które próbują dla tego parametru wartości .1, .5, 2.5. Jak obliczane są te wartości?
Jest to oczywiście jeden z interesujących i trudnych aspektów stosowania radialnych funkcji bazowych Gaussa. podczas przeszukiwania sieci znajdziesz wiele sugestii dotyczących sposobu określania tych parametrów. W bardzo prosty sposób przedstawię jedną możliwość opartą na grupowaniu. Możesz znaleźć tę i kilka innych sugestii online.
Zacznij od grupowania 10000 próbek (możesz najpierw użyć PCA do zmniejszenia wymiarów, a następnie grupowania k-Means). Możesz pozwolić, aby była liczbą znalezionych klastrów (zwykle stosując weryfikację krzyżową w celu ustalenia najlepszego ). Teraz utwórz radialną funkcję podstawową dla każdego skupienia. Dla każdej radialnej funkcji bazowej niech będzie środkiem (np. Średnią, centroidem itp.) Klastra. Niech odzwierciedla szerokość klastra (np. Promień ...) Teraz przejdź do regresji (ten prosty opis to tylko przegląd - wymaga dużo pracy na każdym kroku!)mmgjμjσj
* Oczywiście, krzywa dzwonowa jest zdefiniowana od - do więc będzie miała wartość wszędzie na linii. Jednak wartości daleko od centrum są znikome∞∞