Analiza głównych składników może wykorzystywać rozkład macierzy, ale to tylko narzędzie, aby się tam dostać.
Jak znalazłbyś główne składniki bez użycia algebry macierzowej?
Jaka jest funkcja celu (cel) i jakie są ograniczenia?
Analiza głównych składników może wykorzystywać rozkład macierzy, ale to tylko narzędzie, aby się tam dostać.
Jak znalazłbyś główne składniki bez użycia algebry macierzowej?
Jaka jest funkcja celu (cel) i jakie są ograniczenia?
Odpowiedzi:
Bez próby uzyskania pełnego startera na PCA, z punktu widzenia optymalizacji, podstawową funkcją celu jest iloraz Rayleigha . Macierz, która zawiera iloraz, to (pewna wielokrotność) przykładowa macierz kowariancji w którym każdy jest wektorem funkcji i jest taki, że matryca ty rząd jest .xipXix T i
PCA dąży do rozwiązania sekwencji problemów optymalizacyjnych. Pierwszym w sekwencji jest nieograniczony problem
Ponieważ, powyższy nieograniczony problem jest równoważny ograniczonemu problemowi
Tutaj pojawia się algebra macierzy. Ponieważ jest symetryczną dodatnią macierzą półfinałową (z konstrukcji!), Ma rozkład wartości własnej postaci gdzie jest macierz ortogonalna (więc ) i jest macierzą diagonalną z nieujemnymi wpisami przykład .
Stąd, . Ponieważ jest ograniczony w tym problemie, aby mieć normę jeden, tak też jest ponieważ , ponieważ jest ortogonalny.
Ale jeśli chcemy zmaksymalizować ilość pod ograniczeniami, że , to co możemy zrobić, to: ustaw , to znaczy i dla .
Teraz, wycofując odpowiednie , czego właśnie szukaliśmy, otrzymujemy, że gdzie oznacza pierwszą kolumnę , czyli wektor własny odpowiadający największej wartości własnej . Wartość funkcji celu można wtedy łatwo rozpoznać jako .
Pozostałe główne wektory składowe można następnie znaleźć, rozwiązując sekwencję (indeksowaną przez ) problemów optymalizacyjnych Problem jest taki sam, z tym wyjątkiem, że dodajemy dodatkowe ograniczenie, że rozwiązanie musi być ortogonalne dla wszystkich poprzednich rozwiązań w sekwencji. Nie jest trudny do rozszerzenia argumentu powyżej indukcyjnie pokazują, że roztwór th problemem jest to, w rzeczywistości, , tym p wektor własny .
Roztwór PKD ulega także często ekspresji w odniesieniu do pojedynczej wartości rozkładu z . Zrozumieć, dlaczego pozwolić . Następnie i tak (ściśle mówiąc, do znaku flips) i .
Główne komponenty można znaleźć, rzutując na wektory głównych komponentów. Z właśnie podanego sformułowania SVD łatwo zauważyć, że
Prostota reprezentacji zarówno wektorów głównych składników, jak i samych głównych składników w odniesieniu do SVD macierzy cech, jest jednym z powodów, dla których SVD wyróżnia się tak wyraźnie w niektórych zabiegach PCA.
Rozwiązanie przedstawione przez kardynała skupia się na macierzy kowariancji próbki. Kolejnym punktem wyjścia jest błąd rekonstrukcji danych przez q- wymiarową hiperpłaszczyznę. Jeśli p- wymiarowe punkty danych to celem jest rozwiązanie
dla macierzy z kolumnami ortonormalnymi i . To daje najlepszą rangę rekonstrukcji q mierzoną przez normę euklidesową, a kolumny rozwiązania są pierwszymi q głównymi wektorami składowymi.
Dla naprawionego rozwiązaniem dla i (jest to regresja) są
Dla ułatwienia notacji załóżmy, że zostały wyśrodkowane w następujących obliczeniach. Następnie musimy zminimalizować
over z kolumnami ortonormalnymi. Zauważ, że to rzut na q- wymiarową przestrzeń kolumny. Dlatego problem jest równoważny z minimalizowaniem
na rang q występy . Oznacza to, że musimy zmaksymalizować
stosunku do rzutów q q , gdzie to przykładowa macierz kowariancji. Teraz
Błąd rekonstrukcji sugeruje szereg użytecznych uogólnień, na przykład rzadkie główne elementy lub rekonstrukcje za pomocą niskowymiarowych rozmaitości zamiast hiperplanów. Aby uzyskać szczegółowe informacje, patrz sekcja 14.5 w Elementy uczenia statystycznego .