Objaśnienie wykresu obciążenia analizy PCA lub analizy czynnikowej.
Ładowanie wykres pokazuje zmienne jako punkty w przestrzeni głównych składników (lub czynników). Współrzędne zmiennych to zwykle obciążenia. (Jeśli poprawnie połączysz wykres ładowania z odpowiednim wykresem rozproszenia przypadków danych w tej samej przestrzeni komponentów, będzie to biplot.)
Miejmy 3 jakoś skorelowane zmienne, , W , U . Jesteśmy centrum je i wykonać PCA , wydobywania 2 pierwsze główne komponenty z trzech: F 1 i F 2 . Używamy obciążeń jako współrzędnych do wykonania poniższego wykresu obciążenia . Obciążenia są niestandardowymi elementami wektorów własnych, tj. Wektorami własnymi wyposażonymi w odpowiednie wariancje składowe lub wartości własne.VWUF1F2
Działka ładująca to płaszczyzna na zdjęciu. Rozważmy zmienną tylko . Strzałka zwykle narysowana na powierzchni ładunkowej jest tutaj oznaczona jako h ′ ; współrzędne a 1 , a 2 są ładunkami V z F 1Vh′a1a2VF1 i (pamiętaj, że terminologicznie bardziej poprawne jest powiedzenie „składnik ładuje zmienną”, a nie odwrotnie).F2
Strzałka jest rzutem na płaszczyznę elementów konstrukcyjnych wektora h co jest rzeczywistą pozycję zmienną V w zmiennych przestrzeni objętej przez V , W , U . Kwadrat długość wektora, H 2 , jestwariancjaz V . Podczas gdy h ′ 2 jestczęścią tej wariancji wyjaśnionejprzez dwa składniki.h′hVVWUh2aVh′2
Ładowanie, korelacja, prognozowana korelacja . Ponieważ zmienne wyśrodkowany przed ekstrakcji składników jest korelacji Pearsona między V i składnika F 1 . Które nie powinny być mylone z cos a na wykresie ładunkowej, która jest następna porcja: jest korelacji Pearsona między składnika F 1 i zmiennej wektorowej tu h ' . Jako zmienna hcosϕVF1cosαF1h′ jest prognozowaniem V przez (znormalizowane) komponenty w regresji liniowej (porównaj z rysowaniem geometrii regresji liniowejtutajh′V), W którym obciążenia „y są współczynnikami regresji (jeśli składniki są utrzymywane prostopadłe, a wyodrębniony).a
Dalej. Możemy pamiętać (trygonometria), że . Można to rozumieć jako iloczyn skalarny między wektorem V a wektorem długości F 1 : h ⋅ 1 ⋅ cos ϕ . F 1 jest ustawiony na ten wektor wariancji jednostkowej, ponieważ nie ma swojej własnej wariancji oprócz tej wariancji V, którą wyjaśnia (o kwotę h ′ ): tj. F 1a1=h⋅cosϕVF1h⋅1⋅cosϕF1Vh′F1jest jednostką wyodrębnioną z V, W, U, a nie jednostką zaproszoną z zewnątrz. Następnie wyraźnie, 1 = √tokowariancjamiędzyVaznormalizowanym, skalowanym jednostkowob(aby ustawićs1= √a1=varV⋅varF1−−−−−−−−−−√⋅r=h⋅1⋅cosϕVb) składnikF1. Ta kowariancja jest bezpośrednio porównywalna z kowariancją między zmiennymi wejściowymi; na przykład kowariancja międzyViWbędzie iloczynem ich długości wektora pomnożonej przez cosinus między nimi.s1=varF1−−−−−√=1F1VW
Podsumowując, ładuje może być postrzegane jako kowariancji pomiędzy standardowy element i zmiennej obserwowanej h ⋅ 1 ⋅ cos φ lub równoważnie pomiędzy standardowy element, a wskazano (przez wszystkie elementy wyznaczające powierzchni) obrazu z zmienna, h ′ ⋅ 1 ⋅ cos α . To cos α można nazwać korelacją V-F1 rzutowaną na podprzestrzeń komponentu F1-F2.a1h⋅1⋅cosϕh′⋅1⋅cosαcosα
Wspomniana korelacja między zmienną a składową, cosϕ=a1/h , jest również nazywana obciążeniem znormalizowanym lub przeskalowanym . Jest to wygodne w interpretacji komponentów, ponieważ mieści się w przedziale [-1,1].
Związek z wektorami własnymi . Przeskalowano ładowanie powiniennienależy mylić zwektora własnegoelementu, który - jak wiemy - jest cosinus kąta pomiędzy zmienną a główny składnik. Przypomnijmy, żeładowanie jestelementem wektorowym powiększonym o pojedynczą wartość komponentu (pierwiastek kwadratowy wartości własnej). Tj. Dla zmiennej V naszego wykresu: a 1 = e 1 s 1 , gdzie s 1 to st. odchylenie (nie 1, ale oryginalne, tj. liczba pojedyncza) F 1cosϕVa1=e1s1s11F1zmienna ukryta. Potem przychodzi ten element wektora własnego , a nie samcosϕ. Zamieszanie wokół dwóch słów „cosinus” rozwiązuje się, gdy przypomnimy sobie, w jakim rodzaju reprezentacji przestrzeni jesteśmy. Wartość własna wektoratocosinuskąta obrotuzmiennej jako osi w pr. komponent jako oś w przestrzeni zmiennej (inaczej widok wykresu rozrzutu),tak jak tutaj. Podczas gdycosϕna naszym wykresie ładowaniajest miarą podobieństwa cosinusmiędzy zmienną jako wektorem a wartością pr. komponent jako ... cóż ... również jako wektor, jeśli chcesz (choć jest on rysowany jako oś na wykresie), - ponieważ jesteśmy obecnie wprzestrzeni tematyczneje1=a1s1=hs1cosϕcosϕcosϕ (który wykres obciążenia jest), gdzie zmienne skorelowane są fanami wektorów - nie są osiami ortogonalnymi, - a kąty wektorowe są miarą asocjacji - a nie obrotu podstawy przestrzeni.
Podczas gdy obciążenie jest miarą powiązania kątowego (tj. Typu produktu skalarnego) między zmienną a składnikiem skalowanym w jednostce, a obciążenie przeskalowane jest znormalizowanym obciążeniem, w którym skala zmiennej jest również zmniejszona do jednostki, ale współczynnik wektora własnego jest obciążeniem, w którym składnik jest „ponadstandardowy”, tj. został dostosowany do skali (zamiast 1); alternatywnie można to traktować jako przeskalowane obciążenie, w którym skala zmiennej została sprowadzona do h / s (zamiast 1).1/sh/s
Więc, Jakie są skojarzenia między zmienną a składnikiem? Możesz wybrać to, co lubisz. Może to być ładowanie (kowariancja ze składnikiem skalowanym jednostkowo) ; przeskalowanych załadunku cos cp (= związek o zmiennej części); korelacja między obrazem (predykcja) a składnikiem (= przewidywana korelacja cos α ). Możesz nawet wybrać wektor własny współczynnik e = / sa cosϕcosαe=a/s , jeśli potrzebujesz (choć zastanawiam się, co może być powodem). Lub wymyśl swoją własną miarę.
Kwadratowa wartość wektora własnego ma znaczenie udziału zmiennej w pr. składnik. Skalowane obciążenie kwadratowe ma znaczenie wkładu pr. komponent do zmiennej.
Związek z PCA oparty na korelacjach. Gdybyśmy przeanalizowali PCA nie tylko wyśrodkowane, ale znormalizowane (wyśrodkowane, a następnie skalowane wariancją jednostkową) zmienne, wówczas trzy wektory zmiennych (a nie ich rzuty na płaszczyznę) byłyby tej samej długości jednostkowej. Następnie automatycznie wynika, że ładowanie jest korelacją , a nie kowariancją, między zmienną a składnikiem. Ale że korelacja nie będzie równy „znormalizowanej loading” na zdjęciu powyżej (w oparciu o analizę właśnie skupionych zmiennych), ponieważ PCA znormalizowanych zmiennych (korelacje oparte PCA) daje różne komponenty niż PCA z skupionych zmiennych ( PCA oparte na kowariancjach). W PCA opartym na korelacji acosϕ odczyt). ponieważ h = 1 , ale główne składnikiniesątymi samymigłównymi składnikami, jakie otrzymujemy z PCA opartego na kowariancjach (czytaj,a1=cosϕh=1
W analizie czynnikowej wykres obciążenia ma zasadniczo taką samą koncepcję i interpretację jak w PCA. Jedyną (ale ważną ) różnicą jest substancja . W analizie czynnikowej h ′ - zwana wówczas „wspólnotą” zmiennej - jest częścią jej wariancji, która jest wyjaśniona wspólnymi czynnikami, które są szczególnie odpowiedzialne za korelacje między zmiennymi. Podczas pobytu w PCA wyjaśniona część h ′h′h′ h′jest „mieszanką” brutto - częściowo reprezentuje korelację, a częściowo korelację między zmiennymi. Dzięki analizie czynnikowej płaszczyzna obciążeń na naszym obrazie byłaby zorientowana inaczej (w rzeczywistości rozciągnie się nawet z przestrzeni naszych zmiennych 3d do czwartego wymiaru, którego nie możemy narysować; płaszczyzna obciążeń nie będzie podprzestrzenią naszego Przestrzeń 3d rozpiętą przez i pozostałe dwie zmienne), a rzut h ' będzie miał inną długość i inny kąt α . (Teoretyczną różnicę między PCA a analizą czynnikową wyjaśniono tutaj geometrycznie poprzez reprezentację przestrzeni przedmiotowej i tutaj poprzez reprezentację przestrzeni zmiennej).Vh′α
Odpowiedź na prośbę @Antoni Parellada w komentarzach. Jest to równoważne, czy wolisz mówić w kategoriachwariancjiczyrozproszenia(SS odchylenia): variance = scatter /a,b , gdzie n jest rozmiarem próbki. Ponieważ mamy do czynienia z jednym zestawem danych o tym samym n , stała nie zmienia niczego we wzorach. Jeśli X jest danymi (ze zmiennymi V, W, U wyśrodkowanymi), to skład eigend w swojej macierzy kowariancji (A) daje te same wartości własne (wariancje składowe) i wektory własne, jak skład eigendoskładu (B) macierzy rozproszenia X ′ X/(n−1)nnXX′Xuzyskane po początkowym podzieleniu przez √Xwspółczynnik n - 1 . Po tym, w formule obciążeniu (patrz środkowej części odpowiedzi)1n−1−−−−−√ , termin h tost. odchylenie √a1=h⋅s1⋅cosϕh w (A), ale rozproszenie korzenia (tj. norma)‖V‖varV−−−−√∥V∥ w (B). Termin , który jest równy 1 , jest znormalizowanym składnikiem F 1 st. odchylenie √s11F1 w (A), ale rozproszenie pierwiastka‖F1‖w (B). Wreszciecosϕ=rjest korelacjąniewrażliwąna użycien-1w jej obliczeniach. Zatem po prostumówimypojęciowo o wariancjach (A) lub rozproszeniach (B), podczas gdy same wartości pozostają takie same we wzorze w obu przypadkach.varF1−−−−−√∥F1∥cosϕ=rn−1