Czy po PCA następuje obrót (np. Varimax) nadal PCA?

63

Próbowałem odtworzyć niektóre badania (używając PCA) z SPSS w R. Z mojego doświadczenia wynika, że principal() funkcja z pakietu psychbyła jedyną funkcją, która się zbliżyła (lub jeśli moja pamięć służy mi dobrze, martwa), aby dopasować wynik. Aby dopasować te same wyniki co w SPSS, musiałem użyć parametru principal(..., rotate = "varimax"). Widziałem artykuły mówiące o tym, jak zrobili PCA, ale w oparciu o wyniki SPSS i użycie rotacji, to bardziej przypomina analizę czynnikową.

Pytanie: Czy PCA, nawet po rotacji (użyciu varimax), nadal jest PCA? Miałem wrażenie, że może to być analiza czynnikowa ... Jeśli nie, jakich szczegółów brakuje?

— Roman Luštrik
źródło

4

Technicznie, cokolwiek masz po rotacji, nie są już głównymi komponentami.

— Gala

2

Sama rotacja tego nie zmienia. Analiza jest obrócona czy nie. PCA nie jest FA w wąskiej definicji „analizy czynnikowej”, a PCA to FA w szerszej definicji „analizy czynnikowej”. stats.stackexchange.com/a/94104/3277

— ttnphns

1

Cześć @Roman! Sprawdzam ten stary wątek i jestem zaskoczony, że zaznaczyłeś odpowiedź Bretta jako zaakceptowaną. Pytałeś, czy rotacja PCA + jest nadal PCA, czy też FA; Odpowiedź Bretta nie mówi ani słowa o rotacji! Nie wspomina również o principalfunkcji, o którą pytałeś. Jeśli jego odpowiedź rzeczywiście odpowiedziała na twoje pytanie, być może twoje pytanie nie zostało odpowiednio sformułowane; czy rozważysz edycję? W przeciwnym razie uważam, że odpowiedź doktoratu jest znacznie bliższa odpowiedzi na twoje pytanie. Pamiętaj, że możesz zmienić zaakceptowaną odpowiedź w dowolnym momencie.

— ameba mówi Przywróć Monikę

1

Powinienem dodać, że pracuję nad nową, bardziej szczegółową odpowiedzią na twoje pytanie, więc jestem ciekawy, czy nadal interesujesz się tym tematem. W końcu minęły już cztery i lata ...

— Amoeba mówi Przywróć Monikę

3

@amoeba niestety w przyszłości nie mogę odpowiedzieć, dlaczego zaakceptowałem tę odpowiedź. Przeglądając starą bestię 4,5 roku później, zdałem sobie sprawę, że żadna z odpowiedzi nie jest bliska. mbq zaczyna się obiecująco, ale nie da się wyjaśnić. Ale bez względu na to, temat jest bardzo mylący, prawdopodobnie ze względu na niewłaściwą terminologię popularnego oprogramowania statystycznego dla nauk społecznych, którego nie wymienię czteroliterowym skrótem. Proszę, opublikuj odpowiedź i wyślij mi ping, zaakceptuję ją, jeśli znajdę ją bliżej odpowiedzi na moje pytanie.

— Roman Luštrik,

53

To pytanie dotyczy głównie definicji PCA / FA, więc opinie mogą się różnić. Uważam, że PCA + varimax nie powinien być nazywany ani PCA, ani FA, ale raczej wyraźnie określany np. Jako „PCA z rotacją varimax”.

Powinienem dodać, że jest to dość mylący temat. W tej odpowiedzi chcę wyjaśnić, czym właściwie jest rotacja ; będzie to wymagać trochę matematyki. Przypadkowy czytelnik może przejść bezpośrednio do ilustracji. Tylko wtedy możemy omówić, czy rotacja PCA + powinna być nazywana „PCA”.

Jednym z odniesień jest książka Jolliffe'a „Principal Component Analysis”, sekcja 11.1 „Rotation of Principal Components”, ale uważam, że może być jaśniejsza.

Niech będzie macierzą danych, która, jak zakładamy, jest wyśrodkowana. PCA sprowadza się ( patrz moja odpowiedź tutaj ) do dekompozycji liczby pojedynczej: . Istnieją dwa równoważne, ale komplementarne widoki tego rozkładu: widok „projekcyjny” w stylu PCA i widok „ukrytych zmiennych” w stylu FA. $\mathbf X$ $n \times p$ $\mathbf X=\mathbf{USV}^\top$

Zgodnie z widokiem w stylu PCA znaleźliśmy kilka kierunków ortogonalnych (są to wektory własne macierzy kowariancji, zwane także „głównymi kierunkami” lub „osiami”) i „głównymi składnikami” ( zwane również „wynikami” głównego składnika) to rzuty danych w tych kierunkach. Główne komponenty są nieskorelowane, pierwszy ma maksymalnie możliwą wariancję itp. Możemy napisać: $\mathbf V$ $\mathbf{US}$

X = U S \cdot V^{⊤} = Scores \cdot Principal directions .

$\mathbf X = \mathbf{US}\cdot \mathbf V^\top = \text{Scores} \cdot \text{Principal directions}.$

Zgodnie z poglądem w stylu FA znaleźliśmy pewne nieskorelowane „czynniki ukryte” wariancji jednostkowej, które powodują obserwowane zmienne poprzez „obciążenia”. Rzeczywiście, są znormalizowanymi składnikami głównymi (nieskorelowanymi i z wariancją jednostek), a jeśli zdefiniujemy ładunki jako , a następnie (Zauważ, że .) Oba widoki są równoważne. Zauważ, że ładunki są wektorami własnymi skalowanymi przez odpowiednie wartości własne ( są wartościami własnymi macierzy kowariancji). $\widetilde{\mathbf U}=\sqrt{n-1}\mathbf{U}$ $\mathbf L = \mathbf{VS}/\sqrt{n-1}$

X = \sqrt{n - 1} U \cdot (V S / \sqrt{n - 1})^{⊤} = \tilde{U} \cdot L^{⊤} = Standardized scores \cdot Loadings .

$\mathbf X= \sqrt{n-1}\mathbf{U}\cdot (\mathbf{VS}/\sqrt{n-1})^\top =\widetilde{\mathbf U}\cdot \mathbf L^\top = \text{Standardized scores} \cdot \text{Loadings}.$

S^{⊤} = S

$\mathbf{S}^\top=\mathbf{S}$

S / \sqrt{n - 1}

$\mathbf{S}/\sqrt{n-1}$

(Powinienem dodać w nawiasach, że PCA FA $\ne$ ; FA wyraźnie dąży do znalezienia ukrytych czynników, które są liniowo mapowane do obserwowanych zmiennych poprzez ładunki; jest bardziej elastyczny niż PCA i daje różne ładunki. Dlatego wolę nazywać to powyższym „Widok w stylu FA na PCA”, a nie FA, nawet jeśli niektórzy uważają, że jest to jedna z metod FA).

Co robi rotacja? Np. Obrót prostopadły, taki jak varimax. Po pierwsze, pod uwagę tylko komponenty , tj .:Następnie bierze kwadratową ortogonalną macierzy i podłącza do tego rozkładu: gdzie obrócone ładunki są podawane przez $k<p$

X \approx U_{k} S_{k} V_{k}^{⊤} = {\tilde{U}}_{k} L_{k}^{⊤} .

$\mathbf X \approx \mathbf U_k \mathbf S_k \mathbf V_k^\top = \widetilde{\mathbf U}_k \mathbf L^\top_k.$

k \times k

$k \times k$

T

$\mathbf T$

T T^{⊤} = I

$\mathbf T\mathbf T^\top=\mathbf I$

X \approx U_{k} S_{k} V_{k}^{⊤} = U_{k} T T^{⊤} S_{k} V_{k}^{⊤} = {\tilde{U}}_{r o t} L_{r o t}^{⊤},

$\mathbf X \approx \mathbf U_k \mathbf S_k \mathbf V_k^\top = \mathbf U_k \mathbf T \mathbf T^\top \mathbf S_k \mathbf V_k^\top = \widetilde{\mathbf U}_\mathrm{rot} \mathbf L^\top_\mathrm{rot},$

L_{r o t} = L_{k} T

$\mathbf L_\mathrm{rot} = \mathbf L_k \mathbf T$ I obraca się znormalizowane przez wyniki podano . (Celem tego jest znalezienie taki sposób, aby stał się tak blisko bycia rzadkim, jak to możliwe, aby ułatwić jego interpretację.)

{\tilde{U}}_{r o t} = {\tilde{U}}_{k} T

$\widetilde{\mathbf U}_\mathrm{rot} = \widetilde{\mathbf U}_k \mathbf T$

T

$\mathbf T$

L_{r o t}

$\mathbf L_\mathrm{rot}$

Zauważ, że obracane są: (1) znormalizowane wyniki, (2) ładunki. Ale nie surowe wyniki, a nie główne kierunki! Zatem obrót odbywa się w ukrytej przestrzeni, a nie w pierwotnej przestrzeni. To jest absolutnie niezbędne.

Z punktu widzenia stylu FA niewiele się wydarzyło. (A) Ukryte czynniki są nadal nieskorelowane i znormalizowane. (B) Nadal są one mapowane na obserwowane zmienne poprzez (obrócone) obciążenia. (C) Wielkość wariancji zarejestrowanej przez każdy składnik / współczynnik jest dana przez sumę kwadratów wartości odpowiedniej kolumny obciążeń w . (D) Geometrycznie ładunki nadal obejmują tę samą wymiarową podprzestrzeń w (podprzestrzeń rozciągnięta przez pierwsze wektorów własnych PCA). (E) Przybliżenie do i błąd rekonstrukcji w ogóle się nie zmieniły. (F) Macierz kowariancji jest nadal równie dobrze aproksymowana: $\mathbf L_\mathrm{rot}$ $k$ $\mathbb R^p$ $k$ $\mathbf X$

Σ \approx L_{k} L_{k}^{⊤} = L_{r o t} L_{r o t}^{⊤} .

$\boldsymbol \Sigma \approx \mathbf L_k\mathbf L_k^\top = \mathbf L_\mathrm{rot}\mathbf L_\mathrm{rot}^\top.$

Ale punkt widzenia w stylu PCA praktycznie się załamał. Obrócone obciążenia nie odpowiadają już ortogonalnym kierunkom / osiom w , tj. Kolumny nie są ortogonalne! Co gorsza, jeśli [ortogonalnie] rzutujesz dane na kierunki podane przez obrócone obciążenia, otrzymasz skorelowane (!) Prognozy i nie będziesz w stanie odzyskać wyników. [Zamiast tego, aby obliczyć znormalizowane wyniki po obrocie, należy pomnożyć macierz danych przez pseudo-odwrotność obciążeń . Alternatywnie można po prostu obrócić oryginalne standardowe wyniki za pomocą macierzy rotacji: $\mathbb R^p$ $\mathbf L_\mathrm{rot}$ $\widetilde{\mathbf U}_\mathrm{rot} = \mathbf X (\mathbf L_\mathrm{rot}^+)^\top$ $\widetilde{\mathbf U}_\mathrm{rot} = \widetilde{\mathbf U} \mathbf T$ ] Ponadto obrócone komponenty nie przechwytują kolejno maksymalnej ilości wariancji: wariancja jest rozdzielana między komponenty (nawet chociaż wszystkie obróconych komponentów przechwytuje dokładnie taką samą wariancję jak wszystkie oryginalnych głównych elementów). $k$ $k$

Oto ilustracja. Dane są elipsą 2D rozciągniętą wzdłuż głównej przekątnej. Pierwszy główny kierunek to główna przekątna, drugi jest do niej ortogonalny. Wektory obciążające PCA (wektory własne skalowane wartościami własnymi) są pokazane na czerwono - skierowane w obu kierunkach, a także rozciągnięte przez stały współczynnik widoczności. Następnie zastosowałem obrót prostopadły o do obciążeń. Wynikowe wektory ładowania są pokazane w kolorze magenta. Zwróć uwagę, że nie są one ortogonalne (!). $30^\circ$

Rotacja PCA

Oto intuicja w stylu FA: wyobraź sobie „utajoną przestrzeń”, w której punkty wypełniają mały okrąg (pochodzą z Gaussa 2D z odchyleniami jednostek). Ten rozkład punktów jest następnie rozciągany wzdłuż ładunków PCA (czerwony), aby stać się elipsą danych, którą widzimy na tej figurze. Jednak ten sam rozkład punktów można obracać, a następnie rozciągać wzdłuż obróconych ładunków PCA (magenta), aby uzyskać tę samą elipsę danych .

[Aby faktycznie zobaczyć, że ortogonalny obrót obciążeń jest obrotem , należy spojrzeć na dwójkę PCA; tam wektory / promienie odpowiadające oryginalnym zmiennym po prostu się obracają.]

Podsumujmy. Po rotacji ortogonalnej (takiej jak varimax) osie „obrócone-główne” nie są ortogonalne, a rzuty na nie ortogonalne nie mają sensu. Dlatego należy raczej upuścić cały punkt widzenia w osiach / rzutach. Dziwnie byłoby nadal nazywać to PCA (dotyczy to projekcji o maksymalnej wariancji itp.).

Z punktu widzenia stylu FA po prostu obróciliśmy nasze (znormalizowane i nieskorelowane) czynniki ukryte, co jest prawidłową operacją. W FA nie ma „prognoz”; zamiast tego czynniki utajone generują obserwowane zmienne poprzez obciążenia. Ta logika jest nadal zachowana. Zaczęliśmy jednak od głównych składników, które tak naprawdę nie są czynnikami (ponieważ PCA nie jest tym samym co FA). Dziwnie byłoby też nazywać to FA.

Zamiast zastanawiać się, czy należy „nazwać” PCA, czy FA, sugerowałbym skrupulatność w określaniu dokładnie stosowanej procedury: „PCA, po której następuje rotacja varimax”.

Post Scriptum. Jest to możliwe pod alternatywną procedurę obrotu, w którym wprowadzane są między i . Spowodowałoby to obrót surowych wyników i wektorów własnych (zamiast standardowych wyników i ładowań). Największym problemem związanym z tym podejściem jest to, że po takiej „rotacji” wyniki nie będą już nieskorelowane, co jest dość śmiertelne dla PCA. Można to zrobić, ale nie tak rozumie się i stosuje rotacje. $\mathbf{TT}^\top$ $\mathbf{US}$ $\mathbf V^\top$

— ameba mówi Przywróć Monikę
źródło

Nie w pełni zrozumiałem tekst otaczający obraz. Używasz „ładunków” kilka razy: PCA loading vectors... are shown in red, stretched along the rotated PCA loadings (magenta). Zastanawiam się, jak „ładunki” lub ich „wektor” mogą być pokazane jako osie na wykresie rozrzutu danych. Czy możesz to wyjaśnić? A pomysł „rozciągania”? Dzięki.

— ttnphns

1

Może to być związane z długą dyskusją, którą ostatnio rozmawialiśmy o ładowaniach „obejmujących podprzestrzeń” w przestrzeni zmiennej lub nie. W tej odpowiedzi użyłem „wektora ładowania” (lub po prostu „obciążeń”) w odniesieniu do jednej kolumny macierzy obciążeń. W moim przykładzie dane są 2D, tzn. Istnieją dwie zmienne, a zatem ładunki są wektorami 2D. Dlatego mogę wykreślić je na wykresie rozrzutu danych (skalowałem je według pewnego stałego współczynnika widoczności). W PCA ładunki są oczywiście ortogonalne (są proporcjonalne do wektorów własnych). Po varimax już nie są.

— ameba mówi Przywróć Monikę

Akapit o „rozciąganiu” (zaraz po zdjęciu) powinienem chyba lepiej zilustrować; Widzę, że nie jest to bardzo jasne.

— ameba mówi Przywróć Monikę

Pomyślałem, że jeśli chcesz wykreślić ortogonalność lub nieortogonalność niektórych wektorów (takich jak ładunki), powinieneś narysować je jako strzałki. A może cię nie rozumiem?

— ttnphns

1

Zgadzam się, że używanie strzałek byłoby lepsze, pominąłem tylko „groty strzałek” dla wygody kreślenia. Mogę powtórzyć tę liczbę, aby je dodać. Narysowałem również każdy wektor wskazujący w obu kierunkach, ponieważ ich znaki nie mają znaczenia.

— ameba mówi Przywróć Monikę

29

Analiza głównych składników (PCA) i analiza wspólnych czynników (CFA) to odrębne metody. Często dają one podobne wyniki, a PCA jest używana jako domyślna metoda ekstrakcji w procedurach analizy współczynnika SPSS. To niewątpliwie powoduje wiele nieporozumień co do rozróżnienia między nimi.

Najważniejsze jest to, że są to dwa różne modele, koncepcyjnie. W PCA komponenty są rzeczywistymi liniowymi kombinacjami ortogonalnymi, które maksymalizują całkowitą wariancję. W FA czynniki są kombinacjami liniowymi, które maksymalizują wspólną część wariancji - leżące u podstaw „ukrytych konstrukcji”. Dlatego FA jest często nazywany „analizą wspólnego czynnika”. FA korzysta z różnych procedur optymalizacji, a wynik, w przeciwieństwie do PCA, zależy od zastosowanej procedury optymalizacji i punktów początkowych dla tych procedur. Po prostu nie ma jednego unikalnego rozwiązania.

W R funkcja factanal () zapewnia CFA wyodrębnienie maksymalnego prawdopodobieństwa. Nie należy więc oczekiwać, że odtworzy wynik SPSS oparty na ekstrakcji PCA. To po prostu inny model lub logika. Nie jestem pewien, czy uzyskasz ten sam wynik, jeśli użyjesz ekstrakcji Maksymalnego Prawdopodobieństwa SPSS, ponieważ mogą nie używać tego samego algorytmu.

Dla lepszego lub gorszego w R można jednak odtworzyć pomieszaną „analizę czynnikową”, którą SPSS zapewnia jako domyślną. Oto proces w R. Za pomocą tego kodu jestem w stanie odtworzyć wynik „analizy czynnikowej” głównego komponentu SPSS przy użyciu tego zestawu danych. (Z wyjątkiem znaku, który jest nieokreślony). Ten wynik można również obrócić za pomocą dowolnej z dostępnych metod rotacji Rs.

# Load the base dataset attitude to work with.
data(attitude)
# Compute eigenvalues and eigen vectors of the correlation matrix.
pfa.eigen<-eigen(cor(attitude))
# Print and note that eigen values are those produced by SPSS.
# Also note that SPSS will extract 2 components as eigen values > 1 = 2
pfa.eigen$values
# set a value for the number of factors (for clarity)
factors<-2
# Extract and transform two components.
pfa.eigen$vectors [ , 1:factors ]  %*% 
+ diag ( sqrt (pfa.eigen$values [ 1:factors ] ),factors,factors )

— Brett
źródło

+1 za naprawdę pomaganie w tłumieniu zamieszania wokół SPSS vs. R. Pozostają dwa pytania: Co robi R prcomplub princomprobi w porównaniu do pomieszanego podejścia SPSS? Co właściwie robi SPSS przez ekstrakcję?

— hans0l0

ah, i mogę dodać, jak obliczyć wyniki dla np. PC1 do twojego rozwiązania: standaryzuj zz <- scale(attitude,T,T)i pc1 <- zz %*% solve(cor(attitude),lamba[,1]). Gdzie lambda jest wynikiem ostatniej linii przykładu @Brett Magills.

— hans0l0

3

-1. Mimo że w tej odpowiedzi znajduje się wiele przydatnych informacji, uważam, że w ogóle nie odpowiada ona na pierwotne pytanie. Pierwotne pytanie brzmiało, czy rotację PCA + nadal można uznać za PCA (a raczej FA). Twoja odpowiedź nawet nie wspomina o rotacjach! Jak to może być odpowiedź?

— ameba mówi Przywróć Monikę

1

Warto zauważyć, że wspólna analiza czynnikowa nie jest tym samym, co analiza czynnikowa potwierdzająca (także CFA), która jest zupełnie inną procedurą.

— Richard Border

11

Ta odpowiedź ma na celu przedstawienie, w formie wykresu ścieżkowego, rzeczy, o których @amoeba rozumował w swojej głębokiej (ale nieco skomplikowanej) odpowiedzi w tym wątku (w pewnym sensie zgadzam się z tym w 95%) i jak mi się wydają .

PCA w swojej właściwej, minimalnej formie jest specyficznym ortogonalnym obrotem skorelowanych danych do jego nieskorelowanej postaci, przy czym główne składniki skimmują kolejno coraz mniej ogólnej zmienności. Jeśli chcemy jedynie zmniejszenia wymiarów, zwykle nie obliczamy obciążeń i czegokolwiek, co ciągną za sobą. Jesteśmy zadowoleni z (RAW) głównych punktów składowych . [Uwaga: notacje na wykresie nie są dokładnie zgodne z @ amoebą, - Trzymam się tego, co przyjmuję w niektórych innych odpowiedziach.] $\bf P$

Na wykresie biorę prosty przykład dwóch zmiennych p=2i używam obu wyodrębnionych głównych składników. Chociaż zwykle przechowujemy tylko kilka pierwszych m<pelementów, dla rozważanego pytania teoretycznego („Czy PCA z rotacją jest PCA czy co?”) Nie ma znaczenia, czy zachować, mczy wszystkie p; przynajmniej w mojej konkretnej odpowiedzi.

Sztuczka ładunków polega na ściągnięciu skali (wielkości, zmienności, bezwładności ) ze składników (surowe wyniki) i na współczynniki (wektory własne), pozostawiając pierwszą z nich jako „szkielet” (standaryzowany pr . punkty składowe), a ten drugi mięsisty (obciążenia). Dane przywracasz równie dobrze za pomocą obu: . Ale ładunki otwierają perspektywy: (i) interpretację komponentów; (ii) do obracania; (iii) przywrócenie korelacji / kowariancji zmiennych. Wynika to z faktu, że zmienność danych została zapisana w ładunkach, jako ich ładunkach. $\bf L$ $\bf V$ $\bf P_z$ $\bf A$ $\bf X=PV'=P_zA'$

I mogą przywrócić to obciążenie z powrotem do punktów danych w dowolnym momencie - teraz lub po obrocie . Jeśli pomyślimy o rotacji ortogonalnej, takiej jak varimax, oznacza to, że chcemy, aby komponenty pozostały nieskorelowane po wykonaniu rotacji. Tylko dane z sferyczną macierzą kowariancji, gdy są obracane ortogonalnie, zachowują nieskorelację. I voila, znormalizowane główne składniki (które w uczeniu maszynowym często nazywane są „danymi bielonymi PCA”) to te magiczne dane ( są w rzeczywistości proporcjonalne do lewej, tj. własne danych). Gdy szukamy macierzy rotacji varimax $\bf P_z$ $\bf P_z$ $\bf Q$ aby ułatwić interpretację ładunków, punkty danych biernie oczekują swojej czystej kulistości i tożsamości (lub „bieli”).

Po znalezieniu obrót o jest równoważny zwykłemu obliczeniu znormalizowanych wyników składowych głównych przez uogólnioną odwrotność macierzy obciążeń, tym razem obróconych obciążeń, (patrz tabela ). Wynikowe główne elementy obrócone varimax, są nieskorelowane, tak jak tego chcieliśmy, a dane są przez nie przywracane tak ładnie, jak przed rotacją: . Możemy następnie podać je z powrotem na ich rozmiar osadza (i odpowiednio obraca się) w - ich unstandardize: . $\bf Q$ $\bf P_z$ $\bf A_r$ $\bf C_z$ $\bf X=P_zA'=C_zA_r'$ $\bf A_r$ $\bf C$

Powinniśmy mieć świadomość, że „główne składniki obracane varimax” nie są już głównymi składnikami: do podkreślenia tego użyłem notacji Cz, C zamiast Pz, P. Są tylko „komponentami”. Główne składniki są unikalne, ale składników może być wiele. Rotacje inne niż Varimax przyniesie inne nowe zmienne zwane również komponenty i również skorelowane, oprócz naszych nich. $\bf C$

Mówiąc też, elementy podstawowe (obrócone w varimax (lub inaczej ortogonalnie obrócone)) (teraz tylko „elementy”), choć pozostają nieskorelowane, ortogonalne, nie oznaczają, że ich obciążenia są również nadal ortogonalne. Kolumny są wzajemnie ortogonalne (podobnie jak wektory własne ), ale nie kolumny (patrz także przypis tutaj ). $\bf A$ $\bf V$ $\bf A_r$

I wreszcie - obracanie surowych głównych komponentów pomocą naszego nie jest użyteczną akcją. Otrzymamy skorelowane zmienne o problematycznym znaczeniu. pojawił się do optymalizacji (w pewien określony sposób) konfiguracji obciążenia który zaabsorbował całą skalę w nich . nigdy nie został przeszkolony do obracania punktów danych z zachowaniem całej skali. Obracanie z będzie równoważne obracaniu wektorów własnych z (w $\bf P$ $\bf Q$ $\bf "C"$ $\bf Q$ $\bf Q$ $\bf P$ $\bf Q$ $\bf V$ $\bf Q$ $\bf V_r$ ), a następnie obliczenie wyników surowego komponentu jako . Te „ścieżki” odnotowane przez @amoeba w Postscriptum. $\bf "C"=XV_r$

Te ostatnio opisane działania (w większości bezcelowe) przypominają nam, że wektory własne, nie tylko ładunki, mogą być ogólnie obracane. Na przykład można zastosować do nich procedurę varimax, aby uprościć ich strukturę. Ale ponieważ wektory własne nie są tak pomocne w interpretacji znaczenia składników, jak ładunki, obrót wektorów własnych jest rzadko wykonywany.

Tak więc PCA z późniejszą rotacją varimax (lub inną) wynosi

wciąż PCA
które po drodze porzuciły główne komponenty tylko dla komponentów
które są potencjalnie więcej (niż komputery) interpretowalne jako „ukryte cechy”
ale nie były modelowane satystycznie jak te (PCA nie jest uczciwą analizą czynnikową)

W tej odpowiedzi nie odniosłem się do analizy czynnikowej. Wydaje mi się, że użycie słowa „utajona przestrzeń” przez @ amoeba jest nieco ryzykowne w kontekście zadanego pytania. Zgodzę się jednak, że rotacja analityczna PCA + może być nazwana „ widokiem w stylu FA na PCA”.

— ttnphns
źródło

Jak obliczyć wartości własne obróconych elementów?

1

@Haga, Obrócone komponenty nie są już głównymi komponentami, więc nie mogą mieć wartości własnych. Ich wariancje są jednak równe sumom kolumn kwadratowych ładunków (proszę zobaczyć dół mojej tabeli - strzałka do niestandardowych wyników).

— ttnphns

8

W psych::principal()można robić różne rodzaje obr / przekształceń do wydobytego główny składnik (ów) lub „” PC „” za pomocą rotate=argumentu, jak: "none", "varimax"(domyślnie), "quatimax", "promax", "oblimin", "simplimax", i "cluster". W razie potrzeby musisz empirycznie zdecydować, który z nich powinien mieć sens, w zależności od własnej oceny i wiedzy na temat badanego przedmiotu. Kluczowe pytanie, które może dać ci wskazówkę: które z nich jest bardziej zrozumiałe (ponownie w razie potrzeby)?

W pomocy mogą okazać się również pomocne:

Ważne jest, aby pamiętać, że obrócone główne składniki nie są głównymi składnikami (osie związane z rozkładem wartości własnych), ale są jedynie składnikami. Aby to podkreślić, nieobrócone główne elementy są oznaczone jako PCi, podczas gdy obrócone komputery są teraz oznaczone jako RCi (dla elementów obróconych), a elementy ukośnie przekształcone jako TCi (dla elementów transformowanych). (Podziękowania dla Ulrike Gromping za tę sugestię.)

— doktorat
źródło

7

Rozumiem, że rozróżnienie między analizą PCA a analizą czynnikową polega przede wszystkim na tym, czy występuje termin błędu. Zatem PCA może i będzie wiernie reprezentować dane, podczas gdy analiza czynnikowa jest mniej wierna w stosunku do danych, na których jest trenowana, ale próbuje reprezentować leżące u podstaw trendy lub wspólnotowość danych. Zgodnie ze standardowym podejściem PCA nie jest rotowane, ale matematycznie jest to możliwe, więc ludzie robią to od czasu do czasu. Zgadzam się z komentatorami, że „znaczenie” tych metod jest nieco do uchwycenia i że prawdopodobnie rozsądnie jest upewnić się, że funkcja, której używasz, robi to, co zamierzasz - na przykład, jak zauważysz, R ma pewne funkcje, które wykonują inny rodzaj PCA niż użytkownicy SPSS są zaznajomieni.

— russellpierce
źródło

2

Dzięki chaosowi w definicjach obu są one właściwie synonimami. Nie wierz słowom i zajrzyj głęboko do doków, aby znaleźć równania.

3

Wciąż staram się zrozumieć równania (biolog ahoy), dlatego zwróciłem się do społeczności tutaj, mając nadzieję, że pomoże mi to wyjaśnić różnicę w terminach laika.

— Roman Luštrik

Myślę, że ideologia polega na tym, że FA zakłada, że proces jest napędzany przez niektóre „ukryte czynniki”, podczas gdy dane, które posiadamy, składają się z niektórych ich kombinacji. Z tego powodu problemem FA jest jakoś odtworzenie ukrytych czynników. I jest PCA - metoda, która iteracyjnie buduje nowe zmienne (PC) poprzez mieszanie starych zmiennych, aby zachłannie pochłonąć wariancję danych. Można powiedzieć, że komputery osobiste są równe czynnikom FA i tutaj będą nie do odróżnienia. Ale można również wprowadzić pewne zmiany w PCA, aby uczynić ją bazą dla jakiegoś innego „sortowania FA”, i tak zaczyna się problem.

Zasadniczo powinieneś pomyśleć o tym, co chcesz zrobić (a nie o tym, którego słowa chcesz użyć). Wiem, że jest to trudne, zwłaszcza mając przy sobie biologów (w pewnym sensie hasło użytkowe działa dobrze w biologii, więc po prostu zakładają, że jest to wspólne dla innych dyscyplin); wciąż tak powinno się robić naukę. Następnie użyj Google (lub tej strony), aby ocenić dobry algorytm dla niego. Na koniec, użyj doków, aby znaleźć funkcję / przycisk, który to robi i wpisz / kliknij go.

1

Chociaż to pytanie ma już zaakceptowaną odpowiedź, chciałbym dodać coś do sedna pytania.

„PCA” - jeśli dobrze pamiętam - oznacza „analizę głównych składników”; tak długo, jak analizujesz główne składniki, może to być bez rotacji lub z rotacją, wciąż jesteśmy w trakcie analizy „głównych komponentów” (które zostały znalezione przez odpowiedni początkowy rozkład macierzy).

Sformułowałbym, że po obróceniu „varimax” na pierwszych dwóch głównych składnikach, że mamy „rozwiązanie varimax dwóch pierwszych komputerów” (lub coś innego), ale nadal są w ramach analizy głównych składników, lub krótsze, są w ramach „pca”.

Aby wyjaśnić moją kwestię jeszcze bardziej: nie wydaje mi się, aby proste pytanie o rotację wprowadzało problem rozróżnienia między EFA i CFA (ten ostatni wspomniany / wprowadzony do problemu na przykład w odpowiedzi Bretta)

— Gottfried Helms
źródło

Dlaczego nagle wspomniałeś o CFA w ostatnim zdaniu?

— ameba mówi Przywróć Monikę

@amoeba: Wskazałem na ten termin w nagrodzonej 23 punktami odpowiedzi _Bretta i poczułem, że warto coś o tym wspomnieć. Ale może lepiej byłoby zamiast tego powiedzieć „FA”. Zastanowię się nad tym ... (Zastanawiając się nad tym, niejasno pamiętam, że „CFA” było postrzegane jako „potwierdzająca analiza czynnikowa” zamiast „powszechne ...” w moich wcześniejszych badaniach tej metody, być może w latach 80-tych lub lata 90.)

— Gottfried Helms

Po prostu pierwsze trzy akapity twojej odpowiedzi dotyczą PCA kontra FA, a następnie ostatni akapit, który wygląda na podsumowanie poprzednich, nagle dotyczy EFA kontra CFA.

— ameba mówi Przywróć Monikę

@amoeba: czy moja ostatnia edycja wyjaśnia moją intencję / zdanie?

— Gottfried Helms

1

Uważam, że jest to najbardziej pomocne: Abdi i Williams, 2010, Analiza głównych składników .

OBRÓT

Po określeniu liczby składników i w celu ułatwienia interpretacji analiza często obejmuje obrót składników, które zostały zachowane [patrz np. Ref 40 i 67, aby uzyskać więcej szczegółów]. Stosowane są dwa główne typy obrotu: ortogonalny, gdy nowe osie są również do siebie ortogonalne, i skośny, gdy nowe osie nie muszą być ortogonalne. Ponieważ obroty są zawsze wykonywane w podprzestrzeni, nowe osie zawsze wyjaśniają mniej bezwładności niż oryginalne elementy (które są obliczane jako optymalne). Jednak część bezwładności wyjaśniona całkowitą podprzestrzenią po obrocie jest taka sama jak przed obrotem (zmienił się tylko podział bezwładności). Należy również zauważyć, że ponieważ obrót zawsze odbywa się w podprzestrzeni (tj. przestrzeń zachowanych komponentów), wybór tej podprzestrzeni silnie wpływa na wynik obrotu. Dlatego zdecydowanie zaleca się wypróbowanie kilku rozmiarów dla podprzestrzeni zachowanych komponentów, aby ocenić wiarygodność interpretacji obrotu. Podczas wykonywania obrotu pojęcie ładunków prawie zawsze odnosi się do elementów macierzy Q.

(patrz papier dla definicji Q).

— Dylan_Larkin
źródło