O zastosowaniu skośnego obrotu po PCA


9

Kilka pakietów statystycznych, takich jak SAS, SPSS i R, umożliwia wykonanie pewnego rodzaju rotacji czynników po PCA.

  1. Dlaczego rotacja jest konieczna po PCA?
  2. Dlaczego miałbyś stosować obrót skośny po PCA, skoro PCA ma na celu uzyskanie wymiarów ortogonalnych?

Zadałem pytanie, które ilustruje potrzebę rotacji czynników po PCA, ponieważ PCA daje tendencyjny wynik. Zobacz stats.stackexchange.com/questions/6575/…
mbaitoff

Odpowiedzi:


8

Myślę, że istnieją różne opinie lub poglądy na temat PCA, ale w zasadzie często myślimy o tym jako o technice redukcji (redukujesz przestrzeń funkcji do mniejszej, często o wiele bardziej „czytelnej”, pod warunkiem, że dbasz o prawidłowe centrowanie / standaryzację dane, gdy są potrzebne) lub sposób konstruowania ukrytych czynnikówlub wymiary, które stanowią znaczną część rozproszenia międzyosobniczego (tutaj „jednostki” oznaczają jednostki statystyczne, na podstawie których gromadzone są dane; może to być kraj, ludzie itp.). W obu przypadkach konstruujemy liniowe kombinacje oryginalnych zmiennych, które uwzględniają maksimum wariancji (rzutowane na oś główną), z zastrzeżeniem ograniczenia ortogonalności między dowolnymi dwoma głównymi składnikami. To, co zostało opisane, ma charakter czysto algebralny lub matematyczny i nie uważamy tego za model (generujący), w przeciwieństwie do tego, co dzieje się w tradycji analizy czynnikowej, w której uwzględniamy termin błędu w celu uwzględnienia pewnego rodzaju błędu pomiaru . Podoba mi się również wprowadzenie podane przez Williama Revelle'a w jego nadchodzącym podręczniku na temat psychometrii stosowanej z użyciem R. (Rozdział 6), jeśli chcemy przeanalizować strukturę macierzy korelacji, to

Pierwsze [podejście, PCA] to model, który aproksymuje macierz korelacji pod względem iloczynu składników, gdzie każdy składnik jest ważoną liniową sumą zmiennych, drugi model [analiza czynnikowa] jest również przybliżeniem macierzy korelacji przez iloczyn dwóch czynników, ale czynniki w tym są postrzegane raczej jako przyczyny niż konsekwencje zmiennych.

Innymi słowy, w PCA wyrażasz każdy składnik (czynnik) jako liniową kombinację zmiennych, podczas gdy w FA są to zmienne wyrażane jako liniowa kombinacja czynników. Powszechnie wiadomo, że obie metody generalnie dają całkiem podobne wyniki (patrz np. Harman, 1976 lub Catell, 1978), szczególnie w przypadku „idealnego”, w którym mamy dużą liczbę osobników i dobry współczynnik współczynnik: zmienne (zwykle różne od 2 do 10 w zależności od autorów, których rozważasz!). Wynika to z tego, że poprzez oszacowanie przekątnych w macierzy korelacji (jak ma to miejsce w FA, a te elementy są znane jako wspólnoty), wariancja błędu jest eliminowana z macierzy czynników. To jest powód, dla którego PCA jest często stosowany jako sposób na odkrycie ukrytych czynników lub psychologicznych konstrukcji w miejsce FA opracowanych w ubiegłym wieku. Ale idąc tą drogą, często chcemy osiągnąć łatwiejszą interpretację wynikowej struktury czynnikowej (lub tak zwanej macierzy wzorców). Potem pojawia się przydatna sztuczka polegająca na obróceniu osi silni, aby zmaksymalizować obciążenia zmiennych na określony czynnik lub równo osiągnąć „prostą strukturę”. Stosując rotację ortogonalną (np. VARIMAX), zachowujemy niezależność czynników. Przy skośnym obrocie (np. OBLIMIN, PROMAX), łamiemy go i czynniki mogą się korelować. Było to szeroko dyskutowane w literaturze i doprowadziło niektórych autorów (nie psychometrów, ale statystyk na początku 1960 roku ”

Chodzi o to, że metody rotacji zostały pierwotnie opracowane w kontekście podejścia FA i obecnie są rutynowo stosowane w PCA. Nie sądzę, aby przeczyło to algorytmicznemu obliczeniu głównych składników: możesz obracać osie silni w sposób, jaki chcesz, pod warunkiem, że pamiętasz, że po skorelowaniu (przez obrót skośny) interpretacja przestrzeni silni staje się mniej oczywista.

PCA jest rutynowo stosowane przy opracowywaniu nowych kwestionariuszy, chociaż FA jest prawdopodobnie lepszym podejściem w tym przypadku, ponieważ staramy się wyodrębnić znaczące czynniki, które uwzględniają błędy pomiaru i których zależności można zbadać samodzielnie (np. Przez uwzględnienie powstałego wzoru macierz, otrzymujemy model czynników drugiego rzędu). Ale PCA służy również do sprawdzania struktury czynnikowej już zweryfikowanych. Badacze tak naprawdę nie mają znaczenia dla FA vs. PCA, gdy mają, powiedzmy 500 reprezentatywnych podmiotów, których poproszono o ocenę 60-elementowego kwestionariusza zajmującego się pięcioma wymiarami (tak jest w przypadku NEO-FFI, na przykład), i myślę, że mają rację, ponieważ w tym przypadku nie jesteśmy bardzo zainteresowani identyfikacją modelu generującego lub koncepcyjnego (termin „reprezentatywny” jest używany tutaj w celu złagodzenia problemu niezmienności pomiaru ).

Teraz, jeśli chodzi o wybór metody rotacji i dlaczego niektórzy autorzy sprzeciwiają się ścisłemu stosowaniu rotacji ortogonalnej, chciałbym zacytować Paula Kline'a, tak jak to zrobiłem w odpowiedzi na następujące pytanie, FA: Wybór macierzy rotacji na podstawie „Prostej struktury Kryteria ” ,

(...) w świecie rzeczywistym nie jest nierozsądne sądzić, że czynniki, jako ważne determinanty zachowania, byłyby skorelowane. - P. Kline, wywiad. The Psychometric View , 1991, s. 1 19

W związku z tym doszłbym do wniosku, że w zależności od celu badania (czy chcesz podkreślić główne wzorce macierzy korelacji, czy też starasz się zapewnić rozsądną interpretację podstawowych mechanizmów, które mogą powodować, że obserwujesz taką macierz korelacji ), możesz wybrać metodę, która jest najbardziej odpowiednia: nie dotyczy to budowy kombinacji liniowych, ale jedynie sposób interpretacji wynikowej przestrzeni czynnikowej.

Bibliografia

  1. Harman, HH (1976). Nowoczesna analiza czynnikowa . Chicago, University of Chicago Press.
  2. Cattell, RB (1978). Naukowe zastosowanie analizy czynnikowej . Nowy Jork, Plenum.
  3. Kline, P. (1991). Inteligencja. Widok psychometryczny . Routledge.

4

Problem z wymiarami ortogonalnymi polega na tym, że komponenty mogą być nie do interpretacji. Zatem, podczas gdy obrót skośny (tj. Wymiary nieortogonalne) jest technicznie mniej zadowalający, taki obrót czasami poprawia interpretowalność otrzymanych składników.


4

Podstawowe punkty

  • Obrót może uczynić interpretację komponentów bardziej zrozumiałą
  • Obrót skośny często ma bardziej teoretyczny sens. Tzn. Obserwowane zmienne można wyjaśnić w kategoriach mniejszej liczby skorelowanych składników.

Przykład

  • 10 testuje wszystkie zdolności pomiarowe z pewnymi pomiarami werbalnymi i pewnymi pomiarami przestrzennymi. Wszystkie testy są ze sobą powiązane, ale wzajemne powiązania w testach werbalnych lub przestrzennych są większe niż dla wszystkich typów testów. Oszczędne PCA może obejmować dwa skorelowane elementy, werbalny i przestrzenny. Teoria i badania sugerują, że te dwie umiejętności są skorelowane. Zatem skośny obrót ma sens teoretyczny.
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.