Czym są „obrócone” i „nieobrócone” główne elementy, biorąc pod uwagę, że PCA zawsze obraca osie współrzędnych?


13

O ile rozumiem, główne komponenty są uzyskiwane przez obrót osi współrzędnych w celu wyrównania ich z kierunkami maksymalnej wariancji.

Niemniej jednak wciąż czytam o „niezabezpieczonych głównych składnikach”, a moje oprogramowanie statystyczne (SAS) daje mi główne elementy obrócone varimax, a także te niezabezpieczone. Tutaj jestem zdezorientowany: kiedy obliczamy główne elementy, osie są już obrócone; dlaczego więc potrzebna jest kolejna rotacja? A co oznacza „główny niechroniony składnik”?


1
Pytania wyłącznie na temat działania oprogramowania są tutaj nie na temat, ale możesz tu ukryć prawdziwe pytanie statystyczne. Możesz zredagować swoje pytanie, aby wyjaśnić podstawowy problem statystyczny. Może się okazać, że gdy zrozumiesz związane z tym pojęcia statystyczne, elementy specyficzne dla oprogramowania są oczywiste lub co najmniej łatwe do uzyskania z dokumentacji.
gung - Przywróć Monikę

1
@gung - Moje pytanie nie dotyczy oprogramowania. Być może źle go umieściłem. Wszystko, co chciałem wiedzieć, to to, że zgodnie z moim zrozumieniem, główne składniki uzyskujemy tylko wtedy, gdy obracamy osie w linii maksymalnej wariancji. Zatem czym jest niechroniony główny składnik, który znalazłem na różnych stronach wyjaśniających o PCA. Daj mi znać, jeśli moje pytanie jest nadal niejednoznaczne.
Srewashi Lahiri,

Z pewnością wygląda na to, że chodzi o SAS. Jeśli tak nie jest, edytowałbym twoje Q, aby usunąć odniesienia do SAS i ponownie wyjaśnić twoje pytanie w kategoriach neutralnych programowo. Możesz być także zainteresowany czytaniem tego wątku .
gung - Przywróć Monikę

Wspomniałem o SAS, ponieważ przeprowadzałem analizę w tym oprogramowaniu. Nawet jeśli zlekceważysz to słowo, możesz po prostu wyjaśnić moją edytowaną wersję pytania. Przeszedłem również przez wątek. Uprzejmie mnie popraw, jeśli się mylę. Kiedy obliczamy główne elementy, oznacza to, że osie są już obrócone. Zatem inna notacja varimax nie jest wymagana. Czy tak jest Jestem naprawdę zdezorientowany w tej części. Z góry
dziękuję

2
Srewashi, pozwoliłem znacznie przepisać twoje pytanie w oparciu o wyjaśnienia w komentarzach. Myślę, że to dobre pytanie, +1. Sprawdź, czy moje zmiany odzwierciedlają twoje zamiary! Zawsze możesz edytować więcej. DW do @gung.
ameba mówi Przywróć Monikę

Odpowiedzi:


15

To będzie odpowiedź nietechniczna.

Masz rację: PCA to zasadniczo obrót osi współrzędnych, tak dobrany, aby każda udana oś przechwytywała jak najwięcej odchyleń.

W niektórych dyscyplinach (takich jak np. Psychologia) ludzie lubią stosować PCA w celu interpretacji uzyskanych osi. Tzn. Chcą być w stanie powiedzieć, że główna oś # 1 (która jest pewną liniową kombinacją pierwotnych zmiennych) ma pewne szczególne znaczenie. Aby odgadnąć to znaczenie, sprawdziliby wagi w kombinacji liniowej. Jednak wagi te są często nieporządne i nie można dostrzec żadnego wyraźnego znaczenia.

W takich przypadkach ludzie czasami majstrują przy odrobinie wanilii z PCA. Biorą pewną liczbę głównych osi (które według pewnego kryterium są uważane za „znaczące”) i dodatkowo obracają je, starając się osiągnąć jakąś „prostą strukturę” - to znaczy kombinacje liniowe, które byłyby łatwiejsze do interpretacji. Istnieją specyficzne algorytmy, które szukają najprostszej możliwej struktury; jeden z nich nazywa się varimax. Po rotacji varimax kolejne komponenty nie wychwytują tak dużej wariancji, jak to możliwe! Ta funkcja PCA zostaje zerwana przez wykonanie dodatkowego obrotu varimax (lub innego).

Zatem przed zastosowaniem rotacji varimax masz „niezabezpieczone” główne elementy. Następnie otrzymujesz „obrócone” główne elementy. Innymi słowy, terminologia ta odnosi się do przetwarzania końcowego wyników PCA, a nie do samej rotacji PCA.


Wszystko to jest nieco skomplikowane przez fakt, że to, co się obraca, to obciążenia, a nie osie główne jako takie. Jednak ze względu na szczegóły matematyczne odsyłam ciebie (i każdego zainteresowanego czytelnika) do mojej długiej odpowiedzi tutaj: czy po PCA następuje rotacja (np. Varimax) nadal PCA?


Nie znalazłem jeszcze lepszego i jaśniejszego wyjaśnienia. Przeszedłem również przez inny link, który podałeś, ale jeszcze go nie rozszyfrowałem. Jeśli dobrze zrozumiałem, wówczas niezabezpieczone główne składniki są już ortogonalne i nieskorelowane. Tutaj mam małe zamieszanie - ponieważ komputery odpowiadają kolejnej maksymalnej wariancji, konieczne jest, aby po znalezieniu pierwszego komputera druga linia maksymalnej wariancji (drugi komputer) była pod kątem 90 stopni (ortogonalna) do pierwszej i tak dalej ?
Srewashi Lahiri,

Zgadza się: główne elementy „nieobrotowe” są nieskorelowane, a osie główne „nieobrotowe” są ortogonalne. I tak, konieczne jest, aby kolejne osie główne były ortogonalne, a główne elementy nieskorelowane z poprzednimi (można to udowodnić matematycznie). Nawiasem mówiąc, jeśli uważasz, że ta (lub inna) odpowiedź rozwiązuje problem, możesz ją „zaakceptować”, klikając zielony znaczek po lewej stronie. Gdy zdobędziesz 15 punktów reputacji, będziesz mógł głosować odpowiedzi, które uważasz za przydatne (myślę, że obecnie nie jesteś w stanie głosować żadnych odpowiedzi).
ameba mówi Przywróć Monikę

+1. what gets rotated are loadings and not principal axes as suchDodałbym, że jest to pojęcie techniczne. Teoretycznie te dwa rodzaje rotacji są zestawione. W PCA obracamy się, aby znaleźć konkretną podstawę ortogonalną (tę o najbardziej stromym wykresie wartości własnych). W varimax obracamy się, aby znaleźć inną konkretną podstawę ortogonalną (o strukturze najbardziej możliwej do interpretacji). Możemy wykonać dowolną podstawę ortogonalną.
ttnphns

Jeśli to możliwe, czy możesz to wyjaśnić laikiem, co oznacza niechroniony komputer?
sai_636

@ sai_636 Warunki dla laika znajdują się na stronie stats.stackexchange.com/questions/2691 .
ameba mówi Przywróć Monikę
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.