PCA jest jednym z wielu sposobów analizy struktury danej macierzy korelacji. Z założenia, pierwsza główna oś to ta, która maksymalizuje wariancję (odzwierciedloną przez jej wartość własną), gdy dane są rzutowane na linię (która oznacza kierunek w przestrzeni wymiarowej, zakładając, że masz zmienne ), a druga jest prostopadła do niego i nadal maksymalizuje pozostałą wariancję. To jest powód, dla którego użycie dwóch pierwszych osi powinno zapewnić lepsze przybliżenie pierwotnej przestrzeni zmiennych (powiedzmy macierz o wymiarze ), gdy jest rzutowana na płaszczyznę.ppXn × p
Główne składniki to po prostu liniowe kombinacje oryginalnych zmiennych. Dlatego wykreślanie wyników poszczególnych czynników (zdefiniowanych jako , gdzie jest wektorem obciążeń dowolnego głównego składnika), może na przykład pomóc wyróżnić grupy jednorodnych osobników lub zinterpretować ogólną punktację przy rozważaniu wszystkich zmiennych jednocześnie. Innymi słowy, jest to sposób na podsumowanie swojej lokalizacji w odniesieniu do jej wartości naXuupzmienne lub ich kombinacja. W twoim przypadku ryc. 13.3 w HSAUR pokazuje, że Joyner-Kersee (Jy-K) ma wysoki (ujemny) wynik na 1. osi, co sugeruje, że ogólnie wypadł całkiem dobrze na wszystkich zawodach. Ta sama linia rozumowania dotyczy interpretacji drugiej osi. Spoglądam na postać bardzo krótko, więc nie będę wchodził w szczegóły, a moja interpretacja jest z pewnością powierzchowna. Zakładam, że dalsze informacje znajdziesz w podręczniku HSAUR. W tym miejscu warto zauważyć, że zarówno zmienne, jak i jednostki są pokazane na tym samym diagramie (nazywa się to biplotemr ( x1, x2)) = cos2)( x1, x2))
Myślę jednak, że lepiej zacznij czytać książkę wprowadzającą na temat analizy wielowymiarowej, aby uzyskać głęboki wgląd w metody oparte na PCA. Na przykład BS Everitt napisał doskonały podręcznik na ten temat, An R and S-Plus ® Companion to Multivariate Analysis , i możesz sprawdzić stronę internetową towarzyszącą dla ilustracji. Istnieją inne świetne pakiety R do analizy danych wielowymiarowych, takie jak ade4 i FactoMineR .