Zastanów się, co robi PCA. Mówiąc najprościej, PCA (jak zwykle działa) tworzy nowy układ współrzędnych poprzez:
- przesunięcie źródła do środka ciężkości danych,
- ściska i / lub rozciąga osie, aby uzyskać ich równą długość, oraz
- obraca osie w nowej orientacji.
(Aby uzyskać więcej informacji, zapoznaj się z tym doskonałym wątkiem CV: Zrozumienie analizy głównych składników, wektorów własnych i wartości własnych .) Jednak nie tylko obraca się osiami w jakikolwiek stary sposób. Twój nowy (pierwszy główny składnik) jest zorientowany na maksymalne zróżnicowanie danych. Drugi główny składnik jest zorientowany w kierunku następnej największej zmiany, która jest prostopadła do pierwszego głównego składnikaX1 . Pozostałe główne elementy są również tworzone.
Mając to na uwadze, przeanalizujmy przykład @ amoeba . Oto macierz danych z dwoma punktami w trójwymiarowej przestrzeni:
Zobaczmy te punkty w (pseudo) trójwymiarowym wykresie rozrzutu:
X=[121212]
(1.5,1.5,1.5)(0,0,0)(3,3,3)(0,0,3)(3,3,0)(0,3,0)(3,0,3)
N.= 2 dane, które możemy zmieścić (co najwyżej) N.- 1 = 1 główne składniki.