Istnieje wiele różnych sposobów tworzenia dwupłatów PCA, więc nie ma unikalnej odpowiedzi na twoje pytanie. Oto krótki przegląd.
Zakładamy, że macierz danych ma n punktów danych w rzędach i jest wyśrodkowana (tzn. Wszystkie kolumny są zerowe). Na razie nie zakładamy, że był on znormalizowany, tzn. Rozważamy PCA na macierzy kowariancji (nie na macierzy korelacji). PCA oznacza rozkład pojedynczej wartości X = U S V ⊤ , możesz zobaczyć moją odpowiedź tutaj, aby uzyskać szczegółowe informacje: Związek między SVD a PCA. Jak korzystać z SVD do wykonywania PCA?Xn
X=USV⊤,
W biplocie PCA dwa pierwsze główne składniki są wykreślane jako wykres rozproszenia, tj. Pierwsza kolumna jest wykreślana względem drugiej kolumny. Ale normalizacja może być inna; np. można użyć:U
- Kolumny : są to główne składniki skalowane do jednostkowej sumy kwadratów;U
- Kolumny : są to znormalizowane główne składniki (wariancja jednostkowa);n−1−−−−−√U
- Kolumny : są to „surowe” główne elementy (rzuty na główne kierunki).US
Ponadto oryginalne zmienne są wykreślane jako strzałki; czyli współrzędnych AN i -tym strzałka końcowych są przez ı wartości -tym w pierwszej i drugiej kolumnie V . Ale znowu można wybrać różne normalizacje, np .:(x,y)iiV
- Kolumny : Nie wiem, jak mogłaby to być interpretacja;VS
- Kolumny : są to obciążenia;VS/n−1−−−−−√
- Kolumny : są to główne osie (aka główne kierunki, aka wektory własne).V
Oto jak to wszystko wygląda w zestawie danych Fisher Iris:
9XUSαβVS(1−α)/β9 są „odpowiednimi dwuplotami”: mianowicie kombinacją dowolnej podploty z góry z tą podplotem bezpośrednio.
[Jakakolwiek kombinacja zostanie użyta, może być konieczne skalowanie strzałek według dowolnego dowolnego stałego współczynnika, tak aby zarówno strzałki, jak i punkty danych pojawiały się mniej więcej w tej samej skali.]
VS/n−1−−−−−√Un−1−−−−−√
Ten [szczególny wybór] prawdopodobnie zapewni najbardziej użyteczną pomoc graficzną w interpretacji wielowymiarowych matryc obserwacji, pod warunkiem oczywiście, że można je odpowiednio aproksymować na drugim miejscu.
USV
US
biplot
UVSbiplot
0.8biplot
n/(n−1)1Strzały podstawowych zmiennych w biplocie PCA w R. )
PCA na macierzy korelacji
X1
1R=1
Dalsza lektura: