Wiem, że celem PCA jest zmniejszenie wymiarów
Ludzie często tak sądzą, ale w rzeczywistości PCA to tylko reprezentacja danych w ujęciu ortogonalnym. Ta podstawa nadal ma takie same wymiary jak oryginalne dane. Nic nie jest stracone ... jeszcze. Część dotycząca zmniejszania wymiarów zależy wyłącznie od Ciebie. PCA zapewnia, że górne wymiarów nowej projekcji to najlepsze wymiarów, które mogą być reprezentowane przez dane. Co najlepiej znaczy? Właśnie tutaj pojawia się wyjaśniona wariancja.k k
oczywiście nie w tym przypadku
Nie byłbym tego taki pewien! Z drugiego wykresu wygląda wizualnie, że wiele informacji z twoich danych można rzutować na poziomą linię. To 1 wymiar, zamiast oryginalnej fabuły, która była w 2 wymiarach! Oczywiście tracisz niektóre informacje, ponieważ usuwasz oś Y, ale to, czy utrata tych informacji jest dla Ciebie akceptowalna, zależy od ciebie.
Istnieje mnóstwo pytań związanych z tym, co PCA jest na stronie, więc zachęcam do sprawdzenia ich tutaj , tutaj , tutaj lub tutaj . Jeśli masz później inne pytania, prześlij je, a chętnie pomogę.
Jako twoje aktualne pytanie:
jaka jest historia, którą możesz opowiedzieć o temperaturze w porównaniu z lodami na wykresie PCA?
Ponieważ nowe osie współrzędnych są liniową kombinacją pierwotnych współrzędnych, to ... w zasadzie nic! PCA da ci odpowiedź w rodzaju (złożone liczby):
PC1PC2=2.5×ice cream−3.6×temperature=−1.5×ice cream+0.6×temperature
Czy to ci się przydaje? Może. Ale nie sądzę :)
Edytowane
Dodam ten zasób, który moim zdaniem jest pomocny, ponieważ interaktywne wykresy są fajne.
Edytowane ponownie
Aby wyjaśnić, co oznacza najlepsze :k
PCA próbuje znaleźć wymiary, które dają największą wariancję, gdy dane są na nich rzutowane. Zakładając, że twoje dane mają wymiarów, pierwsze komputerów wyjaśnia większą wariancję danych niż jakikolwiek inny wymiarów. To, co mam na myśli najlepszą . To, czy jest to dla Ciebie przydatne, to inna sprawa.n>kkk k