Pytania otagowane jako pca

Analiza głównego składnika (PCA) jest techniką liniowej redukcji wymiarów. Zmniejsza wielowymiarowy zestaw danych do mniejszego zestawu skonstruowanych zmiennych, zachowując możliwie jak najwięcej informacji (tak dużą wariancję). Te zmienne, zwane głównymi składnikami, są liniowymi kombinacjami zmiennych wejściowych.

1
Dlaczego Daniel Wilks (2011) twierdzi, że regresja głównego składnika „będzie tendencyjna”?
W Metodach statystycznych w naukach atmosferycznych Daniel Wilks zauważa, że ​​wielokrotna regresja liniowa może prowadzić do problemów, jeśli między predyktorami występują bardzo silne wzajemne korelacje (wydanie trzecie, strona 559-560): Patologia, która może wystąpić w wielokrotnej regresji liniowej, polega na tym, że zestaw zmiennych predykcyjnych o silnych wzajemnych korelacjach może skutkować …
13 regression  pca  bias 

1
Nadzorowana redukcja wymiarów
Mam zestaw danych składający się z 15K próbek znakowanych (z 10 grup). Chcę zastosować redukcję wymiarowości do 2 wymiarów, które uwzględnią znajomość etykiet. Kiedy używam „standardowych” nienadzorowanych technik redukcji wymiarów, takich jak PCA, wykres rozproszenia wydaje się nie mieć nic wspólnego ze znanymi etykietami. Czy to, czego szukam, ma imię? …

1
Czym są „obrócone” i „nieobrócone” główne elementy, biorąc pod uwagę, że PCA zawsze obraca osie współrzędnych?
O ile rozumiem, główne komponenty są uzyskiwane przez obrót osi współrzędnych w celu wyrównania ich z kierunkami maksymalnej wariancji. Niemniej jednak wciąż czytam o „niezabezpieczonych głównych składnikach”, a moje oprogramowanie statystyczne (SAS) daje mi główne elementy obrócone varimax, a także te niezabezpieczone. Tutaj jestem zdezorientowany: kiedy obliczamy główne elementy, osie …


1
Jak interpretować ładunki PCA?
Czytając o PCA, natrafiłem na następujące wyjaśnienie: Załóżmy, że mamy zestaw danych, w którym każdy punkt danych reprezentuje wyniki pojedynczego ucznia w teście matematycznym, teście fizyki, teście czytania ze zrozumieniem i teście słownictwa. Znajdujemy dwa pierwsze główne składniki, które wychwytują 90% zmienności danych i interpretują ich obciążenia. Dochodzimy do wniosku, …
13 pca 

3
Krok po kroku wdrożenie PCA w języku R przy użyciu samouczka Lindsay Smith
Pracuję w R poprzez doskonały samouczek PCA autorstwa Lindsay I Smith i utknąłem w ostatnim etapie. Poniższy skrypt R przenosi nas do etapu (na str. 19), na którym odtwarzane są oryginalne dane z (w tym przypadku pojedynczego) głównego elementu, który powinien dać wykres linii prostej wzdłuż osi PCA1 (biorąc pod …
13 r  pca 

2
Wybór komponentów PCA, które oddzielają grupy
Często diagnozowałem moje dane wielowymiarowe za pomocą PCA (dane omiczne z setkami tysięcy zmiennych i dziesiątkami lub setkami próbek). Dane często pochodzą z eksperymentów z kilkoma kategorycznymi zmiennymi niezależnymi definiującymi niektóre grupy, i często muszę przejść przez kilka składników, zanim znajdę te, które wykazują rozdział między grupami zainteresowań. Wymyśliłem dość …

3
Jak obliczyć główne składniki obrócone varimax w R?
Uruchomiłem PCA na 25 zmiennych i wybrałem 7 najlepszych komputerów za pomocą prcomp. prc <- prcomp(pollutions, center=T, scale=T, retx=T) Następnie wykonałem obrót varimax na tych elementach. varimax7 <- varimax(prc$rotation[,1:7]) A teraz chcę varimax obrócić dane obrócone PCA (ponieważ nie jest to część obiektu varimax - tylko macierz obciążeń i macierz …
13 r  pca  factor-rotation 




5
Redukcja wymiarów SVD dla szeregów czasowych o różnej długości
Używam Singular Value Decomposition jako techniki redukcji wymiarowości. Biorąc pod uwagę Nwektory wymiaru D, ideą jest przedstawienie cech w przekształconej przestrzeni o nieskorelowanych wymiarach, która kondensuje większość informacji danych w wektorach własnych tej przestrzeni w malejącym porządku ważności. Teraz próbuję zastosować tę procedurę do danych szeregów czasowych. Problem polega na …

3
Czy optymalizacja PCA jest wypukła?
Funkcja celu w głównej analizie składników (PCA) polega na minimalizowaniu błędu rekonstrukcji w normie L2 (patrz sekcja 2.12 tutaj . Inny pogląd stara się zmaksymalizować wariancję projekcji. Mamy też doskonały post tutaj: Jaka jest funkcja celu PCA ? ). Moje pytanie brzmi: czy wypukła jest optymalizacja PCA? (Znalazłem tutaj kilka …

1
Pakiet GBM vs. Caret korzystający z GBM
Stroiłem model przy użyciu caret, ale potem ponownie uruchomiłem model przy użyciu gbmpakietu. Rozumiem, że caretpakiet używa gbmi wynik powinien być taki sam. Jednak tylko szybki test przy użyciu data(iris)wykazuje rozbieżność w modelu około 5% przy użyciu RMSE i R ^ 2 jako metryki oceny. Chcę znaleźć optymalną wydajność modelu …

1
Wyniki PCA i składników oparte na kombinacji zmiennych ciągłych i binarnych
Chcę zastosować PCA do zestawu danych, który składa się ze zmiennych typu mieszanego (ciągłego i binarnego). Aby zilustrować tę procedurę, wklejam minimalny odtwarzalny przykład w R poniżej. # Generate synthetic dataset set.seed(12345) n <- 100 x1 <- rnorm(n) x2 <- runif(n, -2, 2) x3 <- x1 + x2 + rnorm(n) …
13 r  pca 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.