Pytania otagowane jako pca

Analiza głównego składnika (PCA) jest techniką liniowej redukcji wymiarów. Zmniejsza wielowymiarowy zestaw danych do mniejszego zestawu skonstruowanych zmiennych, zachowując możliwie jak najwięcej informacji (tak dużą wariancję). Te zmienne, zwane głównymi składnikami, są liniowymi kombinacjami zmiennych wejściowych.


1
Jakie są wydajne algorytmy do obliczania dekompozycji wartości pojedynczej (SVD)?
Artykuł w Wikipedii na temat analizy głównych komponentów stwierdza, że Istnieją wydajne algorytmy do obliczania SVD bez konieczności formowania macierzy , więc obliczanie SVD jest obecnie standardowym sposobem obliczania analizy głównych składników z macierzy danych, chyba że wymagana jest tylko garść składników.XXXXTXXTXX^TX Czy ktoś mógłby mi powiedzieć, o jakich skutecznych …
17 pca  algorithms  svd  numerics 

1
Czy solidne metody są naprawdę lepsze?
Mam dwie grupy badanych, A i B, każda o wielkości około 400 i około 300 predyktorów. Moim celem jest zbudowanie modelu predykcyjnego dla zmiennej odpowiedzi binarnej. Mój klient chce zobaczyć wynik zastosowania modelu zbudowanego z A na B. (W swojej książce „Strategie modelowania regresji” @FrankHarrell wspomina, że ​​lepiej jest połączyć …

4
Zmienne „normalizujące” dla SVD / PCA
Załóżmy, że mamy mierzalnych zmiennych, , wykonujemy liczbę pomiarów, a następnie chcemy przeprowadzić rozkład wyników w liczbie pojedynczej na wynikach, aby znaleźć osie największej wariancji dla punktów w przestrzeni wymiarowej. ( Uwaga: załóżmy, że środki zostały już odjęte, więc dla wszystkich .)N.N.N( a1, a2), … , AN.)(za1,za2),…,zaN.)(a_1, a_2, \ldots, a_N)M.> …

3
Analiza głównego składnika „wstecz”: ile wariancji danych wyjaśnia dana liniowa kombinacja zmiennych?
I przeprowadzeniu analizy głównych składowych sześć zmiennych , , , , E i F . Jeśli dobrze rozumiem, niezabezpieczone PC1 mówi mi, jaka liniowa kombinacja tych zmiennych opisuje / wyjaśnia największą wariancję danych, a PC2 mówi mi, jaka liniowa kombinacja tych zmiennych opisuje następną największą wariancję danych i tak dalej. …

1
Solidny PCA w porównaniu z solidną odległością Mahalanobisa do wykrywania wartości odstających
Solidna metoda PCA (opracowana przez Candes i in. 2009 lub jeszcze lepiej Netrepalli i in. 2014 ) jest popularną metodą wykrywania zmiennych odstających na wielu odmianach , ale odległość Mahalanobisa można również zastosować do detekcji wartości odstających, biorąc pod uwagę solidną, regularną ocenę macierzy kowariancji . Jestem ciekawy (nie) zalet …

1
Jaka jest właściwa miara asocjacji zmiennej ze składnikiem PCA (na biplocie / wykresie ładowania)?
Używam FactoMineRdo zredukowania mojego zestawu danych pomiarów do ukrytych zmiennych. Powyższa mapa zmiennych jest dla mnie jasna do interpretacji, ale jestem zdezorientowany, jeśli chodzi o powiązania między zmiennymi a składnikiem 1. Patrząc na mapę zmiennych ddpi covjest ona bardzo blisko komponentu na mapie i ddpAbsjest nieco dalej z dala. Ale …

2
Po co logować transformację danych przed przeprowadzeniem analizy głównych składników?
Im podążam za tutorialem tutaj: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/, aby lepiej zrozumieć PCA. Samouczek używa zestawu danych Iris i stosuje transformację dziennika przed PCA: Zauważ, że w poniższym kodzie stosujemy transformację logarytmiczną do zmiennych ciągłych, zgodnie z sugestią [1], i ustawiamy centeri scalerównoważymy TRUEw wywołaniu prcompstandaryzacji zmiennych przed zastosowaniem PCA. Czy ktoś mógłby …

1
Czy komponenty PCA wielowymiarowych danych Gaussa są statystycznie niezależne?
Czy komponenty PCA (w analizie głównych komponentów) są statystycznie niezależne, jeśli nasze dane są zwykle dystrybuowane na wielu odmianach? Jeśli tak, jak można to wykazać / udowodnić? Pytam, ponieważ widziałem ten post , w którym pierwsza odpowiedź brzmi: PCA nie przyjmuje wyraźnego założenia Gaussa. Znajduje wektory własne, które maksymalizują wariancję …
16 pca  independence  svd 

2
Pokazywanie korelacji przestrzennej i czasowej na mapach
Mam dane dla sieci stacji pogodowych w Stanach Zjednoczonych. To daje mi ramkę danych, która zawiera datę, szerokość, długość i pewną zmierzoną wartość. Załóżmy, że dane są gromadzone raz dziennie i zależą od pogody w skali regionalnej (nie, nie będziemy wchodzić w tę dyskusję). Chciałbym pokazać graficznie, jak jednocześnie mierzone …

2
Kiedy łączymy redukcję wymiarowości z klastrowaniem?
Próbuję przeprowadzić klastrowanie na poziomie dokumentu. Skonstruowałem macierz częstotliwości termin-dokument i próbuję zgrupować te wektory o dużych wymiarach za pomocą k-średnich. Zamiast bezpośredniego grupowania, najpierw zastosowałem dekompozycję wektora osobliwego LSA (Latent Semantic Analysis) w celu uzyskania macierzy U, S, Vt, wybrałem odpowiedni próg za pomocą wykresu piargowego i zastosowałem grupowanie …

2
Ocena wiarygodności kwestionariusza: wymiarowość, problematyczne elementy i czy użyć alfa, lambda6 lub jakiegoś innego indeksu?
Analizuję wyniki podane przez uczestników biorących udział w eksperymencie. Chcę oszacować wiarygodność mojego kwestionariusza, który składa się z 6 pozycji, mających na celu oszacowanie stosunku uczestników do produktu. Obliczyłem alfa Cronbacha traktującego wszystkie elementy jako pojedynczą skalę (alfa wynosiła około 0,6) i usuwając jeden element na raz (maksymalna alfa wynosiła …

3
Interpretowanie wyników PCA
Czy ktoś może mi pomóc w interpretacji wyników PCA? Moje dane pochodzą z kwestionariusza dotyczącego stosunku do niedźwiedzi. Zgodnie z ładunkami zinterpretowałem jeden z moich głównych elementów jako „strach przed niedźwiedziami”. Czy wyniki tego głównego składnika byłyby powiązane ze sposobem, w jaki każdy respondent ocenia ten główny składnik (czy ocenia …
16 pca 

1
Jaki jest związek między częściową najmniejszą liczbą kwadratów, regresją zredukowaną i regresją składowych głównych?
Czy regresja zredukowana rangi i regresja głównych składników to tylko szczególne przypadki częściowych najmniejszych kwadratów? Ten samouczek (strona 6, „Porównanie celów”) stwierdza, że ​​kiedy wykonujemy częściowe najmniejsze kwadraty bez rzutowania X lub Y (tj. „Nie częściowy”), staje się odpowiednio regresją zmniejszoną rangą lub regresją składowych głównych. Podobne oświadczenie znajduje się …

2
Walidacja krzyżowa PCA i k-krotnie w pakiecie karetki w R.
Właśnie obejrzałem ponownie wykład z kursu Machine Learning na Coursera. W części, w której profesor omawia PCA do wstępnego przetwarzania danych w nadzorowanych aplikacjach edukacyjnych, mówi, że PCA powinno być wykonywane tylko na danych szkoleniowych, a następnie mapowanie służy do transformacji zestawów walidacji krzyżowej i testów. Zobacz także PCA i …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.