Pytania otagowane jako mixed-type-data

Zbiór danych zawierający zmienne o różnym charakterze pomiarowym (np. Ciągłe, jakościowe, binarne, liczebne itp.) Analizowane razem w jednym zestawie zmiennych. Użyj tego tagu, gdy stanowi to wyzwanie dla analizy. NIE używaj w odniesieniu do [model mieszany].

6
Czy analizę głównych składników można zastosować do zbiorów danych zawierających mieszankę zmiennych ciągłych i kategorycznych?
Mam zestaw danych, który zawiera zarówno dane ciągłe, jak i kategoryczne. Analizuję za pomocą PCA i zastanawiam się, czy dobrze jest uwzględnić zmienne kategorialne jako część analizy. Rozumiem, że PCA można zastosować tylko do zmiennych ciągłych. Czy to jest poprawne? Jeśli nie można go użyć do danych kategorycznych, jakie są …

6
Korelacje z nieuporządkowanymi zmiennymi kategorialnymi
Mam ramkę danych z wieloma obserwacjami i wieloma zmiennymi. Niektóre z nich są kategoryczne (nieuporządkowane), a inne są numeryczne. Szukam skojarzeń między tymi zmiennymi. Byłem w stanie obliczyć korelację dla zmiennych numerycznych (korelacja Spearmana), ale: Nie wiem, jak zmierzyć korelację między nieuporządkowanymi zmiennymi kategorialnymi. Nie wiem, jak zmierzyć korelację między …


2
Jak używać jednocześnie zmiennych binarnych i ciągłych w grupowaniu?
Potrzebuję użyć zmiennych binarnych (wartości 0 i 1) w k-średnich. Ale k-średnie działa tylko ze zmiennymi ciągłymi. Wiem, że niektórzy ludzie nadal używają tych zmiennych binarnych w k-średnich, ignorując fakt, że k-średnie jest zaprojektowane tylko dla zmiennych ciągłych. To jest dla mnie nie do przyjęcia. Pytania: Jaki jest zatem statystycznie …

4
Dlaczego mieszane dane stanowią problem dla algorytmów klastrowych opartych na euklidesie?
Większość klasycznych algorytmów grupowania i zmniejszania wymiarów (grupowanie hierarchiczne, analiza głównych składników, średnie k, samoorganizujące się mapy ...) są zaprojektowane specjalnie dla danych liczbowych, a ich dane wejściowe są postrzegane jako punkty w przestrzeni euklidesowej. Jest to oczywiście problem, ponieważ wiele rzeczywistych pytań obejmuje mieszane dane: na przykład, jeśli studiujemy …

8
Grupowanie danych mieszanych z R
Zablokowana . To pytanie i odpowiedzi są zablokowane, ponieważ pytanie jest nie na temat, ale ma znaczenie historyczne. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Zastanawiam się, czy możliwe jest wykonanie w obrębie R grupowania danych o mieszanych zmiennych danych. Innymi słowy, mam zestaw danych zawierający zarówno zmienne liczbowe, jak …



1
Solidna metoda klastrowa dla mieszanych danych w języku R
Chcę skupić mały zestaw danych (64 obserwacje 4 zmiennych interwałowych i pojedynczej zmiennej kategorialnej trzyczynnikowej). Teraz jestem całkiem nowy w analizie skupień, ale zdaję sobie sprawę, że od czasów, gdy hierarchiczne grupowanie lub k-średnie były jedynymi dostępnymi opcjami, nastąpił znaczny postęp. W szczególności wydaje się, że dostępne są nowe metody …

1
t-SNE z mieszanymi zmiennymi ciągłymi i binarnymi
Obecnie badam wizualizację danych wielowymiarowych za pomocą t-SNE. Mam pewne dane z mieszanymi zmiennymi binarnymi i ciągłymi, a dane wydają się zbyt łatwo grupować dane binarne. Oczywiście jest to oczekiwane w przypadku danych skalowanych (od 0 do 1): odległość euklidesowa zawsze będzie największa / najmniejsza między zmiennymi binarnymi. Jak należy …

1
Dyskretne dane i alternatywy dla PCA
Posiadam zestaw danych dyskretnych (porządkowych, meristycznych i nominalnych) zmiennych opisujących morfologiczne charaktery skrzydeł na kilku blisko spokrewnionych gatunkach owadów. Chcę przeprowadzić jakąś analizę, która dałaby mi wizualną reprezentację podobieństwa różnych gatunków w oparciu o cechy morfologiczne. Pierwszą rzeczą, która wpadła mi do głowy, była PCA (jest to rodzaj wizualizacji, którą …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.