Histogram jest graficzną reprezentacją częstotliwości zmiennej ciągłej. Zmienna jest dzielona na przedziały i dla każdego przedziału rysowany jest słupek, proporcjonalnie do jego częstotliwości w danych.
Załóżmy, że chcę sprawdzić, czy moje dane są wykładnicze na podstawie histogramu (tzn. Są przekrzywione w prawo). W zależności od sposobu grupowania lub binowania danych mogę uzyskać bardzo różne histogramy. Jeden zestaw histogramów sprawi, że dane będą miały charakter wykładniczy. Kolejny zestaw sprawi, że dane nie będą wykładnicze. Jak sprawić, …
Interesuje mnie znalezienie możliwie optymalnej metody określania, ile pojemników powinienem użyć na histogramie. Moje dane powinny mieścić się w przedziale od 30 do 350 obiektów, a w szczególności staram się stosować próg (taki jak metoda Otsu), w którym „dobre” obiekty, których powinienem mieć mniej i które powinny być bardziej rozproszone, …
Zrobiłem to po wykonaniu testu normalności Shapiro-Wilka. Test wykazał, że populacja jest zwykle podzielona. Jak jednak zobaczyć to „zachowanie” na tej fabule? AKTUALIZACJA Prosty histogram danych: AKTUALIZACJA Test Shapiro-Wilka mówi:
Biorąc pod uwagę dwa histogramy, jak oceniamy, czy są one podobne, czy nie? Czy wystarczy spojrzeć na dwa histogramy? Proste mapowanie jeden na jeden ma problem polegający na tym, że jeśli histogram jest nieco inny i nieznacznie przesunięty, nie uzyskamy pożądanego wyniku. Jakieś sugestie?
Wygenerowałem wektor, który ma rozkład Poissona, jak następuje: x = rpois(1000,10) Jeśli wykonam histogram używając hist(x), rozkład wygląda jak znajomy rozkład normalny w kształcie dzwonu. Jednak w teście Kołmogorowa-Smirnoffa ks.test(x, 'pnorm',10,3)stwierdzono, że rozkład różni się znacznie od rozkładu normalnego z powodu bardzo małej pwartości. Moje pytanie brzmi zatem: czym różni …
W tym komentarzu Nick Cox napisał: Podział na klasy jest starożytną metodą. Podczas gdy histogramy mogą być przydatne, nowoczesne oprogramowanie statystyczne ułatwia, a także wskazane jest dopasowanie rozkładów do surowych danych. Binning po prostu odrzuca szczegóły, które są kluczowe przy określaniu, które rozkłady są prawdopodobne. Kontekst tego komentarza sugeruje użycie …
Kiedy wykreślam histogram moich danych, ma on dwa szczyty: Czy to oznacza potencjalny rozkład multimodalny? Uruchomiłem dip.testw R ( library(diptest)), a dane wyjściowe to: D = 0.0275, p-value = 0.7913 Czy mogę stwierdzić, że moje dane mają rozkład multimodalny? DANE 10346 13698 13894 19854 28066 26620 27066 16658 9221 13578 …
Po przeprowadzeniu analizy głównego składnika (PCA) chcę rzutować nowy wektor na przestrzeń PCA (tzn. Znaleźć jego współrzędne w układzie współrzędnych PCA). Mam obliczony PCA w języku R użyciu prcomp. Teraz powinienem być w stanie pomnożyć mój wektor przez macierz obrotu PCA. Czy główne elementy tej macierzy powinny być ułożone w …
Mam dwa zestawy danych reprezentujących parametry gwiazd: obserwowany i modelowany. Za pomocą tych zestawów tworzę tak zwany schemat dwukolorowy (TCD). Próbkę można zobaczyć tutaj: Być obserwowane dane i B dane wydobyte z modelu (nieważne czarne linie, kropki reprezentują dane) Mam tylko jedno A schemat, ale może produkować tyle różnych B …
Chcę porównać dwa obrazy twarzy. Obliczyłem ich histogramy LBP. Więc teraz muszę porównać te dwa histogramy i uzyskać coś, co powie, ile te histogramy są równe (0 - 100%). Istnieje wiele sposobów rozwiązania tego zadania, ale autorzy metody LBP podkreślają (Opis twarzy z lokalnymi wzorami binarnymi: Zastosowanie do rozpoznawania twarzy. …
Jeśli chcemy wyraźnie zobaczyć rozkład danych ciągłych, który z histogramu i pdf powinien zostać użyty? Jakie są różnice między histogramem a pdf, a nie pod względem formuły?
Po ostatnim głosowaniu w dół próbowałem sprawdzić swoje zrozumienie testu Pearson Chi Squared. Zwykle używam statystyki chi kwadrat (lub zredukowanej statystyki chi kwadrat) do dopasowania lub sprawdzenia wynikowego dopasowania. W tym przypadku wariancja nie jest zwykle oczekiwaną liczbą zliczeń w tabeli lub histogramie, ale pewną wariancją określoną eksperymentalnie. Tak czy …
Mam problem z normalnością niektórych danych, które mam: Zrobiłem test Kołmogorowa, który mówi, że nie jest normalne z p = 0,0000, nie rozumiem: skośność mojej dystrybucji = -. 497, i kurtoza = -0,024 Oto fabuła mojej dystrybucji, która wygląda bardzo normalnie ... (Mam trzy wyniki i każdy z nich nie …
Załóżmy, że mam dwa rozkłady, które chcę szczegółowo porównać, tj. W taki sposób, aby kształt, skala i przesunięcie były łatwo widoczne. Jednym dobrym sposobem na to jest wykreślenie histogramu dla każdej dystrybucji, umieszczenie ich w tej samej skali X i ułożenie jednego pod drugim. W jaki sposób należy to zrobić? …
Wydaje się, że istnieje wiele zamieszania w porównaniu używania glmnetwewnątrz w caretcelu znalezienia optymalnej lambdy i korzystania cv.glmnetz tego samego zadania. Zadano wiele pytań, np .: Model klasyfikacji train.glmnet vs. cv.glmnet? Jaki jest właściwy sposób używania glmnet z karetką? Cross-validation `glmnet` za pomocą` caret` ale nie udzielono odpowiedzi, co może …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.