Statystyki i duże zbiory danych histogram

4

Ocena przybliżonego rozkładu danych na podstawie histogramu

Załóżmy, że chcę sprawdzić, czy moje dane są wykładnicze na podstawie histogramu (tzn. Są przekrzywione w prawo). W zależności od sposobu grupowania lub binowania danych mogę uzyskać bardzo różne histogramy. Jeden zestaw histogramów sprawi, że dane będą miały charakter wykładniczy. Kolejny zestaw sprawi, że dane nie będą wykładnicze. Jak sprawić, …

111 distributions data-visualization histogram binning

8

Obliczanie optymalnej liczby pojemników na histogramie

Interesuje mnie znalezienie możliwie optymalnej metody określania, ile pojemników powinienem użyć na histogramie. Moje dane powinny mieścić się w przedziale od 30 do 350 obiektów, a w szczególności staram się stosować próg (taki jak metoda Otsu), w którym „dobre” obiekty, których powinienem mieć mniej i które powinny być bardziej rozproszone, …

79 rule-of-thumb histogram

5

R - QQPlot: jak sprawdzić, czy dane są zwykle dystrybuowane

Zrobiłem to po wykonaniu testu normalności Shapiro-Wilka. Test wykazał, że populacja jest zwykle podzielona. Jak jednak zobaczyć to „zachowanie” na tej fabule? AKTUALIZACJA Prosty histogram danych: AKTUALIZACJA Test Shapiro-Wilka mówi:

47 r data-visualization normal-distribution histogram qq-plot

6

Jak ocenić podobieństwo dwóch histogramów?

Biorąc pod uwagę dwa histogramy, jak oceniamy, czy są one podobne, czy nie? Czy wystarczy spojrzeć na dwa histogramy? Proste mapowanie jeden na jeden ma problem polegający na tym, że jeśli histogram jest nieco inny i nieznacznie przesunięty, nie uzyskamy pożądanego wyniku. Jakieś sugestie?

33 histogram image-processing

3

Czym różni się rozkład Poissona od rozkładu normalnego?

Wygenerowałem wektor, który ma rozkład Poissona, jak następuje: x = rpois(1000,10) Jeśli wykonam histogram używając hist(x), rozkład wygląda jak znajomy rozkład normalny w kształcie dzwonu. Jednak w teście Kołmogorowa-Smirnoffa ks.test(x, 'pnorm',10,3)stwierdzono, że rozkład różni się znacznie od rozkładu normalnego z powodu bardzo małej pwartości. Moje pytanie brzmi zatem: czym różni …

29 distributions histogram normal-distribution poisson-distribution

3

Korzyści z używania wykresów QQ nad histogramami

W tym komentarzu Nick Cox napisał: Podział na klasy jest starożytną metodą. Podczas gdy histogramy mogą być przydatne, nowoczesne oprogramowanie statystyczne ułatwia, a także wskazane jest dopasowanie rozkładów do surowych danych. Binning po prostu odrzuca szczegóły, które są kluczowe przy określaniu, które rozkłady są prawdopodobne. Kontekst tego komentarza sugeruje użycie …

22 references histogram binning qq-plot

4

Jak sprawdzić, czy moja dystrybucja jest multimodalna?

Kiedy wykreślam histogram moich danych, ma on dwa szczyty: Czy to oznacza potencjalny rozkład multimodalny? Uruchomiłem dip.testw R ( library(diptest)), a dane wyjściowe to: D = 0.0275, p-value = 0.7913 Czy mogę stwierdzić, że moje dane mają rozkład multimodalny? DANE 10346 13698 13894 19854 28066 26620 27066 16658 9221 13578 …

21 r hypothesis-testing distributions self-study histogram

4

Jak rzutować nowy wektor na przestrzeń PCA?

Po przeprowadzeniu analizy głównego składnika (PCA) chcę rzutować nowy wektor na przestrzeń PCA (tzn. Znaleźć jego współrzędne w układzie współrzędnych PCA). Mam obliczony PCA w języku R użyciu prcomp. Teraz powinienem być w stanie pomnożyć mój wektor przez macierz obrotu PCA. Czy główne elementy tej macierzy powinny być ułożone w …

21 r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial

1

Dobroć dopasowania do histogramów 2D

Mam dwa zestawy danych reprezentujących parametry gwiazd: obserwowany i modelowany. Za pomocą tych zestawów tworzę tak zwany schemat dwukolorowy (TCD). Próbkę można zobaczyć tutaj: Być obserwowane dane i B dane wydobyte z modelu (nieważne czarne linie, kropki reprezentują dane) Mam tylko jedno A schemat, ale może produkować tyle różnych B …

19 goodness-of-fit histogram

4

Porównanie dwóch histogramów przy użyciu odległości Chi-Square

Chcę porównać dwa obrazy twarzy. Obliczyłem ich histogramy LBP. Więc teraz muszę porównać te dwa histogramy i uzyskać coś, co powie, ile te histogramy są równe (0 - 100%). Istnieje wiele sposobów rozwiązania tego zadania, ale autorzy metody LBP podkreślają (Opis twarzy z lokalnymi wzorami binarnymi: Zastosowanie do rozpoznawania twarzy. …

18 chi-squared histogram image-processing

4

Różnica między histogramem a pdf?

Jeśli chcemy wyraźnie zobaczyć rozkład danych ciągłych, który z histogramu i pdf powinien zostać użyty? Jakie są różnice między histogramem a pdf, a nie pod względem formuły?

18 distributions pdf histogram

1

Jak działa test chi-kwadrat Pearsona

Po ostatnim głosowaniu w dół próbowałem sprawdzić swoje zrozumienie testu Pearson Chi Squared. Zwykle używam statystyki chi kwadrat (lub zredukowanej statystyki chi kwadrat) do dopasowania lub sprawdzenia wynikowego dopasowania. W tym przypadku wariancja nie jest zwykle oczekiwaną liczbą zliczeń w tabeli lub histogramie, ale pewną wariancją określoną eksperymentalnie. Tak czy …

18 chi-squared histogram

3

Moja dystrybucja jest normalna; Test Kołmogorowa-Smirnowa nie zgadza się

Mam problem z normalnością niektórych danych, które mam: Zrobiłem test Kołmogorowa, który mówi, że nie jest normalne z p = 0,0000, nie rozumiem: skośność mojej dystrybucji = -. 497, i kurtoza = -0,024 Oto fabuła mojej dystrybucji, która wygląda bardzo normalnie ... (Mam trzy wyniki i każdy z nich nie …

15 normal-distribution spss kolmogorov-smirnov histogram qq-plot

3

Najlepszy sposób na umieszczenie dwóch histogramów w tej samej skali?

Załóżmy, że mam dwa rozkłady, które chcę szczegółowo porównać, tj. W taki sposób, aby kształt, skala i przesunięcie były łatwo widoczne. Jednym dobrym sposobem na to jest wykreślenie histogramu dla każdej dystrybucji, umieszczenie ich w tej samej skali X i ułożenie jednego pod drugim. W jaki sposób należy to zrobić? …

14 data-visualization histogram pdf binning

1

Caret glmnet vs cv.glmnet

Wydaje się, że istnieje wiele zamieszania w porównaniu używania glmnetwewnątrz w caretcelu znalezienia optymalnej lambdy i korzystania cv.glmnetz tego samego zadania. Zadano wiele pytań, np .: Model klasyfikacji train.glmnet vs. cv.glmnet? Jaki jest właściwy sposób używania glmnet z karetką? Cross-validation `glmnet` za pomocą` caret` ale nie udzielono odpowiedzi, co może …

14 r caret glmnet machine-learning neural-networks maximum softmax probability distributions mathematical-statistics random-variable cdf statistical-significance variance expected-value ratio sample-size reliability tolerance-interval wilcoxon-signed-rank self-study variance sampling mean machine-learning svm libsvm self-study sampling ranks data-visualization histogram machine-learning classification normal-distribution mathematical-statistics maximum-likelihood mixture predictive-models prediction seasonality

Pytania otagowane jako histogram