Statystyki i duże zbiory danych wilcoxon-mann-whitney

7

Jak wybrać test t lub test nieparametryczny, np. Wilcoxon w małych próbkach

Niektóre hipotezy można przetestować za pomocą testu t- Studenta (być może przy użyciu poprawki Welcha dla nierównych wariancji w przypadku dwóch próbek) lub za pomocą testu nieparametrycznego, takiego jak test rangowany ze znakiem Wilcoxona, test U Wilcoxona-Manna-Whitneya, lub test sparowanego znaku. Jak możemy podjąć podstawową decyzję o tym, który test …

96 hypothesis-testing t-test nonparametric small-sample wilcoxon-mann-whitney

5

Jak radzić sobie z hierarchicznymi / zagnieżdżonymi danymi w uczeniu maszynowym

Wyjaśnię mój problem na przykładzie. Załóżmy, że chcesz przewidzieć dochód danej osoby na podstawie niektórych atrybutów: {Wiek, płeć, kraj, region, miasto}. Masz taki zestaw danych szkoleniowych train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID …

29 regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

1

Obliczanie powtarzalności efektów z modelu Lmer

Właśnie natknąłem się na ten artykuł , który opisuje, jak obliczyć powtarzalność (aka niezawodność, aka korelacja wewnątrzklasowa) pomiaru za pomocą modelowania efektów mieszanych. Kod R byłby następujący: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability …

28 mixed-model reliability intraclass-correlation repeatability spss factor-analysis survey modeling cross-validation error curve-fitting mediation correlation clustering sampling machine-learning probability classification metric r project-management optimization svm python dataset quality-control checking clustering distributions anova factor-analysis exponential poisson-distribution generalized-linear-model deviance machine-learning k-nearest-neighbour r hypothesis-testing t-test r variance levenes-test bayesian software bayesian-network regression repeated-measures least-squares change-scores variance chi-squared variance nonlinear-regression regression-coefficients multiple-comparisons p-value r statistical-significance excel sampling sample r distributions interpretation goodness-of-fit normality-assumption probability self-study distributions references theory time-series clustering econometrics binomial hypothesis-testing variance t-test paired-comparisons statistical-significance ab-test r references hypothesis-testing t-test normality-assumption wilcoxon-mann-whitney central-limit-theorem t-test data-visualization interactive-visualization goodness-of-fit

2

Kiedy stosować test sumy rang Wilcoxona zamiast niesparowanego testu t?

To jest kolejne pytanie do tego, co napisał tutaj Frank Harrell : Z mojego doświadczenia wynika, że wymagany rozmiar próbki, aby rozkład t był dokładny, jest często większy niż rozmiar próbki pod ręką. Test rangowanych znaków Wilcoxona jest niezwykle wydajny, jak powiedziałeś, i jest solidny, więc prawie zawsze wolę go …

26 t-test wilcoxon-mann-whitney

1

Czy doniesienia o śmierci testu t zostały znacznie przesadzone?

Czytając CV wszechczasów, znalazłem stwierdzenie, które chciałbym wyjaśnić. To jest post, a moje pytanie odnosi się do uwag końcowych: „Muszę zauważyć, że cała wiedza, którą właśnie przekazałem, jest nieco przestarzała; teraz, gdy mamy komputery, możemy zrobić coś więcej niż testy t. Jak zauważa Frank, ty prawdopodobnie zechcesz użyć testów Wilcoxona …

25 hypothesis-testing t-test permutation-test wilcoxon-mann-whitney

2

Różnica między testem sumy rang Wilcoxona a testem rang podpisanych Wilcoxona

Zastanawiałem się, jaka jest teoretyczna różnica między testem sumy rang Wilcoxona a testem rang Wilcoxona przy użyciu sparowanych obserwacji. Wiem, że test sumy rang Wilcoxona pozwala na różną liczbę obserwacji w dwóch różnych próbkach, podczas gdy test rangi ze znakiem w parach nie pozwala na to, jednak wydaje mi się, …

22 paired-data wilcoxon-signed-rank wilcoxon-mann-whitney

5

Co dokładnie wykonuje test nieparametryczny i co robisz z wynikami?

Mam wrażenie, że można było o to zapytać gdzie indziej, ale nie tak naprawdę z rodzajem podstawowego opisu, którego potrzebuję. Wiem, że nieparametryczny polega na medianie zamiast na średniej do porównywania ... czegoś. Wierzę również, że opiera się na „stopniach swobody” (?) Zamiast standardowego odchylenia. Popraw mnie, jeśli się mylę. …

22 hypothesis-testing nonparametric wilcoxon-mann-whitney

3

Czy dane wyjściowe statystyki W przez wilcox.test () w R są takie same jak statystyki U?

Niedawno czytałem o teście U Manna-Whitneya. Okazuje się, że aby przeprowadzić ten test w R, trzeba przeprowadzić test Wilcoxona! Moje pytanie: czy statystyka W wilcox.testw R jest identyczna ze statystyką U?

22 r wilcoxon-mann-whitney

1

Test nieparametryczny, jeżeli dwie próbki są pobierane z tego samego rozkładu

Chciałbym przetestować hipotezę, że dwie próbki pochodzą z tej samej populacji, nie przyjmując żadnych założeń dotyczących rozkładu próbek lub populacji. Jak mam to zrobić? Z Wikipedii mam wrażenie, że test U Manna Whitneya powinien być odpowiedni, ale wydaje mi się, że nie działa w praktyce. Dla konkretności stworzyłem zestaw danych …

19 r hypothesis-testing nonparametric wilcoxon-mann-whitney wilcoxon-signed-rank

2

Jak sprawdzić różnice między dwiema grupami oznacza, że dane nie są normalnie dystrybuowane?

Wyeliminuję wszystkie szczegóły biologiczne i eksperymenty i przytoczę tylko problem i to, co zrobiłem statystycznie. Chciałbym wiedzieć, czy ma rację, a jeśli nie, jak postępować. Jeśli dane (lub moje wyjaśnienie) nie są wystarczająco jasne, postaram się lepiej wyjaśnić, edytując. Załóżmy, że mam dwie grupy / obserwacje, X i Y, o …

19 hypothesis-testing t-test normality-assumption wilcoxon-mann-whitney central-limit-theorem

1

Testy post-hoc po Kruskal-Wallis: test Dunna czy Bonferroni poprawili testy Manna-Whitneya?

Mam pewną zmienną niegaussowską i muszę sprawdzić, czy istnieją znaczące różnice między wartościami tej zmiennej w 5 różnych grupach. Przeprowadziłem jednokierunkową analizę wariancji Kruskala-Wallisa (która okazała się znacząca), a następnie musiałem sprawdzić, które grupy są znacząco różne. Ponieważ grupy są w pewien sposób posortowane (wartości zmiennej w pierwszej grupie powinny …

18 hypothesis-testing post-hoc wilcoxon-mann-whitney kruskal-wallis dunn-test

8

Minimalna wielkość próbki dla niesparowanego testu t

Czy istnieje „reguła” określająca minimalną wielkość próbki wymaganą do prawidłowego przeprowadzenia testu t? Na przykład należy dokonać porównania między średnimi 2 populacji. Istnieje 7 punktów danych z jednej populacji i tylko 2 punkty danych z drugiej. Niestety eksperyment jest bardzo kosztowny i czasochłonny, a uzyskanie większej ilości danych nie jest …

16 t-test sample-size small-sample wilcoxon-mann-whitney

4

Dokładność maszyny zwiększającej gradient zmniejsza się wraz ze wzrostem liczby iteracji

Eksperymentuję z algorytmem maszyny do zwiększania gradientu za pośrednictwem caretpakietu w R. Korzystając z małego zestawu danych o przyjęciach na studia, uruchomiłem następujący kod: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

1

Jaka intuicja kryje się za wymiennymi próbkami pod hipotezą zerową?

Testy permutacyjne (zwane również testem randomizacji, testem ponownej randomizacji lub testem dokładnym) są bardzo przydatne i przydają się, gdy t-testnie jest spełnione założenie o rozkładzie normalnym wymagane na przykład i gdy transformacja wartości przez ranking test nieparametryczny, Mann-Whitney-U-testktóry prowadziłby do utraty większej ilości informacji. Jednak nie należy zapominać o jednym …

15 hypothesis-testing permutation-test exchangeability r statistical-significance loess data-visualization normal-distribution pdf ggplot2 kernel-smoothing probability self-study expected-value normal-distribution prior correlation time-series regression heteroscedasticity estimation estimators fisher-information data-visualization repeated-measures binary-data panel-data mathematical-statistics coefficient-of-variation normal-distribution order-statistics regression machine-learning one-class probability estimators forecasting prediction validation finance measurement-error variance mean spatial monte-carlo data-visualization boxplot sampling uniform chi-squared goodness-of-fit probability mixture theory gaussian-mixture regression statistical-significance p-value bootstrap regression multicollinearity correlation r poisson-distribution survival regression categorical-data ordinal-data ordered-logit regression interaction time-series machine-learning forecasting cross-validation binomial multiple-comparisons simulation false-discovery-rate r clustering frequency wilcoxon-mann-whitney wilcoxon-signed-rank r svm t-test missing-data excel r numerical-integration r random-variable lme4-nlme mixed-model weighted-regression power-law errors-in-variables machine-learning classification entropy information-theory mutual-information

2

Dlaczego test U Manna – Whitneya jest istotny, gdy mediany są równe?

Otrzymałem wyniki z testu rangi Manna-Whitneya, którego nie rozumiem. Mediana dwóch populacji jest identyczna (6,9). Górne i dolne kwantyle każdej populacji to: 6,64 i 7,2 6,60 i 7,1 Wartość p wynikająca z testu porównującego te populacje wynosi 0,007. Jak te populacje mogą się znacznie różnić? Czy wynika to z rozprzestrzeniania …

15 nonparametric median ranks wilcoxon-mann-whitney

Pytania otagowane jako wilcoxon-mann-whitney