Test sumy rang Wilcoxona, znany również jako test U Manna-Whitneya, jest nieparametrycznym testem rang służącym do oceny, czy jedna z dwóch próbek ma większe wartości niż druga.
Niektóre hipotezy można przetestować za pomocą testu t- Studenta (być może przy użyciu poprawki Welcha dla nierównych wariancji w przypadku dwóch próbek) lub za pomocą testu nieparametrycznego, takiego jak test rangowany ze znakiem Wilcoxona, test U Wilcoxona-Manna-Whitneya, lub test sparowanego znaku. Jak możemy podjąć podstawową decyzję o tym, który test …
Wyjaśnię mój problem na przykładzie. Załóżmy, że chcesz przewidzieć dochód danej osoby na podstawie niektórych atrybutów: {Wiek, płeć, kraj, region, miasto}. Masz taki zestaw danych szkoleniowych train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID …
Właśnie natknąłem się na ten artykuł , który opisuje, jak obliczyć powtarzalność (aka niezawodność, aka korelacja wewnątrzklasowa) pomiaru za pomocą modelowania efektów mieszanych. Kod R byłby następujący: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability …
To jest kolejne pytanie do tego, co napisał tutaj Frank Harrell : Z mojego doświadczenia wynika, że wymagany rozmiar próbki, aby rozkład t był dokładny, jest często większy niż rozmiar próbki pod ręką. Test rangowanych znaków Wilcoxona jest niezwykle wydajny, jak powiedziałeś, i jest solidny, więc prawie zawsze wolę go …
Czytając CV wszechczasów, znalazłem stwierdzenie, które chciałbym wyjaśnić. To jest post, a moje pytanie odnosi się do uwag końcowych: „Muszę zauważyć, że cała wiedza, którą właśnie przekazałem, jest nieco przestarzała; teraz, gdy mamy komputery, możemy zrobić coś więcej niż testy t. Jak zauważa Frank, ty prawdopodobnie zechcesz użyć testów Wilcoxona …
Zastanawiałem się, jaka jest teoretyczna różnica między testem sumy rang Wilcoxona a testem rang Wilcoxona przy użyciu sparowanych obserwacji. Wiem, że test sumy rang Wilcoxona pozwala na różną liczbę obserwacji w dwóch różnych próbkach, podczas gdy test rangi ze znakiem w parach nie pozwala na to, jednak wydaje mi się, …
Mam wrażenie, że można było o to zapytać gdzie indziej, ale nie tak naprawdę z rodzajem podstawowego opisu, którego potrzebuję. Wiem, że nieparametryczny polega na medianie zamiast na średniej do porównywania ... czegoś. Wierzę również, że opiera się na „stopniach swobody” (?) Zamiast standardowego odchylenia. Popraw mnie, jeśli się mylę. …
Niedawno czytałem o teście U Manna-Whitneya. Okazuje się, że aby przeprowadzić ten test w R, trzeba przeprowadzić test Wilcoxona! Moje pytanie: czy statystyka W wilcox.testw R jest identyczna ze statystyką U?
Chciałbym przetestować hipotezę, że dwie próbki pochodzą z tej samej populacji, nie przyjmując żadnych założeń dotyczących rozkładu próbek lub populacji. Jak mam to zrobić? Z Wikipedii mam wrażenie, że test U Manna Whitneya powinien być odpowiedni, ale wydaje mi się, że nie działa w praktyce. Dla konkretności stworzyłem zestaw danych …
Wyeliminuję wszystkie szczegóły biologiczne i eksperymenty i przytoczę tylko problem i to, co zrobiłem statystycznie. Chciałbym wiedzieć, czy ma rację, a jeśli nie, jak postępować. Jeśli dane (lub moje wyjaśnienie) nie są wystarczająco jasne, postaram się lepiej wyjaśnić, edytując. Załóżmy, że mam dwie grupy / obserwacje, X i Y, o …
Mam pewną zmienną niegaussowską i muszę sprawdzić, czy istnieją znaczące różnice między wartościami tej zmiennej w 5 różnych grupach. Przeprowadziłem jednokierunkową analizę wariancji Kruskala-Wallisa (która okazała się znacząca), a następnie musiałem sprawdzić, które grupy są znacząco różne. Ponieważ grupy są w pewien sposób posortowane (wartości zmiennej w pierwszej grupie powinny …
Czy istnieje „reguła” określająca minimalną wielkość próbki wymaganą do prawidłowego przeprowadzenia testu t? Na przykład należy dokonać porównania między średnimi 2 populacji. Istnieje 7 punktów danych z jednej populacji i tylko 2 punkty danych z drugiej. Niestety eksperyment jest bardzo kosztowny i czasochłonny, a uzyskanie większej ilości danych nie jest …
Eksperymentuję z algorytmem maszyny do zwiększania gradientu za pośrednictwem caretpakietu w R. Korzystając z małego zestawu danych o przyjęciach na studia, uruchomiłem następujący kod: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
Testy permutacyjne (zwane również testem randomizacji, testem ponownej randomizacji lub testem dokładnym) są bardzo przydatne i przydają się, gdy t-testnie jest spełnione założenie o rozkładzie normalnym wymagane na przykład i gdy transformacja wartości przez ranking test nieparametryczny, Mann-Whitney-U-testktóry prowadziłby do utraty większej ilości informacji. Jednak nie należy zapominać o jednym …
Otrzymałem wyniki z testu rangi Manna-Whitneya, którego nie rozumiem. Mediana dwóch populacji jest identyczna (6,9). Górne i dolne kwantyle każdej populacji to: 6,64 i 7,2 6,60 i 7,1 Wartość p wynikająca z testu porównującego te populacje wynosi 0,007. Jak te populacje mogą się znacznie różnić? Czy wynika to z rozprzestrzeniania …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.