Test sumy rang Wilcoxona w R.


14

Mam wyniki tego samego testu zastosowane do dwóch niezależnych próbek:

x <- c(17, 12, 13, 16, 9, 19, 21, 12, 18, 17)
y <- c(10, 6, 15, 9, 8, 11, 8, 16, 13, 7, 5, 14)

I chcę obliczyć test sumy rang Wilcoxona.

Kiedy ręcznie obliczam statystykę , otrzymuję: T W = ranga ( X i ) = 156,5TW

TW=rank(Xi)=156.5

Kiedy pozwalam R wykonać a wilcox.test(x, y, correct = F), otrzymuję:

W = 101.5

Dlaczego? Czy statystyki nie powinny być zwracane tylko wtedy, gdy wykonuję podpisany test rangowy ? Czy też źle rozumiem test sumy rang?W+paired = T

Jak mogę powiedzieć R, aby wyprowadził TW


W ramach wyników testu nie poprzez coś takiego:

dat <- data.frame(v = c(x, y), s = factor(rep(c("x", "y"), c(10, 12))))
dat$r <- rank(dat$v)
T.W <- sum(dat$r[dat$s == "x"])

Zadałem pytanie uzupełniające na temat znaczenia różnych sposobów obliczania statystyki testu dla testu sumy rang Wilcoxona

Odpowiedzi:


16

NoteW pomocy na wilcox.testfunkcję jasno wyjaśnia, dlaczego wartość R jest mniejszy niż Twoja:

Uwaga

Literatura nie jest zgodna co do definicji sumy rang Wilcoxona i testów Manna-Whitneya. Dwie najczęstsze definicje odpowiadają sumie rang pierwszej próbki z minimalną wartością odjętą lub nie: R odejmuje, a S-PLUS nie, dając wartość większą o m (m + 1) / 2 dla a pierwsza próbka o rozmiarze m. (Wygląda na to, że oryginalny artykuł Wilcoxona wykorzystał niedostosowaną sumę stopni, ale kolejne tabele odjęły minimum).

n1(n1+1)/2n1

Jeśli chodzi o modyfikowanie wyniku, możesz przypisać dane wyjściowe wilcox.testdo zmiennej, powiedzmy a, a następnie manipulować a$statistic- dodając minimum do jego wartości i zmieniając jego nazwę. Następnie podczas drukowania a(np. Przez pisanie a) będzie wyglądać tak, jak chcesz.

Aby zobaczyć, o co mi chodzi, spróbuj tego:

a <- wilcox.test(x,y,correct=FALSE)
str(a) 

Na przykład, jeśli to zrobisz:

n1 <- length(x)
a$statistic <- a$statistic + n1*(n1+1)/2
names(a$statistic) <- "T.W"
a

wtedy otrzymujesz:

        Wilcoxon rank sum test with continuity correction

data:  x and y 
T.W = 156.5, p-value = 0.006768
alternative hypothesis: true location shift is not equal to 0 

n1(n1+1)/2WwUW

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.