Mann-Whitney nie jest wrażliwy na zmiany wariancji przy jednakowej średniej, ale może - jak widać przy postaci , wykryć różnice, które prowadzą do odchylenia od (np. gdzie zarówno średnia, jak i wariancja rosną razem). Dość wyraźnie, jeśli masz dwie normalne z jednakową średnią, ich różnice są symetryczne względem zera. Dlatego , co jest sytuacją zerową.P(X>Y)=0.5P(X>Y)0.5P(X>Y)=P(X−Y>0)=12
Na przykład, jeśli rozkład jest wykładniczy ze średnią podczas gdy ma rozkład wykładniczy ze średnią (zmiana skali), Mann-Whitney jest na to wrażliwy (w rzeczywistości, biorąc logi obu stron, jest to po prostu zmiana lokalizacji, a transformacja monotoniczna nie wpływa na Manna-Whitneya).Y1Xk
-
Jeśli interesują Cię testy, które są koncepcyjnie bardzo podobne do testu Manna-Whitneya, które są wrażliwe na różnice w rozłożeniu przy równych medianach, istnieje kilka takich testów.
Istnieje na przykład test Siegel-Tukey i test Ansari-Bradley, oba ściśle powiązane z testem dwóch próbek Manna-Whitneya-Wilcoxona.
Oba są oparte na podstawowej idei rangowania od końca.
Jeśli używasz R, test Ansari-Bradley jest wbudowany ... ?ansari.test
W rzeczywistości Siegel-Tukey po prostu wykonuje test Manna-Whitneya-Wilcoxona na szeregach obliczonych z próbki inaczej; jeśli sami uszeregujesz dane, tak naprawdę nie potrzebujesz osobnej funkcji dla wartości p. Niemniej jednak możesz znaleźć kilka, jak tutaj:
http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/
-
(w odniesieniu do komentarza ttnphns pod moją pierwotną odpowiedzią)
Nadmiernie interpretujesz moją odpowiedź, czytając ją jako niezgadzającą się z @GregSnow w szczególnie merytorycznym sensie. Z pewnością jest różnica w nacisku i do pewnego stopnia w tym, o czym mówimy, ale byłbym bardzo zaskoczony, gdyby kryło się za tym wiele prawdziwych sporów.
Przytoczmy Manna i Whitneya: „ Do przetestowania hipotezy zaproponowano statystykę zależną od względnych stopni i . ” Jest to jednoznaczne; całkowicie wspiera pozycję @ GregSnow.Uxyf=g
Zobaczmy teraz, jak zbudowana jest statystyka: „ Niech policzy, ile razy poprzedza .Uyx ” Teraz, jeśli ich null jest prawdziwe, prawdopodobieństwo tego zdarzenia wynosi ... ale istnieją inne sposoby uzyskania prawdopodobieństwa 0,5 iw tym sensie można interpretować, że test może działać w innych okolicznościach. O ile szacują (przeskalowane) prawdopodobieństwo, że > , obsługuje to, co powiedziałem.12YX
Jednak aby zagwarantować, że poziomy istotności są dokładnie poprawne, potrzebny będzie rozkład aby pasował do rozkładu zerowego. Wynika to z założenia, że wszystkie permutacje etykiet grupowych i do połączonych obserwacji pod zerą były równie prawdopodobne. Z pewnością tak jest w przypadku . Dokładnie tak jak powiedział @GregSnow.UXYf=g
Pytanie brzmi, w jakim stopniu tak jest (tj. Że rozkład statystyki testowej odpowiada rozkładowi uzyskanemu przy założeniu, że lub w przybliżeniu), dla bardziej ogólnie wyrażonej wartości null.f=g
Wierzę, że w wielu sytuacjach tak się dzieje; w szczególności w sytuacjach obejmujących, ale bardziej ogólną niż ta, którą opisujesz (dwie normalne populacje o tej samej średniej, ale niezwykle nierównej wariancji można dość ogólnie uogólnić bez zmiany wynikowego rozkładu opartego na rangach), uważam, że rozkład statystyki testowej okazuje się, że ma taki sam rozkład, na podstawie którego został wyprowadzony, i dlatego powinien tam obowiązywać. Zrobiłem kilka symulacji, które wydają się to potwierdzać. Jednak nie zawsze będzie to bardzo przydatny test (może mieć słabą moc).
Nie oferuję żadnego dowodu, że tak jest. Zastosowałem argument intuicyjny / falisty ręcznie, a także wykonałem kilka podstawowych symulacji, które sugerują, że to prawda - że Mann-Whitney działa (pod tym względem, że ma „prawidłowy” rozkład pod zerą) znacznie szerzej niż wtedy, gdy .f=g
Rób to, co chcesz, ale nie uważam tego za merytoryczną niezgodę z @GregSnow
Odniesienie - oryginalny artykuł Manna i Whitneya