Jak sprawdzić medianę populacji?

Mam próbkę 250 jednostek. Rozkład jest asymetryczny. Chcę przetestować hipotezę, że mediana populacji różni się od 3,5, więc myślę, że odpowiedni byłby test z jedną próbą. Wiem, że test rang Wilcoxona nie jest odpowiedni, ponieważ rozkład nie jest symetryczny. Czy można użyć testu znakowego? Jeśli tak nie jest, czy ktoś może polecić inny test?

hypothesis-testing median

— LeonRupnik
źródło

Straciłeś mnie na pierwszej linii z kilku powodów. (1) Próbka nie może mieć rozkładu Gaussa (ale może mieć go w przybliżeniu). (2) Jedną cechą wszystkich rozkładów Gaussa (a zatem ich przybliżeń) jest symetria . Zaprzeczyłeś sobie. Opisując swoje dane na własnych warunkach, a nie żargonie statystycznym, lepiej komunikujesz się z tym, co masz. Czy możesz również wyjaśnić, w możliwie najprostszy sposób, co naprawdę chcesz osiągnąć dzięki swoim danym? Jakie informacje ma na celu „próba oparta na medianie”?

— whuber

Mediana próbki jest czymkolwiek; nie byłoby potrzeby tego testować. Być może chcesz sprawdzić, czy mediana populacji (z której uzyskano próbkę) jest równa

3.5

$3.5$ ? Jeśli tak, ważne jest, aby wiedzieć, jak wartość

3.5

$3.5$ został opracowany. Czy to może streszczenie jakiegoś innego zestawu danych? A może jest to z góry określona liczba, na przykład standard jakości?

— whuber

Jest to z góry określona liczba

— LeonRupnik

„ Dystrybucja jest asymetryczna, dlatego chcę przetestować hipotezę, jeśli mediana populacji różni się od 3,5 ...” - Dlaczego asymetria w próbie miałaby wpływ na to, która hipoteza jest interesująca?

$\:$ „ Czy test znaku jest odpowiedni do użycia? ” - jasne, ale (przynajmniej w oryginalnej formie) polega on na ciągłości - musisz go dostosować, jeśli twoja zmienna jest dyskretna (nie mówisz, z czego składają się twoje dane) .

— Glen_b

Dane są ciągłe

— LeonRupnik

Streszczenie

Liczba danych przekraczająca $3.5$ ma rozkład dwumianowy z nieznanym prawdopodobieństwem $p$ . Użyj tego do przeprowadzenia dwumianowego testu $p=1/2$ przeciw alternatywie $p\ne 1/2$ .

Pozostała część tego postu wyjaśnia podstawowy model i pokazuje, jak wykonać obliczenia. Zapewnia działający Rkod do ich wykonania. W mojej odpowiedzi na „Jakie jest znaczenie wartości p i wartości t w testach statystycznych?” Znajduje się rozszerzony opis teorii testowania hipotez ? .

Model statystyczny

Zakładając, że wartości są dość zróżnicowane (z kilkoma powiązaniami na poziomie $3.5$ ), a następnie pod hipotezą zerową każda losowo próbkowana wartość ma wartość $1/2=50\%$ szansa na przekroczenie $3.5$ (od $3.5$ jest określany jako średnia wartość populacji). Zakładając wszystko $250$ wartości losowo i niezależnie pobierano próbki, a ich liczba przekraczała $3.5$ będzie zatem miał dwumianowy $(250,1/2)$ dystrybucja. Nazwijmy ten numer „liczyć” $k$ .

Z drugiej strony, jeśli mediana populacji różni się $3.5$ , szansa na przekroczenie losowej wartości próby $3.5$ będzie się różnić od $1/2$ . To jest hipoteza alternatywna.

Znalezienie odpowiedniego testu

Najlepszym sposobem na odróżnienie sytuacji zerowej od jej alternatyw jest przyjrzenie się wartościom $k$ które są najprawdopodobniej poniżej zera i mniej prawdopodobne w ramach alternatyw. Są to wartości bliskie $1/2$ z $250$ , równy $125$ . Zatem region krytyczny dla twojego testu składa się z wartości stosunkowo odległych $125$ : blisko $0$ lub blisko $250$ . Ale jak daleko $125$ muszą stanowić znaczący dowód na to $3.5$ nie jest mediana populacji?

W zależności od standardu znaczenia: nazywa się to rozmiarem testowym , często nazywanym $\alpha$ . Zgodnie z hipotezą zerową powinno być blisko - ale nie więcej niż - $\alpha$ szansa, że $k$ będzie w regionie krytycznym.

Zwykle, gdy nie mamy wstępnych założeń, która alternatywa będzie miała zastosowanie - mediana większa lub mniejsza niż $3.5$ - próbujemy zbudować region krytyczny, aby była połowa tej szansy, $\alpha/2$ , to $k$ jest niski, a druga połowa, $\alpha/2$ , to $k$ jest wysoko. Ponieważ znamy rozkład $k$ zgodnie z hipotezą zerową informacja ta wystarcza do określenia regionu krytycznego.

Technicznie istnieją dwa typowe sposoby przeprowadzania obliczeń: obliczanie prawdopodobieństw dwumianowych lub przybliżanie ich za pomocą rozkładu normalnego.

Obliczanie z prawdopodobieństwami dwumianowymi

Użyj funkcji punktu procentowego (kwantyla). Na Rprzykład jest to wywoływane qbinomi wywoływane jak

alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)

Dane wyjściowe dla $\alpha=0.05$ jest

109 141

Oznacza to, że region krytyczny obejmuje wszystkie niskie wartości $k$ pomiędzy (i włącznie) $0$ i $109$ , wraz ze wszystkimi wysokimi wartościami $k$ pomiędzy (i włącznie) $141$ i $250$ . Jako czek możemy poprosić Ro obliczenie szansy, która kleży w tym regionie, gdy wartość null jest prawdziwa:

pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))

Dane wyjściowe to $0.0497$ , bardzo blisko - ale nie więcej niż - $\alpha$ samo. Ponieważ obszar krytyczny musi kończyć się liczbą całkowitą, zwykle nie jest możliwe, aby ten rzeczywisty rozmiar testu był dokładnie równy nominalnemu rozmiarowi testu $\alpha$ , ale w tym przypadku dwie wartości są rzeczywiście bardzo zbliżone.

Obliczenia z normalnym przybliżeniem

Średnia z dwumianu $(250, 1/2)$ dystrybucja jest $250\times 1/2=125$ a jego wariantem jest $250\times 1/2\times (1-1/2) = 250/4$ , dzięki czemu jego odchylenie standardowe jest równe $\sqrt{250/4}\approx 7.9$ . Zastąpimy rozkład dwumianowy rozkładem normalnym. Standardowy rozkład normalny ma $\alpha/2=0.05/2$ jego prawdopodobieństwo jest mniejsze niż $-1.95996$ , zgodnie z obliczeniem Rpolecenia

qnorm(alpha/2)

Ponieważ rozkłady normalne są symetryczne, tak też jest $0.05/2$ jego prawdopodobieństwo jest większe niż $+1.95996$ . Dlatego region krytyczny składa się z wartości $k$ które są więcej niż $1.95996$ standardowe odchylenia od $125$ . Oblicz te progi: są równe $125 \pm 7.9\times 1.96 \approx 109.5, 140.5$ . Obliczenia można wykonać za jednym zamachem

250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)

Od $k$ musi być liczbą całkowitą, widzimy, że wpadnie w krytyczny region, kiedy to będzie $109$ lub mniej lub $141$ albo lepszy. Ta odpowiedź jest identyczna z odpowiedzią uzyskaną przy użyciu dokładnego obliczenia dwumianowego. Zazwyczaj ma to miejsce, gdy $p$ jest bliżej $1/2$ niż jest to $0$ lub $1$ , wielkość próbki jest umiarkowana do dużej (dziesiątki lub więcej), oraz $\alpha$ nie jest bardzo mały (kilka procent).

Ten test, ponieważ nie zakłada niczego o populacji (z wyjątkiem tego, że nie ma dużego prawdopodobieństwa skoncentrowanego bezpośrednio na swojej medianie), nie jest tak potężny jak inne testy, które przyjmują konkretne założenia dotyczące populacji. Jeśli jednak test odrzuci zero, nie trzeba się martwić brakiem mocy. W przeciwnym razie musisz dokonać delikatnych kompromisów między tym, co jesteś gotów założyć, a tym, co możesz wyciągnąć na temat populacji.

— Whuber
źródło

Ponieważ jest to praktycznie sprawdzony przykład twojej raczej bardziej abstrakcyjnej odpowiedzi na „ znaczenie wartości p ”, nie tylko w popieraniu tej samej filozofii, ale w strukturze odpowiedzi, myślę, że powinieneś ją powiązać („Przykład jak to jest stosowane w praktyce, można znaleźć w mojej odpowiedzi na ... ”) w podsumowaniu odpowiedzi.

— Silverfish,

@Silver Dziękuję; to rzeczywiście przyszło mi do głowy. Pomyślałem, że najpierw mogę trochę poczekać. Nie zdziwiłbym się między innymi, gdyby jakiś przedsiębiorczy członek społeczności wykopał duplikat wątku, który chciałbym dokładniej zbadać. W końcu jest to podstawowy materiał - wiele pytań dotyczyło testów dwumianowych. Jedynym twierdzeniem, które musi być nowe, jest to, że przybyło tutaj jako potrzeba testu mediany - więc na początku nie było to tak oczywiste badanie dwumianowe - i jedynym twierdzeniem, że moja odpowiedź jest godna czytanie polega na wyjaśnianiu każdego kroku.

— whuber