Jak sprawdzić, czy


9

Załóżmy, że mam średnio trzy niezależne grupy μ1, μ2, μ3 odpowiednio.

Jak mogę sprawdzić, czy μ1<μ2<μ3 lub nie korzystam n1, n2, n3 próbki z każdej grupy?

Chciałbym poznać ogólną metodologię, a nie szczegółowe obliczenia. Nie mogłem wymyślić, jak ustalić moją hipotezęH0 i H1.


1
Jest to przypadek wnioskowania statystycznego o ograniczonym porządku . Istnieją książki na ten temat .
kjetil b halvorsen

1
Jest też stara książka Barlowa, Bartholemew, Bremnera i Brunk Statistics wnioskowania pod ograniczeniami zamówień (1973) (choć od tego czasu nastąpiły pewne zmiany); jeśli chodzi o testy nieparametryczne, istnieje test Jonckheere-Terpstra (np. zobacz Conover) i jeden z testów Match (spróbuj książki Neave'a i Worthingtona). Zazwyczaj piszesz równość null i uporządkowaną alternatywę.
Glen_b


Tutaj należy powiedzieć, że nie to ni próbki z grupy i, ale ten ma próbkę wielkości ni z grupy i.
Michael Hardy,

Odpowiedzi:


8

W statystykach nie można sprawdzić, czy „X jest prawdą, czy nie”. Możesz jedynie próbować znaleźć dowody, że hipoteza zerowa jest fałszywa.

Powiedzmy, że twoja hipoteza zerowa jest

H01:μ1<μ2<μ3.
Załóżmy również, że masz sposób oszacowania wektora μ=(μ1,μ2,μ3). Aby zachować rzeczy, po prostu załóż, że masz estymator
xN(μ,Σ),
gdzie Σ jest 3×3macierz współzmienna. Możemy przepisać hipotezę zerową jako
Aμ<0,
gdzie
A=[110011].
To pokazuje, że twoja hipoteza zerowa może być wyrażona jako ograniczenie nierówności w wektorze Aμ. Naturalny estymatorAμ jest dany przez
AxN(Aμ,AΣA).
Możesz teraz używać frameworka do testowania ograniczenia nierówności na normalnych wektorach podanych w:

Kudo, Akio (1963). „Wielowymiarowy analog testu jednostronnego”. W: Biometrika 50.3 / 4, s. 403–418.

Ten test zadziała również, jeśli założenie normalności zachowuje się tylko w przybliżeniu („asymptotycznie”). Na przykład zadziała, jeśli możesz narysować przykładowe środki z grup. Jeśli narysujesz próbki wielkościn1,n2,n3 a jeśli możesz rysować niezależnie od grup, to Σ jest macierzą diagonalną z diagonalną

(σ12/n1,σ22/n2,σ32/n3),
gdzie σk2 to wariancja w grupie k=1,2,3. W aplikacji można użyć wariancji próbki zamiast nieznanej wariancji populacji bez zmiany właściwości testu.

Jeśli natomiast twoja alternatywna hipoteza jest

H12:μ1<μ2<μ3
wtedy twoja hipoteza zerowa staje się
H02:NOT H1.
To nie jest zbyt operacyjne. Pamiętaj, że naszą nową alternatywną hipotezę można zapisać jakoH1:Aμ<0 po to aby
H02:there exists a k=1,2 such that (Aμ)k0.
Nie wiem, czy istnieje na to jakiś specjalistyczny test, ale zdecydowanie możesz wypróbować strategię opartą na kolejnych testach. Pamiętaj, że próbujesz znaleźć dowody przeciwko zeru. Więc możesz najpierw przetestować
H0,12:(Aμ)10.
i wtedy
H0,22:(Aμ)20.
Jeśli odrzucisz oba razy, znajdziesz dowody na to H0 jest fałszywe, a ty odrzucasz H0. Jeśli nie, to nie odrzucaszH0. Ponieważ testujesz wiele razy, musisz dostosować nominalny poziom podtestu. Możesz użyć korekcji Bonferroniego lub ustalić dokładną korektę (skoro wieszΣ).

Kolejny sposób konstruowania testu dla H02 to zauważyć

H02:maxk=1,2(Aμ)k0.
Oznacza to użycie maxAxjako statystyka testowa. Test będzie miał niestandardowy rozkład poniżej zera, ale odpowiednia wartość krytyczna powinna być nadal dość łatwa do obliczenia.


W porządku, zredagowałem swoją odpowiedź.
Andreas Dzemski,

Dobra odpowiedź (+1). Aby jeszcze bardziej go ulepszyć, polecam jego wymianęx z μ^ tak aby notacja odzwierciedlała zamiar, dla którego ten obiekt jest estymatorem μ.
Ben - Przywróć Monikę

1

Odpowiedź udzielona przez @ andreas-dzemski jest poprawna tylko wtedy, gdy wiemy, że dane są zwykle dystrybuowane.

Jeśli nie znamy rozkładu, uważam, że lepiej byłoby przeprowadzić test nieparametryczny. W tym przypadku najprostszym wydaje się być test permutacji. To jest książka na ten temat i to jest ładne wyjaśnienie Internecie. Poniżej podaję kod R, aby obliczyć ten test.

# some test data
D <- data.frame(group1=c(3,6,2,2,3,9,3,4,2,5), group2=c(5,3,10,1,10,2,4,4,2,2), group3=c(8,0,1,5,10,7,3,4,8,1))

# sample with replacement
resample <- function(X) sample(X, replace=TRUE)

# return true if mu1 < mu2 < mu3
test     <- function(mu1, mu2, mu3) (mu1 < mu2) & (mu2 < mu3)

# resampling test that returns the probability of observing the relationship
mean(replicate(1000, test(mean(resample(D$group1)), mean(resample(D$group2)), mean(resample(D$group3)))))
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.