Nie sądzę, że większość z tych odpowiedzi w ogóle odpowiada na pytanie. Są one ograniczone do przypadku, gdy istnieje prosta hipoteza zerowa i gdy statystyka testowa ma odwracalny CDF (jak w ciągłej zmiennej losowej, która ma ściśle rosnący CDF). Te przypadki są przypadkami, którymi większość ludzi się przejmuje testem Z i testem t, chociaż do testowania średniej dwumianowej (na przykład) nie ma takiego CDF. To, co podano powyżej, wydaje mi się słuszne w tych ograniczonych przypadkach.
Jeśli hipotezy zerowe są złożone, rzeczy są nieco bardziej skomplikowane. Najbardziej ogólny dowód tego faktu, jaki widziałem w złożonej sprawie przy użyciu pewnych założeń dotyczących regionów odrzucenia, znajduje się w „Testing Statisitical Hypotheses” Lehmanna i Romano, str. 63-64. Spróbuję odtworzyć poniższy argument ...
Testujemy hipotezy zerowej kontra alternatywnej hipotezy oparciu o statystykę testową, którą będziemy oznaczać jako zmiennej losowej . Zakłada się, że statystyki testowe pochodzą z pewnej klasy parametrycznej, tj. , gdzie jest elementem rodziny rozkładów prawdopodobieństwa , a to przestrzeń parametrów. Hipoteza i hipoteza alternatywna tworzą partycję w tym
H0H1XX∼PθPθP≡{Pθ∣θ∈Θ}ΘH0:θ∈Θ0H1:θ∈Θ1ΘΘ=Θ0∪Θ1
gdzie
Θ0∩Θ1=∅.
Wynik testu może być oznaczony
gdzie dla dowolnego zestawu definiujemy
Tutaj jest naszym poziomem istotności, a oznacza region odrzucenia testu dla poziomu istotności .ϕα(X)=1Rα(X)
S1S(X)={1,0,X∈S,X∉S.
αRαα
Załóżmy, że regiony odrzucające spełniają
jeśli . W tym przypadku zagnieżdżonych regionów odrzucania przydatne jest określenie nie tylko tego, czy hipoteza zerowa jest odrzucana na danym poziomie istotności , ale także określenie najmniejszego poziomu istotności, dla którego hipoteza zerowa zostałaby odrzucona. Ten poziom jest znany jako wartość p ,
ta liczba daje nam wyobrażenie o jak silne dane (przedstawione przez statystykę testową ) są sprzeczne z hipotezą zerową . Rα⊂Rα′
α<α′αp^=p^(X)≡inf{α∣X∈Rα},
XH0
Załóżmy, że dla niektórych i że . Załóżmy dodatkowo, że regiony odrzucające zgodne z powyższą właściwością zagnieżdżania. Następnie następujące pozycje:X∼Pθθ∈ΘH0:θ∈Θ0Rα
Jeśli dla wszystkich , to dla ,
supθ∈Θ0Pθ(X∈Rα)≤α0<α<1θ∈Θ0Pθ(p^≤u)≤ufor all0≤u≤1.
Jeśli dla mamy dla wszystkich , to dla mamy
θ∈Θ0Pθ(X∈Rα)=α0<α<1θ∈Θ0Pθ(p^≤u)=ufor all0≤u≤1.
Zauważ, że ta pierwsza właściwość mówi nam tylko, że współczynnik fałszywie dodatnich jest kontrolowany , odrzucając, gdy wartość p jest mniejsza niż , a druga właściwość mówi nam (przy dodatkowym założeniu), że wartości p są równomiernie rozmieszczone pod wartością zerową hipoteza.uu
Dowód jest następujący:
Niech i załóżmy dla wszystkich . Następnie z definicji mamy dla wszystkich . Z monotoniczności i założenia wynika, że dla wszystkich . Pozwalając , wynika z tego, że .θ∈Θ0supθ∈Θ0Pθ(X∈Rα)≤α0<α<1p^{p^≤u}⊂{X∈Rv}u<vPθ(p^≤u)≤Pθ(X∈Rv)≤vu<vv↘uPθ(p^≤u)≤u
Niech i załóżmy, że dla wszystkich . Następnie , a przez monotoniczność wynika, że . Biorąc pod uwagę (1), wynika z tego, że . θ∈Θ0Pθ(X∈Rα)=α0<α<1{X∈Ru}⊂{p^(X)≤u}u=Pθ(X∈Ru)≤Pθ(p^≤u)Pθ(p^(X)≤u)=u
Zauważ, że założenie w (2) nie obowiązuje, gdy statystyka testowa jest dyskretna, nawet jeśli hipoteza zerowa jest prosta, a nie złożona. Weźmy na przykład z i . Tzn. Rzuć monetą dziesięć razy i sprawdź, czy jest sprawiedliwa w stosunku do stronniczości (zakodowana jako 1). Prawdopodobieństwo zobaczenia 10 głów w 10 uczciwych rzutach monetą wynosi (1/2) ^ 10 = 1/1024. Prawdopodobieństwo zobaczenia 9 lub 10 głów w 10 uczciwych rzutach monetą wynosi 11/1024. Dla każdego ściśle między 1/1024 a 11/1024 odrzuciłbyś null, jeśli , ale nie mamy tego dla tych wartości kiedyX∼Binom(10,θ)H0:θ=.5H1:θ>0.5αX=10Pr(X∈Rα)=ααθ=0.5 . Zamiast tego dla takiego . Pr(X∈Rα)=1/1024α