Równoważność nigdy nie jest czymś, co możemy przetestować . Pomyśl o hipotezie: vs . Teoria NHST mówi nam, że pod zerą możemy wybrać wszystko pod które najlepiej pasuje do danych. Oznacza to, że prawie zawsze możemy dowolnie zbliżyć się do dystrybucji. Na przykład, jeśli chcę przetestować , model prawdopodobieństwa, który pozwala na osobne rozkłady i , zawsze będzie bardziej prawdopodobny pod zero, naruszenie krytycznych założeń testowania. Nawet jeśli próbkaH0:fx≠fyH1:fx=fyH0fx∼N(0,1)f^xf^yX=Yidentycznie, mogę uzyskać iloraz prawdopodobieństwa, który jest arbitralnie zbliżony do 1 dla . .fy≈fx
Jeśli znasz odpowiedni model prawdopodobieństwa dla danych, możesz zastosować kryterium informacji o karach, aby uszeregować modele alternatywne. Jednym ze sposobów jest użycie kodów BIC dwóch modeli prawdopodobieństwa (szacowanego pod i . Użyłem normalnego modelu prawdopodobieństwa, ale możesz łatwo uzyskać BIC z dowolnego typu procedury maksymalnego prawdopodobieństwa, ręcznie lub przy użyciu GLM. Ten post Stackoverflow dostaje nitty-gritty do dopasowania rozkładów. Przykład wykonania tego jest tutaj:H0H1
set.seed(123)
p <- replicate(1000, { ## generate data under the null
x <- rnorm(100)
g <- sample(0:1, 100, replace=T)
BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)
daje
> mean(p)
[1] 0.034
p jest proporcją razy, że BIC modelu zerowego (oddzielne modele) jest lepszy (niższy) niż model alternatywny (model równoważny). Jest to niezwykle zbliżone do nominalnego poziomu testów statystycznych 0,05.
Z drugiej strony, jeśli weźmiemy:
set.seed(123)
p <- replicate(1000, { ## generate data under the null
x <- rnorm(100)
g <- sample(0:1, 100, replace=T)
x <- x + 0.4*g
BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)
Daje:
> mean(p)
[1] 0.437
Podobnie jak w przypadku NHST istnieją subtelne problemy dotyczące mocy i fałszywie dodatnich poziomów błędów, które należy zbadać za pomocą symulacji przed wyciągnięciem ostatecznych wniosków.
Myślę, że podobna (być może bardziej ogólna metoda) wykorzystuje statystyki bayesowskie do porównywania a posteriori oszacowanej według dowolnego z modeli prawdopodobieństwa.