Wystąpił problem z oryginalną symulacją w tym poście, który, mam nadzieję, został teraz naprawiony.
O ile szacunkowe odchylenie standardowe próbki rośnie wraz z licznikiem, gdy średnia odbiega od , okazuje się, że nie ma tak dużego wpływu na moc przy „typowych” poziomach istotności, ponieważ w średnich i dużych próbkach s ∗ / √μ0 wciąż jest wystarczająco duży, aby go odrzucić. W mniejszych próbkach może to jednak mieć pewien efekt, a przy bardzo małych poziomach istotności może to stać się bardzo ważne, ponieważ spowoduje górną granicę mocy, która będzie mniejsza niż 1.s∗/ n--√
Druga kwestia, być może ważniejsza na „wspólnych” poziomach istotności, wydaje się polegać na tym, że licznik i mianownik statystyki testowej nie są już niezależne od wartości zerowej (kwadrat jest skorelowany z oszacowaniem wariancji).x¯- μ
Oznacza to, że test nie ma już rozkładu t pod wartością zerową. To nie jest fatalna wada, ale oznacza to, że nie możesz po prostu używać tabel i uzyskać pożądanego poziomu istotności (jak zobaczymy za chwilę). Oznacza to, że test staje się konserwatywny, co wpływa na moc.
Gdy n staje się duże, zależność ta staje się mniejszym problemem (nie tylko dlatego, że można wywołać CLT dla licznika i użyć twierdzenia Slutsky'ego, aby powiedzieć, że istnieje asymptotyczny rozkład normalny dla zmodyfikowanej statystyki).
Oto krzywa mocy dla zwykłej dwóch próbek t (krzywa fioletowa, test dwustronny) i dla testu wykorzystującego wartość zerową w obliczeniach s (niebieskie kropki, uzyskane przez symulację i przy użyciu tabel t), jak średnia populacji odchodzi od wartości hipotetycznej, dla n = 10 :μ0sn = 10
n = 10
Widać, że krzywa mocy jest niższa (staje się znacznie gorsza przy mniejszych rozmiarach próby), ale znaczna część wydaje się wynikać z tego, że zależność między licznikiem a mianownikiem obniżyła poziom istotności. Jeśli odpowiednio dostosujesz wartości krytyczne, niewiele będzie między nimi nawet przy n = 10.
I znów krzywa mocy, ale teraz dla n = 30
n = 30
Sugeruje to, że przy niemałych próbkach nie ma między nimi zbyt wiele, o ile nie trzeba używać bardzo małych poziomów istotności.