Ponieważ można obliczyć przedziały ufności dla wartości p, a ponieważ przeciwieństwem oszacowania przedziału jest oszacowanie punktowe: czy wartość p jest oszacowaniem punktowym?
Ponieważ można obliczyć przedziały ufności dla wartości p, a ponieważ przeciwieństwem oszacowania przedziału jest oszacowanie punktowe: czy wartość p jest oszacowaniem punktowym?
Odpowiedzi:
Szacunki punktowe i przedziały ufności dotyczą parametrów opisujących rozkład, np. Średniej lub odchylenia standardowego.
Jednak w przeciwieństwie do innych statystyk próby, takich jak średnia próbki i odchylenie standardowe próbki, wartość p nie jest użytecznym estymatorem interesującego parametru rozkładu. Spójrz na odpowiedź @whuber po szczegóły techniczne.
Wartość p dla statystyki testowej daje prawdopodobieństwo zaobserwowania odchylenia od oczekiwanej wartości statystyki testowej co najmniej tak dużej, jak obserwowana w próbce, obliczonej przy założeniu, że hipoteza zerowa jest prawdziwa. Jeśli masz cały rozkład, jest on albo zgodny z hipotezą zerową, albo nie jest. Można to opisać za pomocą zmiennej wskaźnikowej (ponownie, patrz odpowiedź @whuber).
Ale wartość p nie może być użyta jako użyteczny estymator zmiennej wskaźnikowej, ponieważ nie jest spójna, ponieważ wartość p nie zbiega się wraz ze wzrostem wielkości próby, jeśli hipoteza zerowa jest prawdziwa. Jest to dość skomplikowany alternatywny sposób stwierdzenia, że test statystyczny może odrzucić lub nie odrzucić wartości zerowej, ale nigdy jej nie potwierdza.
Tak, można (i tak było) argumentować, że wartość p jest oszacowaniem punktowym.
Aby zidentyfikować dowolną właściwość rozkładu, którą mogłaby oszacować wartość p, musielibyśmy założyć, że jest ona asymptotycznie bezstronna. Ale asymptotycznie średnia wartość p dla hipotezy zerowej wynosi (idealnie; w przypadku niektórych testów może to być inna liczba niezerowa), a dla każdej innej hipotezy wynosi . Zatem wartość p można uznać za estymator połowy funkcji wskaźnika dla hipotezy zerowej.
Trzeba wprawdzie trochę kreatywności, aby spojrzeć na wartość p w ten sposób. Moglibyśmy zrobić trochę więcej, patrząc na dany estymator jako na decyzję, którą podejmujemy za pomocą wartości p: czy rozkład leżący u podstaw jest elementem hipotezy zerowej lub hipotezy alternatywnej? Nazwijmy ten zestaw możliwych decyzji . Jack Kiefer pisze
Przypuszczamy, że istnieje eksperyment, którego wynik statystyczny może zaobserwować. Wynik ten opisuje zmienna losowa lub losowy wektor ... Statystyka prawdopodobieństwa jest nieznana statystyce, ale wiadomo, że funkcja rozkładu z jest członkiem określonej klasy funkcji rozkładu. ...
Mówi się, że problemem statystycznym jest problem oszacowania punktowego, jeśli jest zbiorem możliwych wartości niektórych właściwości o wartości rzeczywistej lub wektorowej, która zależy od F w dość płynny sposób.
W tym przypadku, ponieważ jest dyskretna, „dość gładka” wcale nie jest ograniczeniem. Terminologia Kiefera odzwierciedla to, odnosząc się do procedur statystycznych z dyskretnymi przestrzeniami decyzyjnymi jako „testy” zamiast „estymatorów punktowych”.
Chociaż interesujące jest zbadanie granic (i ograniczeń) takich definicji, jak to pytanie nas zachęca, być może nie powinniśmy zbyt mocno nalegać, aby wartość p była estymatorem punktowym, ponieważ to rozróżnienie między estymatorami a testami jest zarówno przydatne i konwencjonalne.
W komentarzu do tego pytania Christian Robert zwrócił uwagę na artykuł z 1992 r., W którym on i współautorzy wzięli dokładnie ten punkt widzenia i przeanalizowali dopuszczalność wartości p jako estymatora funkcji wskaźnika . Zobacz link w odnośnikach poniżej. Artykuł zaczyna się
Podejścia do testowania hipotez zwykle traktowały problem testowania raczej jako podejmowanie decyzji niż szacowanie. Mówiąc dokładniej, formalny test hipotezy doprowadzi do wniosku, czy hipoteza jest prawdziwa, i nie dostarczy dowodów pozwalających na powiązanie z tym wnioskiem. W tym artykule rozważamy testowanie hipotez jako problem oszacowania w ramach teorii teoretycznej ...
[Podkreślenie dodane.]
Jiunn Tzon Hwang, George Casella, Christian Robert, Martin T. Wells i Roger H. Farrell, Estimation of Accuracy in Testing . Ann. Statystyk. Tom 20, numer 1 (1992), 490-509. Otwarty dostęp .
Jack Carl Kiefer, Wprowadzenie do wnioskowania statystycznego . Springer-Verlag, 1987.