Jakie są „pożądane” właściwości statystyczne testu współczynnika wiarygodności?


11

Czytam artykuł, którego metoda jest w pełni oparta na teście współczynnika wiarygodności. Autor mówi, że test LR na jednostronne alternatywy to UMP. Kontynuuje, twierdząc, że

„... nawet jeśli nie można wykazać, że [test LR] jest jednorodnie najsilniejszy, test LR często ma pożądane właściwości statystyczne”.

Zastanawiam się, jakie są tutaj właściwości statystyczne. Biorąc pod uwagę, że autor odnosi się do tych przemijających, zakładam, że są one powszechnie znane wśród statystyk.

Jedyną pożądaną właściwością, jaką udało mi się do tej pory znaleźć, jest asymptotyczny rozkład chi-kwadrat (w pewnych warunkach regularności), gdzie to stosunek LR.λ2logλλ

Byłbym również wdzięczny za odniesienie do klasycznego tekstu, w którym można przeczytać o tych pożądanych właściwościach.


Możesz rzucić okiem (rozdział 15 i 16) van Der Waart: „Statystyki asymptotyczne”.
kjetil b halvorsen

Odpowiedzi:


5

Warto przeczytać Co dalej, jeśli nie odrzucimy hipotezy zerowej? przed wyjaśnieniem poniżej.

Pożądane właściwości: moc

W testowaniu hipotez celem jest znalezienie „dowodów statystycznych” dla . W ten sposób możemy popełnić błędy typu I, tj. Odrzucamy H 0 (i stwierdzamy, że istnieją dowody na korzyść H 1 ), podczas gdy H 0 było prawdziwe (tj. H 1 jest fałszywe). Zatem błędem typu I jest „znajdowanie fałszywych dowodów” na H 1 .H1H0H1H0H1H1

Błąd typu II powstaje, gdy nie może zostać odrzucony, podczas gdy w rzeczywistości jest fałszem, tzn. „Akceptujemy H 0 ” i „pomijamy” dowody na H 1 .H0H0H1

Prawdopodobieństwo błędu typu I jest oznaczone przez , wybrany poziom istotności. Prawdopodobieństwo błędu typu II jest oznaczone jako β, a 1 - β nazywa się siłą testu, jest to prawdopodobieństwo znalezienia dowodów na korzyść H 1, gdy H 1 jest prawdziwe.αβ1βH1H1

W testowaniu hipotez statystycznych naukowiec ustala górny próg prawdopodobieństwa błędu typu I i pod tym ograniczeniem próbuje znaleźć test o maksymalnej mocy, biorąc pod uwagę .α

Pożądane właściwości testów współczynnika wiarygodności mają związek z mocą

W teście hipotezy porównaniu z H 1 : θ = θ 1 hipoteza zerowa i hipoteza alternatywna nazywane są „prostymi”, tzn. Parametr jest ustalony na jedną wartość, równie dobrze pod H 0 jak pod H 1 (a dokładniej; rozkłady są w pełni określone). H0:θ=θ0H1:θ=θ1H0H1

Neyman-Pearson Lemat stwierdza, że do testów hipotezy o prostych hipotez, a dla danego prawdopodobieństwa błędu typu I, test ilorazu wiarygodności ma największą moc. Oczywiście, wysoka moc, biorąc pod uwagę jest pożądaną właściwością: moc jest miarą „jak łatwo jest znaleźć dowody na obecność H 1 ”.αH1

Gdy hipoteza jest złożona; jak np. kontra H 1 : θ > θ 1, wówczas nie można zastosować lematu Neymana-Pearsona, ponieważ w H 1 występuje wiele wartości . Jeśli można znaleźć taki test, który jest najsilniejszy dla każdej wartości „poniżej H 1 ”, wówczas mówi się, że test ten jest „jednorodnie najpotężniejszy” (UMP) (tj. Najsilniejszy dla każdej wartości poniżej H 1 ).H0:θ=θ1H1:θ>θ1H1H1H1

Istnieje twierdzenie Karlina i Rubina, które stwarza warunki niezbędne do tego, aby test współczynnika prawdopodobieństwa był jednakowo najsilniejszy. Warunki te są spełnione dla wielu testów jednostronnych (jednoczynnikowych).

Zatem pożądana właściwość testu współczynnika wiarygodności polega na tym, że w kilku przypadkach ma on najwyższą moc (chociaż nie we wszystkich przypadkach).

W większości przypadków nie można pokazać istnienia testu UMP, aw wielu przypadkach (zwłaszcza na wielu odmianach) można wykazać, że test UMP nie istnieje. Niemniej jednak w niektórych z tych przypadków stosuje się testy współczynnika prawdopodobieństwa ze względu na ich pożądane właściwości (w powyższym kontekście), ponieważ są one stosunkowo łatwe do zastosowania, a czasami dlatego, że nie można zdefiniować innych testów.

Na przykład jednostronnym testem opartym na standardowym rozkładzie normalnym jest UMP.

Intuicja stojąca za testem współczynnika wiarygodności:

H0:θ=θ0H1:θ=θ1o

H0H1oH0L0oH1L1

L1>L0H1L1L0>1H1H0

L1L01,001L.1L.0

Znalazłem ten plik pdf w Internecie.


1
Myślę, że to pomija pytanie OP: cytat stwierdza, że ​​nawet jeśli nie można wykazać, że LRT jest UMP, nadal ma inne atrakcyjne cechy. Więc jakie są atrakcyjne funkcje, które nie są UMP?
Cliff AB

@Cliff AB: Myślę, że jest na końcu pierwszej sekcji, a druga sekcja intuicyjnie mówi, dlaczego warto używać LRT. Zauważ, że w większości przypadków nie ma UMP, a jeśli nie ma „najlepszego testu” lub żadnej alternatywy, to nie jest nierozsądne brać coś, co „ma sens”. Ale jeśli masz dodatkowe elementy, możesz je opublikować we własnej odpowiedzi. Myślę, że taki jest pomysł SE.

Być może to tylko ja czytam oryginalny cytat nieco inaczej: czytam go jako „LRT ma inne atrakcyjne cechy, oprócz samej mocy”.
Cliff AB

1
H.11

nie podszacuj łatwości wdrożenia!
Cliff AB
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.