Trójca testów o najwyższym prawdopodobieństwie: co zrobić w obliczu sprzecznych wniosków?

10

Testy Wald, iloraz wiarygodności i mnożnik Lagrange'a w kontekście szacowania maksymalnego prawdopodobieństwa są asymptotycznie równoważne. Jednak w przypadku małych próbek mają one tendencję do rozbieżności, a w niektórych przypadkach prowadzą do różnych wniosków.

Jak można je uszeregować według prawdopodobieństwa odrzucenia wartości zerowej? Co zrobić, gdy testy mają sprzeczne odpowiedzi? Czy możesz po prostu wybrać tę, która daje pożądaną odpowiedź, czy też istnieje „reguła” lub „wytyczna” co do sposobu postępowania?

hypothesis-testing maximum-likelihood

— Vivi
źródło

czy jest to może tylko przypadek, w którym asymptotyczne aproksymacje do [zerowych] rozkładów jednej lub więcej z trzech statystyk testowych nie są tak dobre? być może wyniki różnią się, ponieważ rzeczywiste rozmiary testów są różne? jak duże są twoje rozmiary próbek?

— ronaf,

5

Nie znam literatury w tej dziedzinie na tyle dobrze, aby dać bezpośrednią odpowiedź. Wydaje mi się jednak, że jeśli trzy testy różnią się, oznacza to, że potrzebujesz dalszych badań / gromadzenia danych, aby ostatecznie odpowiedzieć na twoje pytanie.

Możesz także spojrzeć na to wyszukiwanie w Google Scholar

Zaktualizuj w odpowiedzi na Twój komentarz:

Jeśli gromadzenie dodatkowych danych nie jest możliwe, istnieje jedno obejście. Wykonaj symulację, która odzwierciedla strukturę danych, wielkość próbki i proponowany model. Możesz ustawić parametry na niektóre z góry określone wartości. Oszacuj model na podstawie wygenerowanych danych, a następnie sprawdź, który z trzech testów wskazuje właściwy model. Taka symulacja zapewniłaby pewne wskazówki dotyczące tego, który test zastosować do rzeczywistych danych. Czy to ma sens?

1

Czy masz na myśli konkretny artykuł? Wyobrażam sobie, że mógłbym znaleźć odpowiedź na moje pytanie, gdybym studiował, studiował, dużo czytał, ale tak samo mogłoby 95% pytań zadawanych tutaj przez innych ludzi ... Ponadto, w niektórych przypadkach, szczególnie z danymi makroekonomicznymi (co jest moją dziedziną) ), nie ma więcej danych do zebrania. Danych jest mało (mam na myśli liczbę obserwacji) i trzeba z tym żyć. Nie ma rozwiązania „zdobądź więcej danych”. Miałem nadzieję, że ktoś tutaj zna ten temat, ale nie wygląda na to. Może po otwarciu strony internetowej dla ogółu społeczeństwa?

— Vivi

Podejrzewam, że odpowiedź na twoje pytanie będzie zależała od dziedziny / modelu i dlatego nie jestem pewien, czy mogę polecić konkretny artykuł.

1

Przepraszam za późną odpowiedź. Podoba mi się twoja sugestia symulacji. Nie jest to jednak naprawdę łatwe. Prawda jest taka, że w praktyce widzę, że badacze po prostu wykonują test, który jest obliczeniowo łatwiejszy lub daje im oczekiwany wynik.

— Vivi

8

Nie udzielę ostatecznej odpowiedzi w kwestii uszeregowania trzech. Zbuduj 95% elementów CI wokół swoich parametrów na podstawie każdego z nich, a jeśli są one radykalnie różne, Twoim pierwszym krokiem powinno być głębsze kopanie. Przekształć swoje dane (choć LR będzie niezmienny), ureguluj swoje prawdopodobieństwo itp. W skrócie, prawdopodobnie wybrałbym test LR i związany z nim CI. Następuje szorstki argument.

LR jest niezmienny przy wyborze parametryzacji (np. T versus logit (T)). Statystyka Walda zakłada normalność (T - T0) / SE (T). Jeśli to się nie powiedzie, twój CI jest zły. Zaletą LR jest to, że nie trzeba znaleźć transformacji f (T), aby spełnić normalność. 95% CI oparte na T będzie takie samo. Ponadto, jeśli twoje prawdopodobieństwo nie jest kwadratowe, Wald 95% CI, który jest symetryczny, może być kapryśny, ponieważ może preferować wartości o niższym prawdopodobieństwie niż te o wyższym prawdopodobieństwie.

Innym sposobem myślenia o LR jest to, że wykorzystuje on więcej informacji, luźno mówiąc, z funkcji prawdopodobieństwa. Wald opiera się na MLE i krzywizny prawdopodobieństwa na wartości zerowej. Wynik opiera się na nachyleniu przy zerowym i krzywiznie przy zerowym. LR ocenia prawdopodobieństwo poniżej wartości zerowej i prawdopodobieństwo po połączeniu wartości zerowej i alternatywnej i łączy te dwie wartości. Jeśli jesteś zmuszony wybrać jedną, może to być intuicyjnie satysfakcjonujące przy wyborze LR.

Należy pamiętać, że istnieją inne powody, takie jak wygoda lub obliczenia, aby wybrać Wald lub Score. Wald jest najprostszy, a biorąc pod uwagę parametr wielowymiarowy, jeśli testujesz ustawienie wielu indywidualnych na 0, istnieją wygodne sposoby przybliżenia prawdopodobieństwa. Lub jeśli chcesz dodać zmienną na raz z jakiegoś zestawu, możesz nie chcieć zmaksymalizować prawdopodobieństwa dla każdego nowego modelu, a implementacja testów wyników oferuje tutaj pewną wygodę. Wald i Score stają się atrakcyjne, gdy twoje modele i prawdopodobieństwo stają się nieatrakcyjne. (Ale nie sądzę, że o to pytałeś, ponieważ masz wszystkie trzy dostępne ...)

— ars
źródło