RV Foutz i RC Srivastava szczegółowo przeanalizowali tę kwestię. W artykule z 1977 r. „Przeprowadzenie testu współczynnika wiarygodności, gdy model jest niepoprawny”, znajduje się zestawienie wyniku podziału w przypadku błędnej specyfikacji wraz z bardzo krótkim szkicem dowodu, zaś w artykule z 1978 r. „Asymptotyczny rozkład współczynnika wiarygodności, gdy model jest niepoprawny ” zawiera dowód, ale ten ostatni jest wpisany w staromodnym pisarzu (oba dokumenty używają tego samego zapisu, więc można je łączyć w czytaniu). Ponadto w odniesieniu do niektórych etapów dowodu odwołują się do dokumentu KP Roy „Nota o asymptotycznym rozkładzie współczynnika wiarygodności” z 1957 r., Który nie wydaje się być dostępny on-line, a nawet bramkowany.
W przypadku błędnej specyfikacji dystrybucji, jeśli MLE jest nadal spójny i asymptotycznie normalny (co nie zawsze ma miejsce), statystyka LR podąża asymptotycznie liniową kombinacją niezależnych kwadratów chi (każdy o jednym stopniu swobody)
- 2 lnλ →re∑i = 1rdojaχ2)ja
gdzie . Widać „podobieństwo”: zamiast jednego chi-kwadratu z stopniami swobody mamy chi-kwadraty, każdy o jednym stopniu swobody. Ale „analogia” na tym się kończy, ponieważ liniowa kombinacja kwadratów chi nie ma gęstości w formie zamkniętej. Każdy przeskalowany chi-kwadrat jest gamma, ale z innym parametrem , który prowadzi do innego parametru skali dla gamma - i suma takich gamma nie ma postaci zamkniętej, chociaż jego wartości można obliczyć.h - m h - m c ir = h - mh - mh - mdoja
Dla stałych mamy , a są to wartości własne macierzy ... która macierz? Cóż, korzystając z notacji autorów, ustaw jako hesian prawdopodobieństwa logarytmu, a jako zewnętrzny produkt gradientu logarytmu prawdopodobieństwa (w kategoriach oczekiwanych). Zatem jest asymptotyczną macierzą wariancji-kowariancji MLE.c 1 ≥ c 2 ≥ . . . c r ≥ 0 Λ C V = Λ - 1 C ( Λ ′ ) - 1dojado1≥ c2)≥ . . . dor≥ 0ΛdoV.= Λ- 1do( Λ′)- 1
Następnie zestaw być górną ukośną bloku . r × r V.M.r × rV.
Napisz także w formie blokuΛ
Λ = [ Λr × rΛ2)Λ′2)Λ3)]
i ustaw ( jest ujemną wartością Schur Complement z ). W ΛW.= - Λr × r+ Λ′2)Λ- 13)Λ2)W.Λ
Zatem to wartości własne macierzy oszacowane na prawdziwych wartościach parametrów. M WdojaM.W.
DODATEK
Odpowiadając na ważną uwagę PO w komentarzach (czasami rzeczywiście pytania stają się odskocznią do dzielenia się bardziej ogólnym wynikiem, a same mogą zostać pominięte w tym procesie), oto jak postępuje dowód Wilksa: Wilks zaczyna się od wspólnego normalny rozkład MLE i przechodzi do uzyskania funkcjonalnego wyrażenia ilorazu wiarygodności. Do jego eq. dowód może pójść naprzód, nawet jeśli założymy, że mamy błędną specyfikację dystrybucyjną: jak zauważa PO, warunki macierzy kowariancji wariancji będą różne w scenariuszu błędnej specyfikacji, ale wszystko, co robi Wilks, to pochodne i identyfikacja asymptotycznie nieistotne warunki. I tak przybywa na eq. gdzie widzimy, że statystyki prawdopodobieństwa,[ 9 ] h - m h - m[ 9 ][ 9 ]jeśli specyfikacja jest poprawna, jest to po prostu suma kwadratowych standardowych normalnych zmiennych losowych, a zatem są one rozdzielone jako jeden chi-kwadrat z stopniami swobody: (notacja ogólna)h - mh - m
- 2 lnλ = ∑i = 1h - m( n--√θ^ja- θjaσja)2)→reχ2)h - m
Ale jeśli mamy błędną specyfikację, wówczas terminy używane do skalowania wyśrodkowanego i powiększonego MLE nie są już terminami, które sprawią, że wariancje każdego elementu będą równe jedności, i w ten sposób przekształć każdy składnik w standardowe normalne rv, a sumę w kwadrat chi.
I tak nie jest, ponieważ terminy te obejmują oczekiwane wartości drugich pochodnych prawdopodobieństwa logarytmu ... ale oczekiwanej wartości można przyjąć jedynie w odniesieniu do prawdziwego rozkładu, ponieważ MLE jest funkcją danych i dane są zgodne z rzeczywistym rozkładem, podczas gdy drugie pochodne logarytmu prawdopodobieństwa są obliczane na podstawie błędnego założenia gęstości. n--√( θ^- θ )
Więc z powodu błędnej specyfikacji mamy coś takiego jak
a najlepsze, co możemy zrobić, to zmanipulować
- 2 lnλ = ∑i = 1h - m( n--√θ^ja- θjazaja)2)
- 2 lnλ = ∑i = 1h - mσ2)jaza2)ja( n--√θ^ja- θjaσja)2)= ∑i = 1h - mσ2)jaza2)jaχ2)1
która jest sumą skalowanych wartości kwadratowych chi-rv, nie jest już rozdzielana jako jedna wartość kwadratowa chi-kwadrat z stopni swobody. Odniesienie dostarczone przez PO jest rzeczywiście bardzo wyraźnym przedstawieniem tego bardziej ogólnego przypadku, który obejmuje wynik Wilksa jako przypadek szczególny.h - m