Znalezienie liczby gaussów w skończonej mieszaninie z twierdzeniem Wilksa?


11

Załóżmy, że mam zestaw niezależnych, identycznie rozmieszczonych obserwacji jednowymiarowych oraz dwie hipotezy na temat sposobu generowania :xx

H0 : jest rysowany z pojedynczego rozkładu Gaussa z nieznaną średnią i wariancją.x

HA : z mieszaniny dwóch Gaussów o nieznanej średniej, wariancji i współczynniku mieszania.x

Jeśli dobrze rozumiem, są to modele zagnieżdżone, ponieważ model, który reprezentuje można opisać w kategoriach jeśli ograniczysz parametry dwóch Gaussów do identyczności lub ograniczysz współczynnik mieszania do zera dla jednego z dwóch Gaussian. H0HA

Dlatego wydaje się, że powinieneś być w stanie użyć algorytmu EM do oszacowania parametrów a następnie użyć Twierdzenia Wilksa, aby ustalić, czy prawdopodobieństwo danych pod jest znacznie większe niż pod . Istnieje niewielki skok wiary w założenie, że algorytm EM zbiega się tutaj z maksymalnym prawdopodobieństwem, ale jestem skłonny to zrobić.HAHAH0

Próbowałem tego w symulacji Monte Carlo, zakładając, że ma 3 stopnie swobody więcej niż (średnia i wariancja dla drugiego Gaussa i parametru mieszania). Kiedy symulowałem dane z , otrzymałem rozkład wartości P, który był zasadniczo nierównomierny i wzbogacony dla małych wartości P. (Jeśli EM nie byłby zbieżny z prawdziwym maksymalnym prawdopodobieństwem, można by oczekiwać dokładnie odwrotnej sytuacji). Co jest złego w moim zastosowaniu twierdzenia Wilksa, które tworzy to uprzedzenie?HAH0H0

Odpowiedzi:


8

Dzięki dokładnemu określeniu, w jaki sposób zawarta jest hipoteza zerowa w dwuskładnikowym modelu mieszanki, można zobaczyć, na czym polega problem. Jeśli pięć parametrów w modelu mieszanym to , to ponieważ albo dwa normalne składniki mieszaniny są równe, przy czym proporcja mieszaniny jest bez znaczenia, czy mieszanina część oznacza 0 lub 1, w którym to przypadku jedna ze składników mieszaniny nie ma znaczenia. Wniosek jest taki, że hipotezy zerowej nie można określić, nawet lokalnie, jako proste ograniczenie parametrów, które zmniejsza wymiar przestrzeni parametrów z 5 do 2.μ1,μ2,σ1,σ2,ρ

H0:(μ1=μ2 and σ1=σ2) or ρ{0,1}.
ρρ

Hipoteza zerowa jest skomplikowanym podzbiorem pełnej przestrzeni parametrów, a pod wartością zerową parametrów nawet nie można zidentyfikować. Zwykłe założenia potrzebne do uzyskania twierdzenia Wilka załamują się, w szczególności nie jest możliwe skonstruowanie właściwego rozszerzenia prawdopodobieństwa logarytmu przez Taylora.

Nie mam żadnego osobistego doświadczenia z tym konkretnym problemem, ale znam inne przypadki, w których parametry „znikają” pod zerą, co również wydaje się mieć miejsce w tym przypadku, iw tych przypadkach wnioski z twierdzenia Wilka również się załamują . Szybkie wyszukiwanie dało między innymi ten dokument, który wydaje się odpowiedni, i gdzie można znaleźć dalsze odniesienia do stosowania testu współczynnika prawdopodobieństwa w odniesieniu do modeli mieszanin.


Dzięki. Myślałem, że coś takiego może stanowić problem, ale nie byłem pewien. Byłem trochę zdezorientowany co do drobniejszych punktów tego, co stanowi model zagnieżdżony na potrzeby twierdzenia Wilksa. Dobra uwaga na temat identyfikowalności poniżej wartości zerowej.
dsimcha,

4

Wnioskowanie na temat liczby składników mieszania nie spełnia wymaganych warunków regularności dla twierdzenia Wilksa, ponieważ (a) parametrρznajduje się na granicy przestrzeni parametrów i (b) parametryzacja jest niemożliwa do zidentyfikowania pod wartością zerową. Nie oznacza to, że rozkład uogólnionego wskaźnika prawdopodobieństwa jest nieznany! Jeśli wszystkie 5 parametrów w konfiguracji są nieznane, a co ważniejsze - nieograniczone, to rozkład statystyki LR nie jest zbieżny. Jeśli wszystkie niemożliwe do zidentyfikowania parametry są ograniczone, wówczas statystyka LR jest monotoniczna w supremum skróconego procesu Gaussa. Kowariancja, której nie da się łatwo obliczyć w ogólnym przypadku (5-parametrowym), a nawet jeśli ją masz, rozkład supremum takiego procesu nie jest łatwo przybliżony. Kilka praktycznych wyników dotyczących dwuskładnikowej mieszaniny znajduje się tutaj. Co ciekawe, artykuł pokazuje, że w dość prostych konfiguracjach statystyka LR jest w rzeczywistości słabsza niż niektóre prostsze statystyki. W artykule podsumowującym na temat wyprowadzania asymptotycznego rozkładu w takich problemach można znaleźć tutaj . Dla wszystkich praktycznych celów możesz dopasować mieszaninę za pomocą EM, a następnie Bootstrap rozkład statystyki LR. Może to zająć trochę czasu, ponieważ EM jest znany jako powolny i potrzeba wielu replikacji, aby uchwycić efekt wielkości próbki. Zobacz tutaj, aby uzyskać szczegółowe informacje.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.