Czy Poisson i podstawowy Poisson są obcinane przez zero, czy zagnieżdżone?

Widziałem wiele, które dyskutują, czy podstawowa regresja Poissona jest zagnieżdżoną wersją zerowej regresji Poissona. Na przykład ta strona twierdzi, że tak jest, ponieważ ta ostatnia zawiera dodatkowe parametry w celu modelowania dodatkowych zer, ale poza tym zawiera te same parametry regresji Poissona, co pierwsza, chociaż strona zawiera odwołanie, które się nie zgadza.

Nie mogę znaleźć informacji na temat tego, czy zagnieżdżone zero Poissona i podstawowe Poissona są zagnieżdżone. Jeśli skrócona przez zero Poissona jest tylko Poissonem z dodatkowym zastrzeżeniem, że prawdopodobieństwo zliczenia zera wynosi zero, wydaje mi się, że brzmi to tak, jak mogłoby być, ale liczyłem na bardziej ostateczną odpowiedź.

Zastanawiam się, dlaczego to wpłynie na to, czy powinienem użyć testu Vuonga (dla modeli nie zagnieżdżonych), czy bardziej podstawowego testu chi-kwadrat opartego na różnicy w prawdopodobieństwach logicznych (dla modeli zagnieżdżonych).

Wilson (2015) mówi o tym, czy test Vuonga jest odpowiedni do porównywania regresji z napompowaniem zerowym z regresją podstawową, ale nie mogę znaleźć źródła, które omawia dane skrócone do zera.

poisson-regression zero-inflation

— Justin
źródło

Odpowiedzi:

Po prostu teraz to zobacz. Aby uniknąć nieporozumień, jestem Wilson of Wilson (2015), do którego odwołuje się oryginalne pytanie, które pyta, czy modele Poissona i ścięte Poissona są zagnieżdżone, a nie zagnieżdżone itp. Nieco upraszczając, mniejszy model jest zagnieżdżony w większym modelu, jeśli większy model zmniejsza się do mniejszego, jeśli podzbiór jego parametrów jest ustalony na podanych wartościach; dwa modele nakładają się, jeśli oba redukują się do tego samego modelu, gdy podzbiory ich odpowiednich parametrów są ustalone na pewne wartości, nie są zagnieżdżone, jeśli bez względu na to, jak parametry są ustalone, jednego nie można zredukować do drugiego. Zgodnie z tą definicją skrócone Poissona i standardowe Poissona nie są zagnieżdżone. JEDNAK i jest to kwestia, która wydaje się być pomijana przez wielu, teoria dystrybucji Vuonga odnosi się do ŚCIEŻKO zagnieżdżonego, ŚCIEŻNIE nie zagnieżdżonego, i ŚCIEŻKO się pokrywają. „ŚCISŁO” odnoszący się do dodania sześciu ograniczeń do podstawowej definicji zagnieżdżenia itp. Ograniczenia te nie są do końca proste, ale oznaczają między innymi, że wyniki Vuong dotyczące rozkładu współczynników prawdopodobieństwa nie mają zastosowania w przypadkach, w których modele / rozkłady są zagnieżdżone na granicy przestrzeni parametrów (jak ma to miejsce w przypadku Poissona / Poissona z napełnieniem zerowym Poison z łączem tożsamości dla parametru inflacji zerowej) lub gdy jeden model dąży do drugiego, gdy parametr dąży do nieskończoności, jak jest tak w przypadku Poissona / Poissona z nadciśnieniem zerowym, gdy łącze logitowe jest używane do modelowania parametru z inflacją zerową. Vuong nie wysuwa żadnej teorii na temat rozkładu ilorazów prawdopodobieństwa logarytmicznego w tych okolicznościach. Niestety tutaj

Poniższy kod R będzie symulował rozkład współczynników logiki wiarygodności Poissona i skróconych. Wymaga VGAMpakietu.

n<-30   
lambda1<-1
H<-rep(999,10000)
for(i in 1:10000){
  print(i)
  y<-rpospois(n, lambda1)
  fit1 <- vglm(y ~ 1, pospoisson)
  fit2<-glm(y~1, family=poisson(link="log"))
  H[i]<-logLik(fit1)-logLik(fit2)
}

hist(H,col="lemonchiffon")

— Pauljw11
źródło

Podstawowy Poisson można uznać za zagnieżdżony w bardziej ogólnej formie:

$p(x) = (1-p)\frac{\text{e}^{-\lambda}\lambda^x}{x!} + p1(x=0)$

Gdy , mamy podstawowy Poissona. Kiedy , mamy Poissona obciętego do zera. Kiedy , mamy Poissona z zerową redukcją. Gdy , mamy zerowanego nadciśnienia Poissona i mamy rozkład zdegenerowany przy . $p = 0$ $p = -\exp\{-\lambda\}/(1 -\exp\{-\lambda\})$ $-\exp\{-\lambda\}/(1 -\exp\{-\lambda\}) < p < 0$ $0 < p < 1$ $p = 1$

Wydaje mi się więc, że zagnieżdżona wersja testu Vuong lub chi-kwadrat, jak sugerujesz, byłyby odpowiednie w twoim przypadku. Zauważ jednak, że chi-kwadrat może mieć problemy ze względu na małe prawdopodobieństwo „dużych” (w stosunku do ) obserwacji. Prawdopodobnie powinieneś użyć bootstrap, aby uzyskać wartość p dla statystyki chi-kwadrat zamiast polegać na asymptotyce, chyba że masz dość dużo danych. $\lambda$

— łucznik
źródło

Dzięki @jbowman - jest to rodzaj bardziej rygorystycznej odpowiedzi, na którą liczyłem. Nie jestem jednak pewien: myślałem, że cały sens testu Vuong dotyczy modeli nie zagnieżdżonych, więc nawet jeśli wykracza to poza mój pierwotny post, czy możesz podać nieco więcej informacji na temat „zagnieżdżonej wersji testu Vuong”. Aby wyjaśnić źródło mojego zamieszania: do tej chwili byłem świadomy tylko vuongfunkcji w pakiecie psclw R, która mówi, że jest to dla modeli nie zagnieżdżonych. Właśnie przejrzałem i znalazłem funkcję vuongtestw pakiecie, nonnest2która zawiera argument „zagnieżdżony”. Czy to to?

— Justin

Tak to jest. W rzeczywistości strona Wikipedii en.wikipedia.org/wiki/Vuong%27s_closeness_test w teście Vuonga jest raczej pomocna (często nie tak bardzo) w opisywaniu różnicy.

— jbowman

NB Zarówno Poissona, jak i Poissona skróconego do zera są specjalnymi przypadkami rozkładu, który zdefiniowałeś. Jedno nie jest zagnieżdżone w drugim. Nie można więc użyć twierdzenia Wilksa do wyprowadzenia asymptotycznego rozkładu chi-kwadrat dla dwukrotności ilorazu prawdopodobieństwa log, w zależności od tego, czy uważa się hipotezę zerową. (Myślę, że są też pewne warunki prawidłowości testu Vuong.)

— Scortchi - Przywróć Monikę

@Scortchi Jestem ciekaw definicji „zagnieżdżonej”, którą stosujesz. Chociaż nie zgadzam się z twoim wnioskiem, dochodzę do niego z nieco innego punktu widzenia: tak, Poisson jest zagnieżdżony w tej rodzinie (ponieważ powstaje przez ograniczenie do ), ale różne wnioski na temat asymptotycznych rozkładów MLE oszacowania parametrów dla nie mają zastosowania, ponieważ ta wartość leży na granicy rodziny. Czy brakuje mi ważnego rozróżnienia?

p = 0

$p=0$

p

$p$

p

$p$

— whuber

@ Whuber zamierzałem skomentować / udzielić odpowiedzi na ten sam temat. Odwołuje Link robi notatki: „... chociaż rozkład chi kwadrat może być konieczne pewne korekty, ponieważ ograniczenie jest na granicy przestrzeni parametrów”

— Ben Bolker