Jaki jest odpowiedni model dla danych o niskiej rozproszeniu?


24

Próbuję modelować dane zliczania w R, które najwyraźniej są rozproszone (parametr dyspersji ~ .40). Prawdopodobnie dlatego model glmz family = poissonlub ujemny glm.nbmodel dwumianowy ( ) nie są znaczące. Kiedy patrzę na opisy moich danych, nie mam typowego skosu danych zliczania, a reszty w moich dwóch warunkach eksperymentalnych są również jednorodne.

Więc moje pytania to:

  1. Czy muszę nawet stosować specjalne analizy regresji dla moich danych zliczania, jeśli moje dane zliczania tak naprawdę nie zachowują się jak dane zliczania? Czasami spotykam się z nienormalnością (zwykle z powodu kurtozy), ale użyłem metody percentyla bootstrap do porównania przyciętych środków (Wilcox, 2012), aby uwzględnić nienormalność. Czy metody liczenia danych można zastąpić dowolną niezawodną metodą zasugerowaną przez Wilcox i zrealizowaną w pakiecie WRS?

  2. Jeśli muszę użyć analiz regresji dla danych zliczania, jak mogę uwzględnić niedostateczne rozproszenie? Rozkład Poissona i ujemny rozkład dwumianowy zakładają większe rozproszenie, więc nie powinno to być właściwe, prawda? Myślałem o zastosowaniu rozkładu quasi-Poissona , ale zwykle jest to zalecane w przypadku nadmiernej dyspersji. Czytałem o modelach dwumianowych , które wydają się być w stanie uwzględnić nadmierną lub niską dyspersję, są dostępne w VGAMpakiecie R. Autorzy wydają się jednak zalecać złudną dystrybucję Poissona , ale nie mogę jej znaleźć w pakiecie .

Czy ktoś może polecić procedurę dla danych o niskiej rozproszeniu i może podać przykładowy kod R?


1
Skąd wiesz, że Twoje dane są rozproszone? Jak obliczasz parametr dyspersji?
Hong Ooi,

1
Pomógłby nam również powiedzieć więcej o tym, co cię interesuje. W przypadku liniowych oszacowań punktów predykcyjnych i przewidywania wartości, zaniżona dyspersja rzadko stanowi problem, ale testy i interwały mogą być niepotrzebnie konserwatywne (quasi rodziny mogłyby w tym pomóc). To powiedziawszy, dla „normalnego” podejścia opartego na prawdopodobieństwie sprawdź COM Poissona i inne uogólnione modele Poissona.
Momo

@ Hung Ooi: Testowałem dyspersję testem dyspersji (Poissonmodel, alternatywa = c („mniej”)) i test okazał się znaczący.
Sil

1
@ Momo: Chcę sprawdzić, czy negocjowanie diad w dwóch eksperymentalnych warunkach różni się prawidłowymi ofertami. Prawidłowe oferty oznaczają, że diady zgłaszają więcej problemów, które odpowiadają interesom ich zespołów, zamiast twierdzić, że są bardziej wartościowe dla drugiej strony. Po pierwsze, nawet nie zdawałem sobie sprawy, że są to dane zliczające. Czy masz na myśli rozkład Conwaya-Maxwella-Poissona autorstwa COM Poisson? Wielkie dzięki już!
Sil

3
Dzięki za dodatkowe info. Tak, miałem na myśli Conseya-Maxwella Poissona. Shmueli & co opracował dla niego rodzajowy uogólniony model liniowy, istnieje również pakiet R, jeśli chcesz spróbować.
Momo

Odpowiedzi:


9

Najlepszym --- i standardowym sposobem radzenia sobie z rozproszonymi danymi Poissona jest użycie uogólnionego modelu Poissona lub modelu przeszkodowego. Modele zliczania trzech parametrów mogą być również stosowane do danych o niskiej rozproszeniu; np. Faddy-Smith, Waring, Famoye, Conway-Maxwell i inne uogólnione modele zliczania. Jedyną wadą tych elementów jest ich interpretowalność. Ale w przypadku danych ogólnie mało rozproszonych należy użyć uogólnionego Poissona. To jest jak dwumian ujemny dla danych rozproszonych. Omawiam to bardziej szczegółowo w dwóch moich książkach, Modeling Count Data (2014) i Negative Binomial Regression, 2. wydanie, (2011), oba przez Cambridge University Press. W wersji R pakiet VGAM umożliwia uogólnioną regresję Poissona (GP). Ujemne wartości parametru dyspersji wskazują na dostosowanie do niskiej dyspersji. Modelu GP można również używać do przesadzania danych, ale ogólnie model NB jest lepszy. Jeśli chodzi o to, najlepiej ustalić przyczynę niedystrybucji, a następnie wybrać najbardziej odpowiedni model, aby sobie z tym poradzić.


Witamy spowrotem! Zarejestruj się i / lub połącz swoje konta (informacje o tym, jak to zrobić, znajdziesz w sekcji Moje konto w naszym centrum pomocy ), wtedy będziesz mógł edytować i komentować własne pytanie. (Twoje oryginalne konto jest tutaj .)
Gung - Przywróć Monikę

Czy możesz przeprowadzić uogólnioną analizę Poissona w SPSS?
Grace Carroll

3

Spotkałem kiedyś rozproszonego Poissona, który miał związek z częstotliwością, z jaką ludzie grali w grę społeczną. Okazało się, że było to spowodowane niezwykłą regularnością, z jaką ludzie będą grać w piątki. Usunięcie danych z piątku dało mi oczekiwany rozproszony Poisson. Być może masz możliwość podobnej edycji swoich danych.


1

Zdarzają się sytuacje, w których niedystrybucja łączy się z inflacją zerową, co jest typowe dla preferowanych dzieci przez osoby obu płci. Do tej pory nie znalazłem sposobu na uchwycenie tego

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.