Próbuję modelować dane zliczania w R, które najwyraźniej są rozproszone (parametr dyspersji ~ .40). Prawdopodobnie dlatego model glm
z family = poisson
lub ujemny glm.nb
model dwumianowy ( ) nie są znaczące. Kiedy patrzę na opisy moich danych, nie mam typowego skosu danych zliczania, a reszty w moich dwóch warunkach eksperymentalnych są również jednorodne.
Więc moje pytania to:
Czy muszę nawet stosować specjalne analizy regresji dla moich danych zliczania, jeśli moje dane zliczania tak naprawdę nie zachowują się jak dane zliczania? Czasami spotykam się z nienormalnością (zwykle z powodu kurtozy), ale użyłem metody percentyla bootstrap do porównania przyciętych środków (Wilcox, 2012), aby uwzględnić nienormalność. Czy metody liczenia danych można zastąpić dowolną niezawodną metodą zasugerowaną przez Wilcox i zrealizowaną w pakiecie WRS?
Jeśli muszę użyć analiz regresji dla danych zliczania, jak mogę uwzględnić niedostateczne rozproszenie? Rozkład Poissona i ujemny rozkład dwumianowy zakładają większe rozproszenie, więc nie powinno to być właściwe, prawda? Myślałem o zastosowaniu rozkładu quasi-Poissona , ale zwykle jest to zalecane w przypadku nadmiernej dyspersji. Czytałem o modelach dwumianowych , które wydają się być w stanie uwzględnić nadmierną lub niską dyspersję, są dostępne w
VGAM
pakiecie R. Autorzy wydają się jednak zalecać złudną dystrybucję Poissona , ale nie mogę jej znaleźć w pakiecie .
Czy ktoś może polecić procedurę dla danych o niskiej rozproszeniu i może podać przykładowy kod R?