Jaka jest właściwa strategia przy podejmowaniu decyzji, którego modelu użyć z danymi zliczania? Mam dane, które muszę zamodelować jako model wielopoziomowy i zalecono mi (na tej stronie), że najlepszym sposobem jest to poprzez błędy lub MCMCglmm. Jednak wciąż próbuję dowiedzieć się o statystykach bayesowskich i pomyślałem, że najpierw powinienem dopasować swoje dane jako uogólnione modele liniowe i zignorować zagnieżdżoną strukturę danych (tylko po to, aby uzyskać mgliste pojęcie, czego się spodziewać).
Około 70% danych to 0, a stosunek wariancji do średniej wynosi 33. Tak więc dane są dość rozproszone.
Po wypróbowaniu wielu różnych opcji (w tym modelu Poissona, modelu dwumianowego ujemnego, modelu quasi i zerowego) widzę bardzo małą spójność wyników (od wszystkiego, co jest znaczące do nic, jest znaczące).
Jak mogę podjąć świadomą decyzję o wyborze modelu na podstawie inflacji 0 i nadmiernej dyspersji? Na przykład, w jaki sposób mogę wywnioskować, że quasi-poisson jest bardziej odpowiedni niż ujemny dwumianowy (lub odwrotnie) i skąd mam wiedzieć, że użycie odpowiednio poradziło sobie (lub nie) z nadmiarem zer? Podobnie, jak mogę ocenić, że nie ma już nadmiernej dyspersji, jeśli stosuje się model z napompowaniem zerowym? lub jak powinienem zdecydować pomiędzy napompowanym zerowym poissonem a zerowym napełnionym ujemnym dwumianem?