Nadmierna dyspersja ma miejsce wtedy, gdy występuje większa zmienność niż „powinna” występować w danych. Np. Wariancja zliczeń jest często większa niż średnia, podczas gdy wariancja Poissona powinna być równa średniej.
Tworzę Poissona GLM w R. Aby sprawdzić, czy występuje nadmierna dyspersja, przyglądam się stosunkowi odchylenia resztkowego do stopni swobody podanych przez summary(model.name). Czy istnieje wartość graniczna lub test dla tego stosunku, który należy uznać za „znaczący”? Wiem, że jeśli jest> 1, to dane są rozproszone, ale jeśli mam współczynniki względnie …
Chcę dopasować wielopoziomowy GLMM z rozkładem Poissona (z nadmierną dyspersją) za pomocą R. W tej chwili używam lme4, ale zauważyłem, że ostatnio quasipoissonrodzina została usunięta. Widziałem gdzie indziej, że można modelować nadmierną dyspersję addytywną dla rozkładów dwumianowych, dodając losowy punkt przecięcia z jednym poziomem na obserwację. Czy dotyczy to również …
Mam nadzieję, że ktoś zapewni intuicyjny przegląd tego, czym jest dystrybucja quasibinomial i co robi. Szczególnie interesują mnie następujące punkty: Jak quasibinomial różni się od rozkładu dwumianowego. Gdy zmienna odpowiedzi jest proporcją (przykładowe wartości obejmują 0,23, 0,11, 0,78, 0,98), model quasibinomial będzie działał w R, ale model dwumianowy nie. Dlaczego …
Jaka jest właściwa strategia przy podejmowaniu decyzji, którego modelu użyć z danymi zliczania? Mam dane, które muszę zamodelować jako model wielopoziomowy i zalecono mi (na tej stronie), że najlepszym sposobem jest to poprzez błędy lub MCMCglmm. Jednak wciąż próbuję dowiedzieć się o statystykach bayesowskich i pomyślałem, że najpierw powinienem dopasować …
Często widziałem porady dotyczące sprawdzania, czy dopasowanie modelu Poissona jest nadmiernie rozproszone, polegające na podzieleniu resztkowego odchylenia przez stopnie swobody. Wynikowy stosunek powinien wynosić „około 1”. Pytanie brzmi, o jakim zakresie mówimy dla „przybliżonego” - jaki jest stosunek, który powinien wywoływać alarmy, aby rozważyć alternatywne formy modeli?
Mam dane zliczania (analiza popytu / oferty z liczbą klientów, w zależności od - być może - wielu czynników). Próbowałem regresji liniowej z normalnymi błędami, ale mój wykres QQ nie jest naprawdę dobry. Próbowałem przekształcić log odpowiedzi: po raz kolejny zły wykres QQ. Więc teraz próbuję regresji za pomocą błędów …
Zjawisko „nadmiernej dyspersji” w GLM powstaje za każdym razem, gdy używamy modelu, który ogranicza wariancję zmiennej odpowiedzi, a dane wykazują większą wariancję, niż pozwala na to ograniczenie modelu. Zdarza się to często podczas modelowania danych zliczeniowych przy użyciu Poissona GLM i można je zdiagnozować za pomocą dobrze znanych testów. Jeśli …
Mam zestaw danych, który spodziewałbym się podążać za rozkładem Poissona, ale jest on rozproszony około 3-krotnie. Obecnie modeluję tę naddyspersję za pomocą czegoś takiego jak następujący kod w R. ## assuming a median value of 1500 med = 1500 rawdist = rpois(1000000,med) oDdist = rawDist + ((rawDist-med)*3) Wizualnie wydaje się, …
Próbuję zrozumieć koncepcję nadmiernej dyspersji w regresji logistycznej. Czytałem, że nadmierna dyspersja występuje wtedy, gdy zaobserwowana wariancja zmiennej odpowiedzi jest większa niż można by oczekiwać po rozkładzie dwumianowym. Ale jeśli zmienna dwumianowa może mieć tylko dwie wartości (1/0), to jak może mieć średnią i wariancję? Nie przeszkadza mi obliczanie średniej …
Natknąłem się na trzy propozycje rozwiązania problemu nadmiernej dyspersji w zmiennej odpowiedzi Poissona i modelu początkowym o ustalonych efektach: Użyj modelu quasi; Użyj ujemnego dwumianowego GLM; Użyj modelu mieszanego z losowym efektem na poziomie przedmiotu. Ale co właściwie wybrać i dlaczego? Czy jest wśród nich jakieś rzeczywiste kryterium?
W modelowaniu danych dotyczących liczby roszczeń w środowisku ubezpieczeniowym zacząłem od Poissona, ale zauważyłem nadmierną dyspersję. Quasi-Poisson lepiej modelował większy związek średniej wariancji niż podstawowy Poisson, ale zauważyłem, że współczynniki były identyczne zarówno w modelach Poissona, jak i Quasi-Poissona. Jeśli to nie jest błąd, dlaczego tak się dzieje? Jakie są …
Podczas modelowania zliczania danych z badań eksperymentalnych przy użyciu eksperymentu wewnątrz przedmiotu napotkałem szereg praktycznych pytań. Krótko opisuję eksperyment, dane i to, co do tej pory zrobiłem, a następnie moje pytania. Cztery różne filmy pokazano sekwencyjnie grupie respondentów. Po każdym filmie przeprowadzany był wywiad, w którym policzyliśmy liczbę wystąpień niektórych …
Mam następujący model: > model1<-lmer(aph.remain~sMFS1+sAG1+sSHDI1+sbare+season+crop +(1|landscape),family=poisson) ... a to jest podsumowanie. > summary(model1) Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS1 + sAG1 + sSHDI1 + sbare + season + crop + (1 | landscape) AIC BIC logLik deviance 4057 4088 -2019 4039 Random effects: …
Szukam do modelowania niektórych danych, ale nie jestem pewien, jakiego rodzaju modelu mogę użyć. Mam dane zliczania i chcę model, który da parametryczne oszacowania zarówno średniej, jak i wariancji danych. Oznacza to, że mam różne czynniki predykcyjne i chcę ustalić, czy którykolwiek z nich wpływa na wariancję (nie tylko średnią …
Mam GLMM w postaci: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kiedy używam drop1(model, test="Chi"), otrzymuję inne wyniki niż w przypadku korzystania Anova(model, type="III")z pakietu samochodowego lub summary(model). Te dwa ostatnie dają te same odpowiedzi. Korzystając z wielu sfabrykowanych danych, odkryłem, że te …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.