Statystyki i duże zbiory danych overdispersion

4

Czy istnieje test pozwalający ustalić, czy nadmierna dyspersja GLM jest znacząca?

Tworzę Poissona GLM w R. Aby sprawdzić, czy występuje nadmierna dyspersja, przyglądam się stosunkowi odchylenia resztkowego do stopni swobody podanych przez summary(model.name). Czy istnieje wartość graniczna lub test dla tego stosunku, który należy uznać za „znaczący”? Wiem, że jeśli jest> 1, to dane są rozproszone, ale jeśli mam współczynniki względnie …

44 statistical-significance overdispersion

4

Jak dopasować model wielopoziomowy do nadmiernie rozproszonych efektów Poissona?

Chcę dopasować wielopoziomowy GLMM z rozkładem Poissona (z nadmierną dyspersją) za pomocą R. W tej chwili używam lme4, ale zauważyłem, że ostatnio quasipoissonrodzina została usunięta. Widziałem gdzie indziej, że można modelować nadmierną dyspersję addytywną dla rozkładów dwumianowych, dodając losowy punkt przecięcia z jednym poziomem na obserwację. Czy dotyczy to również …

32 r mixed-model poisson-distribution lme4-nlme overdispersion

2

Co to jest rozkład quasi-dwumianowy (w kontekście GLM)?

Mam nadzieję, że ktoś zapewni intuicyjny przegląd tego, czym jest dystrybucja quasibinomial i co robi. Szczególnie interesują mnie następujące punkty: Jak quasibinomial różni się od rozkładu dwumianowego. Gdy zmienna odpowiedzi jest proporcją (przykładowe wartości obejmują 0,23, 0,11, 0,78, 0,98), model quasibinomial będzie działał w R, ale model dwumianowy nie. Dlaczego …

30 r generalized-linear-model binomial overdispersion quasi-likelihood

4

Strategia decydowania o odpowiednim modelu danych zliczania

Jaka jest właściwa strategia przy podejmowaniu decyzji, którego modelu użyć z danymi zliczania? Mam dane, które muszę zamodelować jako model wielopoziomowy i zalecono mi (na tej stronie), że najlepszym sposobem jest to poprzez błędy lub MCMCglmm. Jednak wciąż próbuję dowiedzieć się o statystykach bayesowskich i pomyślałem, że najpierw powinienem dopasować …

16 poisson-distribution generalized-linear-model negative-binomial overdispersion

2

Kiedy ktoś mówi, że odchylenie resztkowe / df powinno wynosić ~ 1 dla modelu Poissona, jak przybliżone jest przybliżenie?

Często widziałem porady dotyczące sprawdzania, czy dopasowanie modelu Poissona jest nadmiernie rozproszone, polegające na podzieleniu resztkowego odchylenia przez stopnie swobody. Wynikowy stosunek powinien wynosić „około 1”. Pytanie brzmi, o jakim zakresie mówimy dla „przybliżonego” - jaki jest stosunek, który powinien wywoływać alarmy, aby rozważyć alternatywne formy modeli?

16 poisson-distribution negative-binomial poisson-regression overdispersion

2

Poissona czy quasi-poissona w regresji z danymi zliczania i nadmierną dyspersją?

Mam dane zliczania (analiza popytu / oferty z liczbą klientów, w zależności od - być może - wielu czynników). Próbowałem regresji liniowej z normalnymi błędami, ale mój wykres QQ nie jest naprawdę dobry. Próbowałem przekształcić log odpowiedzi: po raz kolejny zły wykres QQ. Więc teraz próbuję regresji za pomocą błędów …

16 count-data poisson-regression overdispersion quasi-likelihood

2

Czy testy nadmiernej dyspersji w GLM są * przydatne *?

Zjawisko „nadmiernej dyspersji” w GLM powstaje za każdym razem, gdy używamy modelu, który ogranicza wariancję zmiennej odpowiedzi, a dane wykazują większą wariancję, niż pozwala na to ograniczenie modelu. Zdarza się to często podczas modelowania danych zliczeniowych przy użyciu Poissona GLM i można je zdiagnozować za pomocą dobrze znanych testów. Jeśli …

15 generalized-linear-model poisson-regression overdispersion quasi-likelihood

2

Modelowanie rozkładu Poissona z nadmierną dyspersją

Mam zestaw danych, który spodziewałbym się podążać za rozkładem Poissona, ale jest on rozproszony około 3-krotnie. Obecnie modeluję tę naddyspersję za pomocą czegoś takiego jak następujący kod w R. ## assuming a median value of 1500 med = 1500 rawdist = rpois(1000000,med) oDdist = rawDist + ((rawDist-med)*3) Wizualnie wydaje się, …

15 distributions modeling poisson-distribution overdispersion

2

Nadmierna dyspersja w regresji logistycznej

Próbuję zrozumieć koncepcję nadmiernej dyspersji w regresji logistycznej. Czytałem, że nadmierna dyspersja występuje wtedy, gdy zaobserwowana wariancja zmiennej odpowiedzi jest większa niż można by oczekiwać po rozkładzie dwumianowym. Ale jeśli zmienna dwumianowa może mieć tylko dwie wartości (1/0), to jak może mieć średnią i wariancję? Nie przeszkadza mi obliczanie średniej …

14 logistic variance binomial mean overdispersion

1

Jak radzić sobie z nadmierną dyspersją w regresji Poissona: quasi-prawdopodobieństwo, ujemny dwumianowy GLM lub efekt losowy na poziomie podmiotu?

Natknąłem się na trzy propozycje rozwiązania problemu nadmiernej dyspersji w zmiennej odpowiedzi Poissona i modelu początkowym o ustalonych efektach: Użyj modelu quasi; Użyj ujemnego dwumianowego GLM; Użyj modelu mieszanego z losowym efektem na poziomie przedmiotu. Ale co właściwie wybrać i dlaczego? Czy jest wśród nich jakieś rzeczywiste kryterium?

12 regression negative-binomial poisson-regression overdispersion quasi-likelihood

1

Identyczne współczynniki oszacowane w modelu Poissona vs Quasi-Poissona

W modelowaniu danych dotyczących liczby roszczeń w środowisku ubezpieczeniowym zacząłem od Poissona, ale zauważyłem nadmierną dyspersję. Quasi-Poisson lepiej modelował większy związek średniej wariancji niż podstawowy Poisson, ale zauważyłem, że współczynniki były identyczne zarówno w modelach Poissona, jak i Quasi-Poissona. Jeśli to nie jest błąd, dlaczego tak się dzieje? Jakie są …

12 r count-data poisson-regression overdispersion quasi-likelihood

1

Nadmierna dyspersja i alternatywy modelowania w modelach efektu losowego Poissona z przesunięciami

Podczas modelowania zliczania danych z badań eksperymentalnych przy użyciu eksperymentu wewnątrz przedmiotu napotkałem szereg praktycznych pytań. Krótko opisuję eksperyment, dane i to, co do tej pory zrobiłem, a następnie moje pytania. Cztery różne filmy pokazano sekwencyjnie grupie respondentów. Po każdym filmie przeprowadzany był wywiad, w którym policzyliśmy liczbę wystąpień niektórych …

12 generalized-linear-model negative-binomial glmm poisson-regression overdispersion

2

Jak przetestować nadmierną dyspersję w Poisson GLMM z lmer () w R?

Mam następujący model: > model1<-lmer(aph.remain~sMFS1+sAG1+sSHDI1+sbare+season+crop +(1|landscape),family=poisson) ... a to jest podsumowanie. > summary(model1) Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS1 + sAG1 + sSHDI1 + sbare + season + crop + (1 | landscape) AIC BIC logLik deviance 4057 4088 -2019 4039 Random effects: …

12 r poisson-distribution lme4-nlme glmm overdispersion

2

Modelowanie parametryczne wariancji danych zliczeniowych

Szukam do modelowania niektórych danych, ale nie jestem pewien, jakiego rodzaju modelu mogę użyć. Mam dane zliczania i chcę model, który da parametryczne oszacowania zarówno średniej, jak i wariancji danych. Oznacza to, że mam różne czynniki predykcyjne i chcę ustalić, czy którykolwiek z nich wpływa na wariancję (nie tylko średnią …

12 variance modeling count-data overdispersion gamlss

1

Dlaczego Anova () i drop1 () podają różne odpowiedzi dla GLMM?

Mam GLMM w postaci: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kiedy używam drop1(model, test="Chi"), otrzymuję inne wyniki niż w przypadku korzystania Anova(model, type="III")z pakietu samochodowego lub summary(model). Te dwa ostatnie dają te same odpowiedzi. Korzystając z wielu sfabrykowanych danych, odkryłem, że te …

10 r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

Pytania otagowane jako overdispersion