Mam te dane:
set.seed(1)
predictor <- rnorm(20)
set.seed(1)
counts <- c(sample(1:1000, 20))
df <- data.frame(counts, predictor)
Przeprowadziłem regresję Poissona
poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson")
I ujemna regresja dwumianowa:
require(MASS)
nb_counts <- glm.nb(counts ~ predictor, data = df)
Następnie obliczyłem statystyki dyspersji dla regresji Poissona:
sum(residuals(poisson_counts, type="pearson")^2)/df.residual(poisson_counts)
# [1] 145.4905
I ujemna regresja dwumianowa:
sum(residuals(nb_counts, type="pearson")^2)/df.residual(nb_counts)
# [1] 0.7650289
Czy ktokolwiek jest w stanie wyjaśnić, BEZ UŻYCIA RÓWNIKÓW, dlaczego statystyka dyspersji dla ujemnej regresji dwumianowej jest znacznie mniejsza niż statystyka dyspersji dla regresji Poissona?