Przeprowadziłem glm.nb przez
glm1<-glm.nb(x~factor(group))
gdzie grupa jest kategorialna, a x jest zmienną metryczną. Kiedy próbuję uzyskać podsumowanie wyników, otrzymuję nieco inne wyniki, w zależności od tego, czy używam summary()
lub summary.glm
. summary(glm1)
daje mi
...
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.1044 0.1519 0.687 0.4921
factor(gruppe)2 0.1580 0.2117 0.746 0.4555
factor(gruppe)3 0.3531 0.2085 1.693 0.0904 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(0.7109) family taken to be 1)
podczas gdy Summary.glm (glm1) daje mi
...
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.1044 0.1481 0.705 0.4817
factor(gruppe)2 0.1580 0.2065 0.765 0.4447
factor(gruppe)3 0.3531 0.2033 1.737 0.0835 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)
Rozumiem znaczenie parametru dyspersji, ale nie linii
(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)
.
W podręczniku jest powiedziane, że byłaby to szacunkowa dyspersja, ale wydaje się, że jest to zła ocena, ponieważ 0,95 nie jest bliskie 0,7109, czy też szacowana dyspersja jest czymś innym niż szacowany parametr dyspersji? Chyba muszę ustawić dyspersję w summary.nb(x, dispersion=)
czymś, ale nie jestem pewien, czy muszę ustawić dyspersję na 1 (co da taki sam wynik jak summary()
lub jeśli powinienem wstawić oszacowanie parametru dyspersji, w tym przypadku prowadzi do summary.nb(glm1, dispersion=0.7109)
czegoś innego? A może po prostu używam summary(glm1)
?