Jak interpretować oszacowania parametrów w wynikach Poissona GLM [zamknięte]

Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi.

Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej.

Zamknięte 5 lat temu .

Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)

Deviance Residuals:
    Min      1Q   Median     3Q    Max
-3.7422 -1.0257   0.0027 0.7169 3.5347

Coefficients:
              Estimate Std.Error z value Pr(>|z|)
(Intercept)   3.144257  0.218646  14.381  < 2e-16 ***
riverWatauga -0.049016  0.051548  -0.951  0.34166
pH            0.086460  0.029821   2.899  0.00374 **
temp         -0.059667  0.009149  -6.522  6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21

Chcę wiedzieć, jak interpretować oszacowanie każdego parametru w powyższej tabeli.

— tomjerry001
źródło

Interpretacja jest identyczna: stats.stackexchange.com/a/126225/7071

— Dimitriy V.

To pytanie wydaje się być nie na temat, ponieważ dotyczy wyjaśnienia wyniku R bez jakiejkolwiek formy inteligentnego pytania. To jest kategoria „Zrzucam tam dane wyjściowe z komputera, a ty przeprowadzasz dla mnie analizę statystyk” ...

— Xi'an,

Wydaje się, że parametr dyspersji wskazuje na pewne problemy z modelem. Być może powinieneś rozważyć użycie zamiast tego quasipoissona. Założę się, że twoje oszacowania parametrów drastycznie się zmienią, podobnie jak interpretacja. Jeśli uruchomisz „wykres (model)”, dostaniesz kilka wykresów swoich pozostałości, spójrz na te wykresy w poszukiwaniu niepożądanych wzorów, zanim zaczniesz interpretować swój rzeczywisty model. Aby szybko wykreślić dopasowanie modelu, możesz także użyć „visreg (modelfit)” z pakietu visreg

— Robbie,

@ Xi'an, chociaż pytanie jest rzadkie i wymagało edycji, nie sądzę, aby było nie na temat. Zastanów się nad tymi pytaniami, które nie są uważane za nie na temat: Interpretacja wyniku lm () R i Interpretacja wyniku R dla regresji dwumianowej . Wygląda jednak na duplikat .

— gung - Przywróć Monikę

Jest to duplikat Jak interpretować współczynniki w regresji Poissona? Przeczytaj połączony wątek. Jeśli po przeczytaniu nadal masz pytanie, wróć tutaj i edytuj swoje pytanie, aby powiedzieć, czego się nauczyłeś i co musisz wiedzieć, możemy dostarczyć potrzebnych informacji bez kopiowania materiałów w innym miejscu, które już nie pomogły ty.

— gung - Przywróć Monikę

Odpowiedzi:

Nie sądzę, aby tytuł twojego pytania dokładnie oddawał to, o co prosisz.

Pytanie, jak interpretować parametry w GLM, jest bardzo szerokie, ponieważ GLM jest bardzo szeroką klasą modeli. Przypomnijmy, że GLM modeluje zmienną odpowiedzi która zakłada się, że podąża za znanym rozkładem z rodziny wykładniczej i że wybraliśmy funkcję odwracalną taką, że $y$ $g$ dla zmiennych predykcyjnych . W tym modelu, interpretację żadnego konkretnego parametru jest szybkość zmiany względem . Zdefiniuj

E [y | x] = g^{- 1} (x_{0} + x_{1} β_{1} + \dots + x_{J} β_{J})

$\mathrm{E}\left[y\,|\,x\right] = g^{-1}{\left(x_0 + x_1\beta_1 + \dots + x_J\beta_J\right)}$

J

$J$

x

$x$

β_{j}

$\beta_j$

g (y)

$g(y)$

x_{j}

$x_j$

aby utrzymać czystość zapisu. Następnie dla dowolnego

μ \equiv E [y | x] = g^{- 1} (x)

$\mu \equiv \mathrm{E}{\left[y\,|\,x\right]} = g^{-1}{\left(x\right)}$

η \equiv x \cdot β

$\eta \equiv x \cdot \beta$

j \in {1, \dots, J}

$j \in \{1,\dots,J\}$

Teraz określenie

być wektora

zera i pojedynczy

-tego położenia tak, że na przykład w przypadku

, a następnie

. Następnie

β_{j} = \frac{\partial η}{\partial x_{j}} = \frac{\partial g (μ)}{\partial x_{j}} .

$\beta_j = \frac{\partial\,\eta}{\partial\,x_j} = \frac{\partial\,g(\mu)}{\partial\,x_j} \text{.}$

e_{j}

$\mathfrak{e}_j$

J - 1

$J-1$

1

$1$

j

$j$

J = 5

$J=5$

e_{3} = (0, 0, 1, 0, 0)

$\mathfrak{e}_3 = \left(0,0,1,0,0\right)$

β_{j} = g (E [y | x + e_{j}]) - g (E [y | x])

$\beta_j = g{\left(\mathrm{E}{\left[y\,|\,x + \mathfrak{e}_j \right]}\right)} - g{\left(\mathrm{E}{\left[y\,|\,x\right]}\right)}$

$\beta_j$ $\eta$ $x_j$

\frac{\partial E [y | x]}{\partial x_{j}} = \frac{\partial μ}{\partial x_{j}} = \frac{d μ}{d η} \frac{\partial η}{\partial x_{j}} = \frac{\partial μ}{\partial η} β_{j} = \frac{d g^{- 1}}{d η} β_{j}

$\frac{\operatorname{\partial}\mathrm{E}{\left[y\,|\,x\right]}}{\operatorname{\partial}x_j} = \frac{\operatorname{\partial}\mu}{\operatorname{\partial}x_j} = \frac{\operatorname{d}\mu}{\operatorname{d}\eta}\frac{\operatorname{\partial}\eta}{\operatorname{\partial}x_j} = \frac{\operatorname{\partial}\mu}{\operatorname{\partial}\eta} \beta_j = \frac{\operatorname{d}g^{-1}}{\operatorname{d}\eta} \beta_j$

E [y | x + e_{j}] - E [y | x] \equiv Δ_{j} \hat{y} = g^{- 1} ((x + e_{j}) β) - g^{- 1} (x β)

$\mathrm{E}{\left[y\,|\,x + \mathfrak{e}_j \right]} - \mathrm{E}{\left[y\,|\,x\right]} \equiv \operatorname{\Delta_j} \hat y = g^{-1}{\left( \left(x + \mathfrak{e}_j\right)\beta \right)} - g^{-1}{\left( x\,\beta \right)}$

$g$ $\beta_j$ $\eta$ $y$ $x_j$ $y$ $x_j$ $g^{-1}{\left(\beta\right)}$

$y \sim \mathrm{Poisson}{\left(\lambda\right)}$ $g = \ln$

$\frac{\operatorname{\partial}\mu}{\operatorname{\partial}x_j} = \frac{\operatorname{d}g^{-1}}{\operatorname{d}\eta} \beta_j$ $g(\mu) = \ln(\mu)$ $g^{-1}(\eta) = e^\eta$ $\frac{\operatorname{d}e^\eta}{\operatorname{d}\eta} = e^\eta$

\frac{\partial μ}{\partial x_{j}} = \frac{\partial E [y | x]}{\partial x_{j}} = e^{x_{0} + x_{1} β_{1} + \dots + x_{J} β_{J}} β_{j}

$\frac{\operatorname{\partial}\mu}{\operatorname{\partial}x_j} = \frac{\operatorname{\partial}\mathrm{E}{\left[y\,|\,x\right]}}{\operatorname{\partial}x_j} = e^{x_0 + x_1\beta_1 + \dots + x_J\beta_J}\beta_j$

co w końcu oznacza coś namacalnego:

$x_j$ $\hat y$ $\hat y\,\beta_j$

Uwaga: to przybliżenie może faktycznie działać dla zmian tak dużych jak 0,2, w zależności od wymaganej precyzji.

\begin{aligned} Δ_{j} \hat{y} & = e^{x_{0} + x_{1} β_{1} + \dots + (x_{j} + 1) β_{j} + \dots + x_{J} β_{J}} - e^{x_{0} + x_{1} β_{1} + \dots + x_{J} β_{J}} \\ = e^{x_{0} + x_{1} β_{1} + \dots + x_{J} β_{J} + β_{j}} - e^{x_{0} + x_{1} β_{1} + \dots + x_{J} β_{J}} \\ = e^{x_{0} + x_{1} β_{1} + \dots + x_{J} β_{J}} e_{j}^{β} - e^{x_{0} + x_{1} β_{1} + \dots + x_{J} β_{J}} \\ = e^{x_{0} + x_{1} β_{1} + \dots + x_{J} β_{J}} (e_{j}^{β} - 1) \end{aligned}

$\begin{align} \operatorname{\Delta_j} \hat y &= e^{ x_0 + x_1\beta_1 + \dots + \left(x_j + 1\right)\,\beta_j + \dots + x_J\beta_J } - e^{x_0 + x_1\beta_1 + \dots + x_J\beta_J} \\ &= e^{ x_0 + x_1\beta_1 + \dots + x_J\beta_J + \beta_j} - e^{x_0 + x_1\beta_1 + \dots + x_J\beta_J} \\ &= e^{ x_0 + x_1\beta_1 + \dots + x_J\beta_J}e^\beta_j - e^{x_0 + x_1\beta_1 + \dots + x_J\beta_J} \\ &= e^{ x_0 + x_1\beta_1 + \dots + x_J\beta_J} \left( e^\beta_j - 1 \right) \end{align}$

$x_j$ $\hat y$ $\hat y \left( e^\beta_j - 1 \right)$

Należy tu zwrócić uwagę na trzy ważne elementy:

Efekt zmiany predyktorów zależy od poziomu odpowiedzi.
Addytywna zmiana predyktorów ma multiplikatywny wpływ na odpowiedź.
Nie możesz zinterpretować współczynników po prostu przez ich odczytanie (chyba że możesz obliczyć dowolne wykładnicze w twojej głowie).

$\ln \hat y$ $\hat y \left( e^{0.09} - 1 \right)$ $\hat y$ $e^{0.09} \approx 1.09$

— Shadowtalker
źródło

Dokonałem tutaj kilku poprawek, @ssdecontrol. Myślę, że ułatwią śledzenie twojego posta, ale jeśli ci się nie podoba, cofnij je z moimi przeprosinami.

— gung - Przywróć Monikę

Nie potrafię tego rozgryźć na podstawie mojej odpowiedzi, więc oczywiście muszę zmienić odpowiedź. Nadal jesteś zdezorientowany?

— shadowtalker,

Podłącz te liczby do równania, tak jak w regresji liniowej

— shadowtalker

E [y | x]

$E[y|x]$

x

$x$

y

$y$

x

$x$

j

$j$

x_{j}

$x_j$

I nie przemyśl tego. Kiedy zrozumiesz wszystkie elementy w GLM, manipulacje tutaj są tylko bezpośrednim zastosowaniem zasad rachunku różniczkowego. To naprawdę jest tak proste, jak pobranie pochodnej w odniesieniu do zmiennej, którą jesteś zainteresowany.

— shadowtalker

Moją sugestią byłoby utworzenie małej siatki składającej się z kombinacji dwóch rzek i dwóch lub trzech wartości każdej z zmiennych towarzyszących, a następnie użycie tej predictfunkcji z siatką jako newdata. Następnie wykreślić wyniki. O wiele łatwiej jest spojrzeć na wartości, które model faktycznie przewiduje. Możesz, ale nie chcesz, przekształcić prognozy do pierwotnej skali pomiaru ( type = "response").

— Russ Lenth
źródło

Chociaż bardzo podoba mi się to podejście (robię to cały czas), myślę, że jest to bezproduktywne dla budowania zrozumienia.

— shadowtalker,