Naprawiono vs efekty losowe

10

Niedawno zacząłem uczyć się o uogólnionych liniowych modelach mieszanych i używałem R do zbadania, jaką to różnicę traktuje członkostwo w grupie jako efekt stały lub losowy. W szczególności patrzę na omawiany tutaj przykładowy zestaw danych:

http://www.ats.ucla.edu/stat/mult_pkg/glmm.htm

http://www.ats.ucla.edu/stat/r/dae/melogit.htm

Jak nakreślono w tym samouczku, efekt Doctor ID jest zauważalny i spodziewałem się, że model mieszany z losowym przechwytywaniem da lepsze wyniki. Jednak porównanie wartości AIC dla dwóch metod sugeruje, że ten model jest gorszy:

> require(lme4) ; hdp = read.csv("http://www.ats.ucla.edu/stat/data/hdp.csv")
> hdp$DID = factor(hdp$DID) ; hdp$Married = factor(hdp$Married)
> GLM = glm(remission~Age+Married+IL6+DID,data=hdp,family=binomial);summary(GLM)

Call:
glm(formula = remission ~ Age + Married + IL6 + DID, family = binomial, 
data = hdp)

Deviance Residuals: 
Min       1Q   Median       3Q      Max  
-2.5265  -0.6278  -0.2272   0.5492   2.7329  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept) -1.560e+01  1.219e+03  -0.013    0.990    
Age         -5.869e-02  5.272e-03 -11.133  < 2e-16 ***
Married1     2.688e-01  6.646e-02   4.044 5.26e-05 ***
IL6         -5.550e-02  1.153e-02  -4.815 1.47e-06 ***
DID2         1.805e+01  1.219e+03   0.015    0.988    
DID3         1.932e+01  1.219e+03   0.016    0.987   

[...]

DID405       1.566e+01  1.219e+03   0.013    0.990    
DID405       1.566e+01  1.219e+03   0.013    0.990    
DID406      -2.885e-01  3.929e+03   0.000    1.000    
DID407       2.012e+01  1.219e+03   0.017    0.987    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 10353  on 8524  degrees of freedom
Residual deviance:  6436  on 8115  degrees of freedom
AIC: 7256

Number of Fisher Scoring iterations: 17


> GLMM = glmer(remission~Age+Married+IL6+(1|DID),data=hdp,family=binomial) ; m

Generalized linear mixed model fit by the Laplace approximation 
Formula: remission ~ Age + Married + IL6 + (1 | DID) 
Data: hdp 
AIC  BIC logLik deviance
7743 7778  -3867     7733
Random effects:
Groups Name        Variance Std.Dev.
DID    (Intercept) 3.8401   1.9596  
Number of obs: 8525, groups: DID, 407

Fixed effects:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept)  1.461438   0.272709   5.359 8.37e-08 ***
Age         -0.055969   0.005038 -11.109  < 2e-16 ***
Married1     0.260065   0.063736   4.080 4.50e-05 ***
IL6         -0.053288   0.011058  -4.819 1.44e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
         (Intr) Age    Marrd1
Age      -0.898              
Married1  0.070 -0.224       
IL6      -0.162  0.012 -0.033


> extractAIC(GLM) ; extractAIC(GLMM)

[1]  410.000 7255.962
[1]    5.000 7743.188

Tak więc moje pytania to:

(1) Czy właściwe jest porównanie wartości AIC zapewnianych przez dwie funkcje? Jeśli tak, to dlaczego model ze stałym efektem działa lepiej?

(2) Jaki jest najlepszy sposób ustalenia, czy ustalone lub przypadkowe efekty są ważniejsze (tj. Oszacowanie, że zmienność spowodowana przez lekarza jest ważniejsza niż charakterystyka pacjenta?

r random-effects-model glmm

— Gość333
źródło

7

Modele efektów stałych i modele efektów losowych zadają różne pytania dotyczące danych. Określenie zestawu zmiennych fikcyjnych na poziomie grupy zasadniczo kontroluje wszystkie nieobserwowane niejednorodności na poziomie grupy w średniej odpowiedzi, pozostawiając twoje oszacowania odzwierciedlające jedynie zmienność w obrębie jednostek. Modele efektów losowych zaczynają się od założenia, że istnieje metapopulacja (dowolny efekt) i że twoja próbka odzwierciedla wiele losowań z tej populacji. Zamiast więc zakotwiczać wyniki wokół przechwyceń heterogenicznych, dane zostaną wykorzystane do wyjaśnienia parametrów tego (zwykle normalnego) rozkładu, z którego rzekomo zostały wyciągnięte dane.

Często mówi się, że modele efektów stałych są dobre do wnioskowania na podstawie danych, które posiadasz, oraz że modele efektów losowych są dobre do próby wnioskowania na pewnej większej populacji, z której dane są losową próbką.

$t$

y_{i t} = α_{i} + β T_{i t} + ϵ_{i t}

$y_{it} = \alpha_i + \beta T_{it} + \epsilon_{it}$

Możesz podzielić swój termin błędu na ten składnik terminu błędu, który zmienia się w czasie i który nie:

y_{i t} = α_{i} + β T_{i t} + e_{i} + u_{i t}

$y_{it} = \alpha_i + \beta T_{it} + e_i + u_{it}$

Teraz odejmij średnią grupową z obu stron:

y_{i t} - {\bar{y}}_{i} = α_{i} - {\bar{α}}_{i} + β (T_{i t} - {\bar{T}}_{i}) + e_{i} - {\bar{e}}_{i} + u_{i t} - {\bar{u}}_{i} t

$y_{it} - \bar y_i = \alpha_i - \bar \alpha_i + \beta \left(T_{it}- \bar T_i\right) + e_i - \bar e_i+ u_{it}- \bar u_it$

$t$

$t$ $e_i$

W tym przykładzie czas jest zmienną grupującą. W twoim przykładzie jest to DID. (tj .: uogólnia)

— użytkownik_ogólny
źródło

1

1) Należy dokonać porównania, tylko nie z tymi dwoma modelami. Chciałbyś porównać:

GLM <- glm(remission~Age+Married+IL6, data=hdp, family=binomial)

z

GLMM <- glmer(remission~Age+Married+IL6+(1|DID), data=hdp, family=binomial)

i możesz to zrobić za pomocą anova:

anova(GLM, GLMM)

(Nie jestem pewien, czy to zadziała z wynikami glmi glmer, ponieważ mogą to być różne obiekty R. Może być konieczne użycie dwóch funkcji, które mają porównywalne obiekty zwrotne, takich jak lmei gls, lub sam wykonać anovę).

$\chi^2_0$ $\chi^2_1$

Dla mnie najlepszą książką do zrozumienia procesu budowania modeli zagnieżdżonych i testowania hipotez były liniowe mieszane modele Westa, Welsha i Galeckiego (2007). Praktyczny przewodnik . Przechodzą wszystko krok po kroku.

2) Jeśli masz wiele obserwacji na pacjenta, dodasz również losowy efekt dla pacjenta. Następnie, aby przetestować względne znaczenie cierpliwości w porównaniu do lekarza, możesz spojrzeć na predykcyjne skutki pacjenta w porównaniu z predykcyjnymi dla lekarza. Warunki losowych efektów dla każdego określą ilościowo wariancję między pacjentami i lekarzami, jeśli jest to pytanie, które Cię interesuje.

(Niech ktoś mnie poprawi, jeśli się mylę!)

— Christopher Poile
źródło

Nie jestem pewien, że to ma sens, aby mieć DIDjak zarówno stałą mocą, i losowo przechwycić w 2 modelach. Co więcej, posiadanie go jako efektu stałego w pierwszym modelu oznacza, że wybór b / t te 2 będzie dotyczył sposobu myślenia o efekcie DID, a nie tego, czy należy go uwzględnić. Z drugiej strony zauważam, że masz przedmiot (2); Czy chciałeś mieć gdzieś przedmiot (1)?

— gung - Przywróć Monikę

Masz całkowitą rację; Wyszedłem z oryginalnej formuły glm OP, która nie powinna mieć DID jako stałego efektu na 1. miejscu. Teraz należy wybrać, czy traktowanie DID jako efektu losowego dodaje wartości do modelu.

— Christopher Poile,

1

Modele są bardzo różne. Model glm odnosi się do ogólnego zmniejszenia dewiacji (z modelu zerowego), gdy wszystkie efekty doctorID są szacowane i przypisywane są oszacowania parametrów. Zauważasz oczywiście, że Age, Married i IL6 mają te same statystyki Walda w dwóch modelach, prawda? Rozumiem (niezbyt wyrafinowany, co przyznaję), że model mieszany traktuje doctorIDs jako czynniki lub warstwy uciążliwe, a mianowicie „efekty”, których nie można założyć, że pochodzą z określonego rozkładu rodziców. Nie widzę powodu, aby sądzić, że zastosowanie modelu mieszanego poprawiłoby twoje zrozumienie „efektu doktora”, wręcz przeciwnie.

Gdyby twoje zainteresowanie dotyczyło wieku, małżeństwa lub IL6, wyobrażałbym sobie, że nie porównywałbyś AIC między tymi dwoma modelami, a raczej różnice w AIC z usunięciem zmiennych towarzyszących w obrębie tej samej struktury modelowania.

— DWin
źródło