Użyj GEE, jeśli chcesz odkryć średni efekt populacyjny zmiennej towarzyszącej w porównaniu z efektem indywidualnym. Te dwie rzeczy są równoważne tylko w modelach liniowych, ale nie w nieliniowych (np. Logistycznych). Aby to zobaczyć, weźmy na przykład model logistyczny efektów losowych -tej obserwacji -tego podmiotu, ;jotjaYI j
log( pI j1 - pI j) =μ+ ηja
gdzie jest efekt losowy przedmiotowi i .ηja∼ N.( 0 , σ2))japI j= P( YI j= 1 | ηja)
Jeśli użyjesz modelu losowych efektów na tych danych, uzyskasz szacunkową wartość która uwzględnia fakt, że dla każdej osoby zastosowano średnie zerowe zaburzenie o rozkładzie normalnym, co czyni ją indywidualną.μ
Jeśli użyjesz GEE do tych danych, oszacujesz średnie dzienne szanse na rejestrację. W tym przypadku tak by było
ν=log⎛⎝⎜Eη(11+e−μ−ηi)1−Eη(11+e−μ−ηi)⎞⎠⎟
ν≠μ , ogólnie. Na przykład, jeśli i , to . Chociaż efekty losowe mają średnie zero na przekształconej (lub połączonej ) skali, ich wpływ nie jest równy zeru na oryginalnej skali danych. Spróbuj symulować niektóre dane z modelu regresji logistycznej z efektami mieszanymi i porównać średnią poziomu populacji z odwrotnym logitem przechwytywania, a zobaczysz, że nie są one równe, jak w tym przykładzie. Ta różnica w interpretacji współczynników stanowi podstawową różnicę między GEE a modelami efektów losowych .μ=1σ2=1ν≈.83
Edycja: Ogólnie model efektów mieszanych bez predyktorów można zapisać jako
ψ(E(Yij|ηi))=μ+ηi
gdzie jest funkcją łącza. Kiedy tylkoψ
ψ(Eη(ψ−1(E(Yij|ηi))))≠Eη(E(Yij|ηi))
będzie różnica między średnimi współczynnikami populacji (GEE) a poszczególnymi współczynnikami specyficznymi (modele efektów losowych). Oznacza to, że średnie zmieniają się przez przekształcenie danych, zintegrowanie losowych efektów na przekształconej skali, a następnie przekształcenie z powrotem. Zauważ, że w modelu liniowym (tj. ) równość obowiązuje, więc są równoważne.ψ(x)=x
Edycja 2: Warto również zauważyć, że „solidne” standardowe błędy typu sandwich generowane przez model GEE zapewniają prawidłowe asymptotyczne przedziały ufności (np. Faktycznie zajmują 95% czasu), nawet jeśli określona w modelu struktura korelacji nie jest poprawny.
Edycja 3: Jeśli interesuje Cię zrozumienie struktury asocjacji w danych, szacunki GEE powiązań są notorycznie nieefektywne (a czasem niespójne). Widziałem odniesienie do tego, ale nie mogę go teraz umieścić.