Będę różnicować analizy za pomocą modelu na podstawie solidnych błędów standardowych, odnosząc się do tych ostatnich jako „GEE”, co w rzeczywistości jest wymienną definicją. Oprócz fantastycznego wyjaśnienia Scortchi:
GEE mogą być „tendencyjne” w małych próbkach, tj. 10–50 pacjentów: (Lipsitz, Laird i Harrington, 1990; Emrich i Piedmonte, 1992; Sharples i Breslow, 1992; Lipsitz i in., 1994; Qu, Piedmonte i Williams, 1994; Gunsolley, Getchell i Chinchilli, 1995; Sherman i le Cessie, 1997.) Kiedy mówię, że GEE są stronnicze, mam na myśli to, że standardowe oszacowanie błędu może być zachowawcze lub antykonserwatywne z powodu małej lub zerowej liczby komórek , w zależności od tego, które dopasowane wartości wykazują takie zachowanie i jak są one zgodne z ogólnym trendem modelu regresji.
Zasadniczo, gdy model parametryczny jest poprawnie określony, nadal otrzymujesz prawidłowe standardowe szacunki błędów z CI opartych na modelu, ale cały sens używania GEE polega na uwzględnieniu tego bardzo dużego „jeśli”. GEE pozwalają statystykowi jedynie określić działający model prawdopodobieństwa danych, a parametry (zamiast interpretować je w ściśle parametrycznym układzie) są uważane za rodzaj „sita”, który może generować powtarzalne wartości bez względu na leżące u ich podstaw, nieznane generowanie danych mechanizm. To serce i dusza analizy półparametrycznej, której przykładem jest GEE.
GEE obsługują również niezmierzone źródła kowariancji danych, nawet ze specyfikacją niezależnej macierzy korelacji. Wynika to z zastosowania raczej empirycznej niż opartej na modelu macierzy kowariancji. Na przykład w modelowaniu Poissona możesz być zainteresowany współczynnikiem dzietności łososia pobranego z różnych strumieni. Komórki jajowe zebrane od samic ryb mogą mieć podstawowy rozkład Poissona, ale zmienność genetyczna, która obejmuje wspólną dziedziczność i dostępne zasoby w określonych strumieniach, może sprawić, że ryby w tych strumieniach będą bardziej podobne niż wśród innych strumieni. GEE poda prawidłowe szacunkowe standardowe błędy populacyjne, o ile częstotliwość próbkowania jest zgodna z ich proporcją populacyjną (lub w inny sposób stratyfikowana).