Próbuję użyć, lme4::glmer()
aby dopasować dwumianowy uogólniony model mieszany (GLMM) ze zmienną zależną, która nie jest binarna, ale zmienna ciągła od zera do jednego. Można myśleć o tej zmiennej jako o prawdopodobieństwie; w rzeczywistości jest to prawdopodobieństwo zgłaszane przez ludzi (w eksperymencie, który pomagam analizować). Tj. Nie jest to ułamek „dyskretny”, ale zmienna ciągła.
Moje glmer()
połączenie nie działa zgodnie z oczekiwaniami (patrz poniżej). Dlaczego? Co mogę zrobić?
Późniejsza edycja: moja odpowiedź poniżej jest bardziej ogólna niż oryginalna wersja tego pytania, więc zmodyfikowałem pytanie, aby było bardziej ogólne.
Więcej szczegółów
Najwyraźniej można zastosować regresję logistyczną nie tylko dla DV binarnych, ale także dla ciągłego DV od zera do jednego. Rzeczywiście, kiedy biegnę
glm(reportedProbability ~ a + b + c, myData, family="binomial")
Dostaję komunikat ostrzegawczy
Warning message:
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
ale bardzo rozsądne dopasowanie (wszystkie czynniki są kategoryczne, więc mogę łatwo sprawdzić, czy prognozy modelu są zbliżone do średnich między podmiotami i są).
Jednak tak naprawdę chcę użyć
glmer(reportedProbability ~ a + b + c + (1 | subject), myData, family="binomial")
Daje mi identyczne ostrzeżenie, zwraca model, ale ten model jest wyraźnie bardzo zły; oszacowania ustalonych efektów są bardzo dalekie od glm()
tych i od środków obejmujących wiele przedmiotów. (I muszę dołączyć glmerControl(optimizer="bobyqa")
do glmer
połączenia, w przeciwnym razie w ogóle się nie zbiegnie).
glmmadmb(reportedProbability ~ a + b + c + (1 | subject), myData, family="beta")
, otrzymuję prawidłowe dopasowanie i rozsądne przedziały ufności, ale ostrzeżenie o zbieżności nie powiodło się : - / Próbuję wymyślić, jak zwiększyć liczbę iteracji. Beta może dla mnie działać, ponieważ nie mam przypadków DV = 0 lub DV = 1.
+ (1 | rowid)
do mojego glitter call, co daje stabilne oszacowania i stabilne przedziały ufności, niezależnie od mojego wyboru wagi (próbowałem 100 i 500). Próbowałem także uruchomić lmer na logit (reportProbability) i otrzymuję prawie dokładnie to samo. Oba rozwiązania wydają się działać dobrze! Beta MM z glmmadmb daje również bardzo bliskie wyniki, ale z jakiegoś powodu nie zbiega się całkowicie i trwa bez końca. Zastanów się nad opublikowaniem odpowiedzi zawierającej listę tych opcji i wyjaśnienie nieco różnic i zalet / wad! (Wszystkie podane przeze mnie przedziały ufności to Wald).