Masz rację w kwestii organizacji danych. Jeśli masz takie sprawy zorganizowane:
ID M1 M2 M3 EVENT
Prawdopodobnie będziesz chciał zreorganizować dane, aby wyglądały następująco:
ID TIME EVENT
1 1 0
1 2 1
1 3 1
2 1 0
2 2 0
. . .
. . .
Nazywam to konwersją z dużego formatu na długi. Można to łatwo zrobić w R, używając reshape()funkcji lub jeszcze łatwiej z reshape2pakietem.
Osobiście zatrzymałbym IDpole do jego potencjalnego zastosowania w identyfikacji źródła zmienności w modelu efektów mieszanych. Ale nie jest to konieczne (jak wskazał @BerndWeiss). Poniżej założono, że chcesz to zrobić. Jeśli nie, dopasuj podobny model glm(...,family=binomial)bez warunków losowego efektu.
lme4Pakiet w R zmieści się efektów mieszanych model regresji logistycznej podobny do tego mówisz, z wyjątkiem efektu losowego lub dwa, aby uwagę zmienności współczynników całej przedmiotów ( ID). Oto przykładowy kod do dopasowania przykładowego modelu, jeśli dane są przechowywane w ramce danych o nazwie df.
require(lme4)
ans <- glmer(EVENT ~ TIME + (1+TIME|ID), data=df, family=binomial)
Ten konkretny model pozwala na losowe zmienianie współczynników TIMEi w interceptzależności od ID. Innymi słowy, jest to hierarchiczny liniowy mieszany model pomiarów zagnieżdżonych w osobnikach.
Alternatywna forma dyskretnego modelu historii zdarzeń czasowych dzieli się TIMEna dyskretne manekiny i pasuje do każdego z nich jako parametr. Jest to w zasadzie dyskretny przypadek modelu PH Coxa, ponieważ krzywa ryzyka nie jest ograniczona do liniowości (lub kwadratu, lub jakkolwiek można sobie wyobrazić czas transformacji). Chociaż możesz zgrupować TIMEw zarządzalny zbiór (tj. Mały) dyskretnych przedziałów czasowych, jeśli jest ich dużo.
Kolejne alternatywy obejmują przekształcanie czasu w celu uzyskania właściwej krzywej zagrożenia. Poprzednia metoda zasadniczo zwalnia cię z konieczności robienia tego, ale poprzednia metoda jest mniej oszczędna niż ta (i oryginalny liniowy przypadek, który przedstawiłem), ponieważ możesz mieć wiele punktów czasowych, a tym samym wiele uciążliwych parametrów.
Doskonałym odniesieniem na ten temat jest Judith Singer's and John Willet's Applied Longitudinal Data Analysis: Modeling Change and Event Event .
self-studytag.)