Masz rację w kwestii organizacji danych. Jeśli masz takie sprawy zorganizowane:
ID M1 M2 M3 EVENT
Prawdopodobnie będziesz chciał zreorganizować dane, aby wyglądały następująco:
ID TIME EVENT
1 1 0
1 2 1
1 3 1
2 1 0
2 2 0
. . .
. . .
Nazywam to konwersją z dużego formatu na długi. Można to łatwo zrobić w R, używając reshape()
funkcji lub jeszcze łatwiej z reshape2
pakietem.
Osobiście zatrzymałbym ID
pole do jego potencjalnego zastosowania w identyfikacji źródła zmienności w modelu efektów mieszanych. Ale nie jest to konieczne (jak wskazał @BerndWeiss). Poniżej założono, że chcesz to zrobić. Jeśli nie, dopasuj podobny model glm(...,family=binomial)
bez warunków losowego efektu.
lme4
Pakiet w R zmieści się efektów mieszanych model regresji logistycznej podobny do tego mówisz, z wyjątkiem efektu losowego lub dwa, aby uwagę zmienności współczynników całej przedmiotów ( ID
). Oto przykładowy kod do dopasowania przykładowego modelu, jeśli dane są przechowywane w ramce danych o nazwie df
.
require(lme4)
ans <- glmer(EVENT ~ TIME + (1+TIME|ID), data=df, family=binomial)
Ten konkretny model pozwala na losowe zmienianie współczynników TIME
i w intercept
zależności od ID. Innymi słowy, jest to hierarchiczny liniowy mieszany model pomiarów zagnieżdżonych w osobnikach.
Alternatywna forma dyskretnego modelu historii zdarzeń czasowych dzieli się TIME
na dyskretne manekiny i pasuje do każdego z nich jako parametr. Jest to w zasadzie dyskretny przypadek modelu PH Coxa, ponieważ krzywa ryzyka nie jest ograniczona do liniowości (lub kwadratu, lub jakkolwiek można sobie wyobrazić czas transformacji). Chociaż możesz zgrupować TIME
w zarządzalny zbiór (tj. Mały) dyskretnych przedziałów czasowych, jeśli jest ich dużo.
Kolejne alternatywy obejmują przekształcanie czasu w celu uzyskania właściwej krzywej zagrożenia. Poprzednia metoda zasadniczo zwalnia cię z konieczności robienia tego, ale poprzednia metoda jest mniej oszczędna niż ta (i oryginalny liniowy przypadek, który przedstawiłem), ponieważ możesz mieć wiele punktów czasowych, a tym samym wiele uciążliwych parametrów.
Doskonałym odniesieniem na ten temat jest Judith Singer's and John Willet's Applied Longitudinal Data Analysis: Modeling Change and Event Event .
self-study
tag.)