Próbuję poradzić sobie z analizą czasu do zdarzenia z wykorzystaniem powtarzających się wyników binarnych. Załóżmy, że czas do zdarzenia mierzony jest w dniach, ale na razie dyskretujemy czas do tygodni. Chcę aproksymować estymator Kaplana-Meiera (ale uwzględniać zmienne towarzyszące) przy użyciu powtarzanych wyników binarnych. Wydaje się, że jest to droga okrężna, ale badam, w jaki sposób obejmuje to zwykłe wyniki i powtarzające się wydarzenia.
Jeśli utworzysz sekwencję binarną, która wygląda jak 000 dla osoby ocenzurowanej przy 3 tygodniach, 0000 dla osoby ocenzurowanej przy 4 w, i 0000111111111111 .... dla podmiotu, który uległ awarii przy 5 w (1s rozciągają się do punktu, w którym ostatni temat był a następnie w badaniu), gdy obliczasz proporcje 1s dla konkretnego tygodnia, możesz uzyskać zwykłe skumulowane przypadki (aż dojdziesz do zmiennych czasów cenzury, gdzie to tylko przybliża, ale nie równa szacunkowej skumulowanej częstości występowania Kaplana-Meiera).
Potrafię dopasować powtarzane obserwacje binarne za pomocą binarnego modelu logistycznego za pomocą GEE, zamiast rozróżniać czas jak wyżej, ale zamiast tego używać splajnu w czasie. Estymator kowariancji kanapkowej klastra działa dość dobrze. Ale chciałbym uzyskać dokładniejsze wnioskowanie za pomocą modelu efektów mieszanych. Problem polega na tym, że 1 po pierwszej 1 są zbędne. Czy ktoś zna sposób określania efektów losowych lub model uwzględniający nadmiarowości, aby standardowe błędy nie były deflowane?
Zauważ, że ta konfiguracja różni się od Efrona, ponieważ używał modeli logistycznych do oszacowania prawdopodobieństw warunkowych w zestawach ryzyka. Szacuję bezwarunkowe prawdopodobieństwo.
GLMMadaptive
Pakiet wygląda wspaniale dla bardziej ogólnej konfiguracji.