Analiza przeżycia: czas ciągły vs dyskretny


20

Nie jestem pewien, jak zdecydować, czy traktować czas jako ciągły czy dyskretny w analizie przeżycia. W szczególności chcę użyć analizy przeżycia, aby zidentyfikować zmienne na poziomie dziecka i gospodarstwa domowego, które mają największą rozbieżność w ich wpływie na przeżycie chłopców i dziewcząt (do 5 roku życia). Mam zestaw danych dotyczących wieku dzieci (w miesiącach) wraz ze wskaźnikiem, czy dziecko żyje, wieku w chwili śmierci (w miesiącach) oraz innych zmiennych na poziomie dziecka i gospodarstwa domowego.

Ponieważ czas jest rejestrowany w miesiącach, a wszystkie dzieci mają mniej niż 5 lat, istnieje wiele powiązanych czasów przeżycia (często w odstępach półrocznych: 0mos, 6mos, 12mos itp.). Na podstawie tego, co przeczytałem o analizie przeżycia, mając wiele powiązanych czasów przeżycia, myślę, że powinienem traktować czas jako dyskretny. Przeczytałem jednak kilka innych badań, w których czas przeżycia przypada na przykład na osobolat (a więc na pewno istnieją powiązane czasy przeżycia) i stosowane są metody ciągłego czasu, takie jak proporcjonalne zagrożenia Coxa.

Jakie kryteria powinienem zastosować, aby zdecydować, czy traktować czas jako ciągły czy dyskretny? Jeśli chodzi o moje dane i pytania, zastosowanie jakiegoś modelu ciągłego czasu (Cox, Weibull itp.) Ma dla mnie intuicyjny sens, ale dyskretna natura moich danych i ilość powiązanych czasów przeżycia wydają się sugerować inaczej.

Odpowiedzi:


10

Wybierając model przeżycia, należy kierować się podstawowym zjawiskiem. W tym przypadku wydaje się ciągły, nawet jeśli dane są gromadzone w nieco dyskretny sposób. Rozdzielczość jednego miesiąca byłaby w porządku w ciągu 5 lat. Jednak duża liczba remisów w wieku 6 i 12 miesięcy sprawia, że ​​można się dziwić, że naprawdę masz dokładność na 1 miesiąc (spodziewane są remisy na poziomie 0 - jest to specjalna wartość, w której faktycznie zdarza się stosunkowo dużo zgonów). Nie jestem do końca pewien, co możesz z tym zrobić, ponieważ najprawdopodobniej odzwierciedla to zaokrąglanie po fakcie, a nie cenzurowanie interwałów.


2
Zgodnie z ogólną zasadą, jeśli dyskretne dane można podzielić na dziesięć lub więcej części, można je traktować jako ciągłe, nawet jeśli są one naprawdę dyskretne (pobieranie próbek raz w miesiącu przez sześć miesięcy różni się znacznie od pobierania próbek co tydzień przez sześć miesięcy lub raz w miesiącu przez dwa lata). Poniższy artykuł zawiera również pewne dodatkowe spostrzeżenia do obróbki danych dyskretnych jako ciągły: theanalysisfactor.com/count-data-considered-continuous
Tavrock

4

Podejrzewam, że jeśli użyjesz modeli czasu ciągłego, będziesz chciał zastosować cenzurę interwałową, odzwierciedlającą fakt, że nie znasz dokładnego czasu awarii, tylko przedział, w którym wystąpiła awaria. Jeśli dopasujesz modele regresji parametrycznej z cenzurą przedziałową z maksymalnym prawdopodobieństwem, związane z tym czasy przeżycia nie stanowią problemu IIRC.


4

W większości analiz będą związane czasy przetrwania, ale duże, wyraźne fragmenty więzi w poszczególnych wydarzeniach są niepokojące. Zastanawiałbym się długo nad samym badaniem, w jaki sposób gromadzi dane itp.

Ponieważ poza niektórymi metodologicznymi potrzebami wykorzystania jednego lub drugiego rodzaju czasu, sposób modelowania przeżycia powinien zależeć od tego, czy podstawowy proces jest dyskretny czy ciągły na świecie.


1

Jeśli masz zmienne towarzyszące, które zmieniają się w czasie dla niektórych osób (np. Dochód rodziny może różnić się w twoim przykładzie w ciągu życia dziecka), modele przeżycia (parametryczny i model Coxa) wymagają podzielenia danych na dyskretne przedziały określone przez różne zmienne towarzyszące.

Uważam, że ten pdf notatek z wykładów niemieckiego Rodrigueza był pomocny.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.