Robię regresję proporcjonalną hazardu Coxa przy użyciu R coxph
, która obejmuje wiele zmiennych. Resztki Martingale wyglądają świetnie, a reszty Schoenfelda są świetne dla PRAWIE wszystkich zmiennych. Istnieją trzy zmienne, których reszty Schoenfelda nie są płaskie, a charakter zmiennych jest taki, że ma sens, że mogą się zmieniać w czasie.
Są to zmienne, które tak naprawdę mnie nie interesują, więc tworzenie ich warstw byłoby w porządku. Jednak wszystkie z nich są zmiennymi ciągłymi, a nie zmiennymi kategorialnymi. Uważam więc, że warstwy nie są realną trasą *. Próbowałem budować interakcje między zmiennymi a czasem, jak opisano tutaj , ale otrzymujemy błąd:
In fitter(X, Y, strats, offset, init, control, weights = weights, :
Ran out of iterations and did not converge
Pracuję z prawie 1000 punktów danych i pracuję z pół tuzinem zmiennych z wieloma czynnikami, więc wydaje mi się, że przekraczamy granice tego, jak te dane można kroić i kroić w kostkę. Niestety, wszystkie prostsze modele, które wypróbowałem przy mniejszej liczbie zmiennych, są wyraźnie gorsze (np. Reszty Schoenfelda są bardziej kruche dla większej liczby zmiennych).
Jakie są moje opcje? Ponieważ nie dbam o te szczególnie źle zachowane zmienne, chciałbym po prostu zignorować ich wyniki, ale podejrzewam, że to nie jest poprawna interpretacja!
* Jeden jest ciągły, jeden jest liczbą całkowitą o zakresie ponad 100, a drugi jest liczbą całkowitą o zakresie 6. Może binning?