Główny problem ze statystykami takimi jak model Coxa R2)(opisane w innej odpowiedzi) jest to, że jest to bardzo zależne od dystrybucji cenzury twoich danych. Inne naturalne rzeczy, na które możesz spojrzeć, takie jak stosunek prawdopodobieństwa do modelu zerowego, również mają ten problem. (Zasadniczo jest to spowodowane tym, że udział ocenzurowanego punktu danych w prawdopodobieństwie jest bardzo różny od udziału punktu danych, w którym obserwowane jest zdarzenie, ponieważ jeden z nich pochodzi z pliku PDF, a drugi z CDF.) Różni badacze mają proponowane sposoby obejścia tego, ale te, które widziałem zwykle wymagają posiadania modelu dystrybucji cenzury lub czegoś równie niepraktycznego. Nie zastanawiałem się, jak zła jest ta zależność w praktyce, więc jeśli twoja cenzura jest dość łagodna, nadal możesz spojrzeć na statystyki oparte na ilorazie prawdopodobieństwa. W przypadku modeli CART typu survival,
W przypadku ogólnych modeli przeżycia jedną często używaną statystyką jest indeks c Harrella , analogiczny do współczynnika Kendallaτlub ROC AUC dla modeli przeżycia. Zasadniczo c jest proporcją, spośród wszystkich przypadków, w których wiadomo, że w jednym wystąpieniu wystąpiło zdarzenie później niż w drugim, że model plasuje się poprawnie. (Innymi słowy, aby para przykładów mogła zostać tutaj uwzględniona w mianowniku, co najwyżej jedna może zostać ocenzurowana i musi zostać ocenzurowana po tym, jak inne zdarzyło się wydarzenie). Indeks c zależy również od rozkładu cenzury, ale według Harrella zależność jest łagodniejsza niż w przypadku innych statystyk, o których wspomniałem powyżej. Niestety Harrell's cjest również mniej wrażliwy niż powyższe statystyki, więc możesz nie chcieć wybierać między modelami opartymi na nim, jeśli różnica między nimi jest niewielka; jest bardziej przydatny jako interpretowalny wskaźnik ogólnej wydajności niż sposób porównywania różnych modeli.
(Na koniec oczywiście, jeśli masz konkretny cel dla modeli - to znaczy, jeśli wiesz, jaka jest twoja funkcja przewidywania strat - zawsze możesz je ocenić według funkcji utraty! Ale zgaduję, że nie masz tyle szczęścia ...)
Aby uzyskać bardziej dogłębną dyskusję na temat zarówno statystyki ilorazu wiarygodności, jak i c Harrella , powinieneś zapoznać się z doskonałym podręcznikiem Harrella, Strategiami modelowania regresji . Sekcja dotycząca oceny modeli przeżycia to § 19.10, s. 492–493. Przepraszam, że nie mogę udzielić jednej ostatecznej odpowiedzi, ale nie sądzę, że jest to rozwiązany problem!