Jak zinterpretować wynik prognozy.coxph?

Po dopasowaniu modelu koxmodelu możliwe jest przewidywanie i wyszukiwanie względnego ryzyka nowych danych. Nie rozumiem, w jaki sposób obliczane jest ryzyko względne dla osoby i do czego jest ono powiązane (tj. Średnia populacji)? Wszelkie zalecenia dotyczące zasobów, które pomogą zrozumieć (nie jestem bardzo zaawansowany w analizie przeżycia, więc im prościej, tym lepiej)?

predictive-models relative-risk cox-model

— użytkownik4673
źródło

predict.coxph()oblicza współczynnik ryzyka w stosunku do średniej próbki dla wszystkich zmiennych predykcyjnych . Czynniki są jak zwykle konwertowane na fałszywe predyktory, których średnią można obliczyć. Przypomnijmy, że model PH Coxa jest modelem liniowym dla log-hazardu : $p$ $\ln h(t)$

\ln h (t) = \ln h_{0} (t) + β_{1} X_{1} + \dots + β_{p} X_{p} = \ln h_{0} (t) + X β

$\ln h(t) = \ln h_{0}(t) + \beta_{1} X_{1} + \dots + \beta_{p} X_{p} = \ln h_{0}(t) + \bf{X} \bf{\beta}$

Gdzie jest nieokreślonym ryzykiem odniesienia. Równoważnie, zagrożenie modeluje się jako . Współczynnik ryzyka między dwiema osobami i z wartościami predyktora $h_{0}(t)$ $h(t)$ $h(t) = h_{0}(t) \cdot e^{\beta_{1} X_{1} + \dots + \beta_{p} X_{p}} = h_{0}(t) \cdot e^{\bf{X} \bf{\beta}}$ $i$ $i'$ i są zatem niezależne od podstawowego zagrożenia i niezależne od czasu: $\bf{X}_{i}$ $\bf{X}_{i'}$ $t$

\frac{h_{i} (t)}{h_{i^{'}} (t)} = \frac{h_{0} (t) \cdot e^{X_{i} β}}{h_{0} (t) \cdot e^{X_{i^{'}} β}} = \frac{e^{X_{i} β}}{e^{X_{i^{'}} β}}

$\frac{h_{i}(t)}{h_{i'}(t)} = \frac{h_{0}(t) \cdot e^{\bf{X}_{i} \bf{\beta}}}{h_{0}(t) \cdot e^{\bf{X}_{i'} \bf{\beta}}} = \frac{e^{\bf{X}_{i} \bf{\beta}}}{e^{\bf{X}_{i'} \bf{\beta}}}$

Dla stosunku szacunkowa zagrożenia między osobami i , po prostu podłącz oszacowań współczynników dla , dając i . $i$ $i'$ $b_{1}, \ldots, b_{p}$ $\beta_{1}, \ldots, \beta_{p}$ $e^{\bf{X}_{i} \bf{b}}$ $e^{\bf{X}_{i'} \bf{b}}$

Jako przykład w R używam danych z dodatku Johna Foxa na modelu Cox-PH, który zapewnia bardzo ładny tekst wprowadzający. Najpierw pobieramy dane i budujemy prosty model Cox-PH dla czasu aresztowania uwolnionych więźniów ( fin: czynnik - otrzymano pomoc finansową z kodowaniem pozorowanym "no"-> 0, "yes"-> 1 age,: wiek w momencie uwolnienia, prio: liczba wcześniejszych wyroków skazujących):

> URL   <- "http://socserv.mcmaster.ca/jfox/Books/Companion/data/Rossi.txt"
> Rossi <- read.table(URL, header=TRUE)                  # our data
> Rossi[1:3, c("week", "arrest", "fin", "age", "prio")]  # looks like this
  week arrest fin age prio
1   20      1  no  27    3
2   17      1  no  18    8
3   25      1  no  19   13

> library(survival)                                      # for coxph()    
> fitCPH <- coxph(Surv(week, arrest) ~ fin + age + prio, data=Rossi)    # Cox-PH model
> (coefCPH <- coef(fitCPH))                              # estimated coefficients
     finyes         age        prio 
-0.34695446 -0.06710533  0.09689320

Teraz podłączamy średnie przykładowe dla naszych predyktorów do wzoru : $e^{\bf{X} \bf{b}}$

meanFin  <- mean(as.numeric(Rossi$fin) - 1)   # average of financial aid dummy
    meanAge  <- mean(Rossi$age)                   # average age
meanPrio <- mean(Rossi$prio)                  # average number of prior convictions
rMean <- exp(coefCPH["finyes"]*meanFin        # e^Xb
           + coefCPH["age"]   *meanAge
           + coefCPH["prio"]  *meanPrio)

Teraz podłączamy wartości predykcyjne pierwszych 4 osób do wzoru . $e^{\bf{X} \bf{b}}$

r1234 <- exp(coefCPH["finyes"]*(as.numeric(Rossi[1:4, "fin"])-1)
           + coefCPH["age"]   *Rossi[1:4, "age"]
           + coefCPH["prio"]  *Rossi[1:4, "prio"])

Teraz obliczyć względne ryzyko dla pierwszych 4 osób w stosunku do średniej próbki i porównać z wynikami predict.coxph().

> r1234 / rMean
[1] 1.0139038 3.0108488 4.5703176 0.7722002

> relRisk <- predict(fitCPH, Rossi, type="risk")   # relative risk
> relRisk[1:4]
        1         2         3         4 
1.0139038 3.0108488 4.5703176 0.7722002

Jeśli masz model warstwowy, porównanie predict.coxph()jest w stosunku do średnich warstw, można to kontrolować za pomocą referenceopcji opisanej na stronie pomocy.

— karakal
źródło

+1, ponieważ nie jest oczywiste, aby uzyskać dokładnie to, co prognozuje. Coxph ze strony pomocy!

— ocram

to było świetne! Bardzo prosty do zrozumienia!

— user4673,

meanFin <- mean(as.numeric(Rossi$fin) - 1)nie ma większego sensu, ponieważ finjest kategoryczny. Nie musisz modeFin <- get_Mode(Rossi$fin)w tym przypadku?

— Zhubarb

@Zhubarb finjest binarny, więc numeryczna reprezentacja współczynnika ma po prostu wartości 1 i 2. Odjęcie 1 daje nam zmienną kodowaną obojętnie o wartościach 0 i 1, która również pojawia się w macierzy obliczeniowej. Pamiętaj, że to nie zadziała w przypadku czynników z więcej niż 2 poziomami. Z pewnością można dyskutować, czy uśrednianie zmiennych zastępczych ma sens, ale właśnie to predict.coxph()robi.

— caracal

Innymi słowy, jak interpretowałbyś współczynnik ryzyka na poziomie 3,01 (np. RelRisk [2])?

— RNB