Model proporcjonalnego hazardu Coxa i interpretacja współczynników, gdy występuje interakcja wyższych przypadków

Oto podsumowanie wyników modelu Coxpha, którego użyłem (użyłem R, a wynik jest oparty na najlepszym modelu końcowym, tj. Uwzględniono wszystkie istotne zmienne objaśniające i ich interakcje):

 coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 + 
Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1)

n = 555

               coef         exp(coef)          se(coef)      z           Pr(>|z|)     
LT             9.302e+02      Inf             2.822e+02    3.297        0.000979 *** 
Food           3.397e+03      Inf             1.023e+03    3.321        0.000896 *** 
Temp2          5.016e+03      Inf             1.522e+03    3.296        0.000979 *** 
LT:Food        -2.250e+02    1.950e-98        6.807e+01    -3.305       0.000949 *** 
LT:Temp2       -3.327e+02    3.352e-145       1.013e+02    -3.284       0.001022 ** 
Food:Temp2     -1.212e+03    0.000e+00        3.666e+02    -3.307       0.000942 *** 
LT:Food:Temp2   8.046e+01    8.815e+34        2.442e+01     3.295       0.000986 *** 
--- 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Rsquare= 0.123   (max possible= 0.858 ) 
Likelihood ratio test= 72.91  on 7 df,   p=3.811e-13 
Wald test            = 55.79  on 7 df,   p=1.042e-09 
Score (logrank) test = 78.57  on 7 df,   p=2.687e-14

Pytaniem jest:

Jak interpretować wartości współczynników i exp (cef) w tym przypadku, ponieważ są to bardzo duże wartości? W grę wchodzi również interakcja 3 przypadków, co bardziej myli interpretację.

Wszystkie przykłady dotyczące modelu Coxpha, które do tej pory znalazłem w Internecie, były bardzo proste w odniesieniu do terminów interakcji (które zawsze okazały się nieistotne), a także wartości współczynników (= wskaźniki ryzyka) i ich wykładniczych (= współczynniki ryzyka) były dość małe i „łatwe w obsłudze” liczby, np. współczynnik = 1,73 -> exp (coef) = 5,64. ALE moje są znacznie większymi liczbami, jak widać z podsumowania (powyżej). A ponieważ są one tak duże, prawie nie wydają się mieć żadnego sensu.

Wydaje się nieco niedorzeczne myśleć, że przeżycie wynosi np. 8,815e + 34 (współczynnik ryzyka wzięty z interakcji LT: Jedzenie: Temp2) razy mniej, gdy interakcja wzrasta o jedną jednostkę (?).

Właściwie nie wiem też, jak interpretować tę interakcję z 3 przypadkami. Czy to oznacza, że gdy wszystkie zmienne wchodzące w interakcje wzrosną o jedną jednostkę, przeżycie zmniejsza się o pewną wartość (o czym świadczy wartość exp (coef))?

Byłoby wspaniale, gdyby ktoś mógł mi tutaj pomóc. :)

Poniżej znajduje się część mojego arkusza danych, którego użyłem do analizy Coxa. Tutaj możesz zobaczyć, że użyłem wielokrotnie tej samej wartości zmiennej objaśniającej (tj. LT, Żywności i Temp2) dla kilku „Czasów, zmiennych odpowiedzi stanu”. Te wartości zmiennych objaśniających są już średnimi wartościami tych zmiennych (ze względu na charakter pracy w terenie nie było możliwe uzyskanie indywidualnej wartości zmiennej objaśniającej dla każdej obserwowanej odpowiedzi, stąd średnie wartości zastosowane już w tej fazie ), a to odpowiadałoby sugestii 1 (?) (patrz pierwsza odpowiedź).

Sugestia 2 (patrz 1. odpowiedź): Używam R i nie jestem jeszcze super bogiem. :) Tak więc, jeśli użyję funkcji przewidywania (cox.model, type = "oczekiwano"), otrzymam ogromną liczbę różnych wartości i nie mam pojęcia, do której zmiennej objaśniającej się odnoszą iw jakiej kolejności. Czy jest możliwe wyróżnienie określonego terminu interakcji w funkcji przewidywania? Nie jestem pewien, czy wyrażam się tutaj jasno.

Sugestia 3 (patrz 1. odpowiedź): w części arkusza danych poniżej widać jednostki różnych zmiennych objaśniających. Wszystkie są różne i zawierają dziesiętne. Czy to może mieć coś wspólnego z wynikiem Coxa?

Część arkusza danych:

Time (days)     Status      LT(h) Food (portions per day) Temp2 (ºC)
28                0         14.42        4.46             3.049
22                0         14.42        4.46             3.049
9                 1         14.42        4.46             3.049
24                0         15.33        4.45             2.595
24                0         15.33        4.45             2.595
19                1         15.33        4.45             2.595

Pozdrawiam, Unna

r interaction regression-coefficients cox-model

— Unna
źródło

@MansT: Miło, że zredagowałeś pytanie ;-)

— ocram,

Kilka sugestii, niezwiązanych bezpośrednio z CoxPH, ale z interakcjami i kolinearnością

1) Kiedy dostajesz takie „szalone” wartości, jedną z możliwości jest kolinearność. Jest to często problem w przypadku interakcji. Czy wyśrodkowałeś wszystkie swoje zmienne (odejmując średnią z każdej)?

2) Nie da się tak łatwo zinterpretować jednej interakcji wśród wielu. LT, jedzenie i temp2 są zaangażowane w wiele interakcji. Spójrz więc na przewidywane wartości z różnych kombinacji.

3) Sprawdź jednostki różnych zmiennych. Kiedy dostajesz szalone parametry, czasem jest to problem z jednostkami (np. Mierzenie wysokości człowieka w milimetrach lub kilometrach)

4) Kiedy już to wszystko wyjaśnię, znajduję najprostszy sposób, aby pomyśleć o efektach różnych interakcji (szczególnie tych na wyższym poziomie), aby wykreślić przewidywane wartości z różnymi kombinacjami wartości niezależnych.

— Peter Flom
źródło

Cześć, poniżej znajduje się część mojego arkusza danych, którego użyłem do analizy Coxa. Tutaj możesz zobaczyć, że użyłem wielokrotnie tej samej wartości zmiennej objaśniającej (tj. LT, Żywności i Temp2) dla kilku zmiennych czasu, statusu odpowiedzi. Te wartości zmiennych objaśniających są już średnimi wartościami tych zmiennych (ze względu na charakter pracy w terenie nie było możliwe uzyskanie indywidualnej wartości zmiennej objaśniającej dla każdej obserwowanej odpowiedzi osobnika, stąd średnie wartości zastosowane już w tej fazie ), a to odpowiadałoby sugestii 1 (?).

— Unna,

Sugestia 2: Używam R i nie jestem jeszcze super bogiem. :) Tak więc, jeśli użyję funkcji przewidywania (cox.model, type = "oczekiwano"), otrzymam ogromną liczbę różnych wartości i nie mam pojęcia, do której zmiennej objaśniającej się odnoszą iw jakiej kolejności. Czy jest możliwe wyróżnienie określonego terminu interakcji w funkcji przewidywania? Nie jestem pewien, czy wyrażam się tutaj jasno.

— Unna,

Sugestia 3: w części arkusza danych poniżej widać jednostki różnych zmiennych objaśniających. Wszystkie są różne i zawierają dziesiętne. Czy to może mieć coś wspólnego z wynikiem Coxa?

— Unna,

Czas (dni) Status LT (h) Jedzenie (porcje dziennie) Temp2 (ºC) 28 0 14,42 4,46 3,049 22 0 14,42 4,46 3,049 9 1 14,42 4,46 3,049 24 0 15,33 4,45 2,595 24 0 15,33 4,45 2,595 19 1 15,33 4,45 2,595

— Unna

Powyższy komentarz do przykładu arkusza danych, którego użyłem, nie pokazuje się w kształcie tabeli, ale mam nadzieję, że da się z niego zrozumieć. :)

— Unna,