Krzywą przeżycia Kaplana-Meiera należy pamiętać o tym, że jest ona zasadniczo opisowa, a nie wnioskowania . To tylko funkcja danych, za którą kryje się niezwykle elastyczny model. Jest to siła, ponieważ oznacza to, że nie ma praktycznie żadnych założeń, które mogłyby zostać złamane, ale słabość, ponieważ trudno jest ją uogólnić, i że pasuje ona zarówno do „szumu”, jak i do „sygnału”. Jeśli chcesz wyciągnąć wnioski, to w zasadzie musisz przedstawić coś, co jest nieznane, co chcesz wiedzieć.
Jednym ze sposobów porównania mediany czasów przeżycia jest przyjęcie następujących założeń:
- Mam szacunkową medianę czasu przeżycia dla każdego ze stanów , podaną za pomocą krzywej Kaplana Meiera. itii
- Oczekuję, że prawdziwa mediana czasu przeżycia będzie równa tej wartości szacunkowej. E ( T i | t i ) = t iT.jami( Tja| tja) = tja
- Jestem w 100% pewien, że prawdziwa mediana czasu przeżycia jest dodatnia. P.r ( Tja> 0 ) = 1
Teraz „najbardziej konserwatywnym” sposobem wykorzystania tych założeń jest zasada maksymalnej entropii, więc otrzymujesz:
p ( Tja| tja) = Ke x p ( - λ Tja)
Gdzie i są wybrane tak, że PDF jest znormalizowany, a oczekiwana wartość to . Teraz mamy:λ t iK.λtja
= K [ - e x p ( - λ T i )
1 = ∫∞0p ( Tja| tja) dT.ja= K.∫∞0e x p ( - λ Tja) dT.ja
E ( T i ) = 1= K.[ - e x p ( - λ Tja)λ]T.ja= ∞T.ja= 0= K.λ⟹K.= λ
a teraz mamy
mi( Tja) = 1λ⟹λ = t- 1ja
I tak masz zestaw rozkładów prawdopodobieństwa dla każdego stanu.
p ( Tja| tja) = 1tjae x p ( - Tjatja)( i = 1 , … , N)
Które dają łączny rozkład prawdopodobieństwa:
p ( T1, T2), … , TN.| t1, t2), … , TN.) = ∏i = 1N.1tjae x p ( - Tjatja)
Teraz wygląda na to, że chcesz przetestować hipotezę , gdzie to średnia mediana czasu przeżycia. Surową alternatywną hipotezą do przetestowania jest hipoteza „każdy stan jest unikalnym i pięknym śniegu” ponieważ jest to najbardziej prawdopodobna alternatywa, a zatem reprezentuje informacje utracone podczas przechodzenia do prostszej hipotezy (test „minimax”). Miarę dowodów przeciwko prostszej hipotezie podaje iloraz szans:¯ t = 1H.0: T1= T2)= ⋯ = T.N.= t¯HA:T1=t1,…,TN=tNt¯= 1N.∑N.i = 1tjaH.ZA: T1= t1, … , TN.= tN.
O ( HZA| H.0) = p ( T1= t1, T2)= t2), … , TN.= tN.| t1, t2), … , TN.)p ( T1= t¯, T2)= t¯, … , TN.= t¯| t1, t2), … , TN.)
= [ ∏N.i = 11tja] exp ( - ∑N.i = 1tjatja)[ ∏N.i = 11tja] exp ( - ∑N.i = 1t¯tja)= e x p ( N[ t¯th a r m- 1 ] )
Gdzie
th a r m= [ 1N.∑i = 1N.t- 1ja]- 1≤ t¯
jest średnią harmoniczną. Pamiętaj, że szanse zawsze będą sprzyjać doskonałemu dopasowaniu, ale nie za bardzo, jeśli mediana czasów przeżycia jest dość zbliżona. Ponadto daje to bezpośredni sposób na przedstawienie dowodów tego konkretnego testu hipotez:
założenia 1-3 dają maksymalne szanse na stosunku do równych mediany czasów przeżycia we wszystkich stanachO ( HZA| H.0) : 1
Połącz to z regułą decyzyjną, funkcją utraty, funkcją użyteczności itp., Która mówi, jak korzystne jest zaakceptowanie prostszej hipotezy, i masz już swój wniosek!
Nie ma ograniczenia co do liczby hipotez, które można przetestować i dać podobne szanse. Wystarczy zmienić aby określić inny zestaw możliwych „prawdziwych wartości”. Możesz wykonać „test istotności”, wybierając hipotezę jako:H.0
H.S., ja: Tja= tja, Tjot= T= t¯( i )= 1N.- 1∑j ≠ itjot
Tak więc hipoteza jest werbalna: „stan ma inną medianę przeżycia, ale wszystkie pozostałe stany są takie same”. A następnie ponownie wykonaj obliczenia ilorazu szans, które wykonałem powyżej. Chociaż powinieneś uważać na alternatywną hipotezę. Każde z poniższych jest „rozsądne” w tym sensie, że mogą to być pytania, na które chcesz odpowiedzieć (i na ogół będą mieć różne odpowiedzi)ja
- mój zdefiniowany powyżej - o ile gorzej jest porównaniu do idealnego dopasowania? H S , iH.ZAH.S., ja
- mój zdefiniowany powyżej - o ile lepszy jest porównaniu do przeciętnego dopasowania? H S , iH.0H.S., ja
- inny - o ile stan „bardziej odmienny” w porównaniu do stanu ? k iH.S., kkja
Teraz jedną rzeczą, która została tutaj przeoczona, są korelacje między stanami - ta struktura zakłada, że znajomość mediany współczynnika przeżycia w jednym stanie nie mówi nic o medianie współczynnika przeżycia w innym stanie. Chociaż może się to wydawać „złe”, nie jest trudno poprawić, a powyższe obliczenia są dobrymi wynikami początkowymi, które są łatwe do obliczenia.
Dodanie połączeń między stanami zmieni modele prawdopodobieństwa i skutecznie zobaczysz pewne „połączenie” mediany czasów przeżycia. Jednym ze sposobów włączenia korelacji do analizy jest podzielenie prawdziwych czasów przeżycia na dwa składniki, „część wspólną” lub „trend” i „część indywidualną”:
T.ja= T+ Uja
A następnie ogranicz indywidualną część aby miała średnie zero we wszystkich jednostkach i nieznaną wariancję należy zintegrować, używając wcześniejszego opisu posiadanej wiedzy na temat indywidualnej zmienności, przed zaobserwowaniem danych (lub Jeffreyem wcześniej, jeśli nic nie wiem i pół cauchy, jeśli jeffreys powoduje problemy). σUjaσ