Czy istnieje jakaś funkcjonalna różnica między ilorazem szans a ilorazem ryzyka?


10

W regresji logistycznej iloraz szans równy 2 oznacza, że ​​zdarzenie jest 2 razy bardziej prawdopodobne, biorąc pod uwagę wzrost o jedną jednostkę predyktora. W regresji Coxa współczynnik ryzyka wynoszący 2 oznacza, że ​​zdarzenie wystąpi dwa razy częściej w każdym punkcie czasowym, biorąc pod uwagę wzrost o jedną jednostkę predyktora. Czy to nie jest praktycznie to samo?

Jaka jest zatem zaleta w przeprowadzaniu regresji Coxa i uzyskiwaniu współczynników ryzyka, jeśli możemy uzyskać funkcjonalnie te same informacje ze współczynników szans regresji logistycznej?

Odpowiedzi:


12

iloraz szans równy 2 oznacza, że ​​zdarzenie jest 2 razy bardziej prawdopodobne, biorąc pod uwagę wzrost o jedną jednostkę predyktora

Oznacza to, że szanse się podwoją, co nie jest tym samym, co podwojenie prawdopodobieństwa.

W regresji Coxa współczynnik ryzyka wynoszący 2 oznacza, że ​​zdarzenie wystąpi dwa razy częściej w każdym punkcie czasowym, biorąc pod uwagę wzrost o jedną jednostkę predyktora.

Pomijając trochę falowania, tak - częstotliwość występowania się podwaja. To jest jak skalowane prawdopodobieństwo chwilowe.

Czy to nie jest praktycznie to samo?

Są prawie takie same, gdy podwojenie szansy na wydarzenie jest prawie takie samo, jak podwojenie ryzyka zdarzenia. Nie są one automatycznie podobne, ale w niektórych (dość powszechnych) okolicznościach mogą one bardzo ściśle odpowiadać.

Możesz ostrożniej rozważyć różnicę między prawdopodobieństwem a prawdopodobieństwem.

Zobacz na przykład pierwsze zdanie tutaj , które wyjaśnia, że ​​szanse są stosunkiem prawdopodobieństwa do jego uzupełnienia. Na przykład zwiększenie szans (na korzyść) z 1 do 2 jest tym samym, co zwiększenie prawdopodobieństwa od12) do 2)3). Szanse rosną szybciej niż prawdopodobieństwo rośnie. W przypadku bardzo małych prawdopodobieństw szanse na korzyść i prawdopodobieństwo są bardzo podobne, podczas gdy szanse na przeciw stają się coraz bardziej podobne do (w tym sensie, że stosunek pójdzie do 1) odwrotności prawdopodobieństwa, gdy prawdopodobieństwo maleje. Iloraz szans to po prostu iloraz dwóch zestawów szans. Zwiększenie ilorazu szans przy jednoczesnym utrzymaniu podstawowej stałej szans odpowiada zwiększeniu innych szans, ale może, ale nie musi, być podobne do względnej zmiany prawdopodobieństwa.

Możesz także zastanowić się nad różnicą między zagrożeniem a prawdopodobieństwem (zobacz moją wcześniejszą dyskusję, w której wspominam o machaniu ręką; teraz nie pomalujemy różnicy). Na przykład, jeśli prawdopodobieństwo wynosi 0,6, nie można go podwoić - ale chwilowe ryzyko 0,6 można podwoić do 1,2. Nie są tym samym, podobnie jak gęstość prawdopodobieństwa nie jest prawdopodobieństwem.


2
+1 Tylko komentując, aby wspomnieć, że niektóre formy analizy historii zdarzeń wykorzystują inną definicję funkcji zagrożenia (np. h(t) w modelach historii zdarzeń z czasem dyskretnym jest prawdopodobieństwo wystąpienia zdarzenia w czasie t pod warunkiem, że nie wystąpił wcześniej, i jako taki 2)×0,6w takich modelach nie miałoby sensu).
Alexis,

1
Dzięki, to zdecydowanie istotne. Jest to związane z faktem, że dyskretne pmf nie może nigdzie przekroczyć 1, podczas gdy gęstość zdecydowanie może.
Glen_b

3

To dobre pytanie. Ale tak naprawdę pytasz nie o to, jak interpretowana jest statystyka, ale jakie założenia leżą u podstaw każdego z twoich modeli (hazardu lub logistyki). Model logistyczny to model statyczny, który skutecznie przewiduje prawdopodobieństwo wystąpienia zdarzenia w określonym czasie, biorąc pod uwagę możliwą do zaobserwowania informację. Jednak model zagrożenia lub model Coxa jest modelem czasu trwania, który modeluje wskaźniki przeżycia w czasie. Możesz zadać pytanie typu „jakie jest prawdopodobieństwo, że użytkownik papierosa przeżyje do 75 roku życia w porównaniu z prawdopodobieństwem nieużytkownika z regresją logistyczną” (biorąc pod uwagę, że masz informacje o śmiertelności dla kohorty do 75 lat) . Ale jeśli zamiast tego chcesz wykorzystać pełnię wymiaru czasowego swoich danych, bardziej odpowiednie będzie zastosowanie modelu zagrożenia.

Ostatecznie jednak wszystko sprowadza się do tego, co chcesz modelować. Czy uważasz, że to, co modelujesz, jest wydarzeniem jednorazowym? Użyj logistyki. Jeśli uważasz, że Twoje zdarzenie ma stałą lub proporcjonalną szansę wystąpienia każdego okresu w obserwowalnym spektrum czasu? Użyj modelu zagrożenia.

Wybór metod nie powinien opierać się na sposobie interpretacji statystyki. Gdyby tak było, nie byłoby różnicy między OLS, LAD, Tobit, Heckit, IV, 2SLS lub szeregiem innych metod regresji. Zamiast tego powinna opierać się na formie, którą według Ciebie przybiera model, który próbujesz oszacować.


-1 (Mieszane) Modele logistyczne z pewnością mogą modelować wskaźniki przeżycia w czasie. Patrz na przykład Allison, PD (1982). Metody dyskretne w czasie do analizy historii zdarzeń . Sociological Methodology , 13 (1982), 61–98 lub Allison, PD (1984). Analiza historii zdarzeń: regresja dla danych zdarzeń wzdłużnych (t. 12). Sage Beverly Hills, CA.
Alexis
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.