Twoje pytanie może wynikać z faktu, że masz do czynienia z ilorazem szans i prawdopodobieństwami, co na początku jest mylące. Ponieważ model logistyczny jest nieliniową transformacją obliczeń przedziały ufności nie są tak proste.βTx
tło
Przypomnijmy, że dla modelu regresji logistycznej
Prawdopodobieństwo z :p = e α + β 1 x 1 + β 2 x 2(Y=1)p=eα+β1x1+β2x21+eα+β1x1+β2x2
Szanse na :( str(Y=1)(p1−p)=eα+β1x1+β2x2
Log Szanse na :log ( str(Y=1)log(p1−p)=α+β1x1+β2x2
Rozważ przypadek, w którym masz wzrost o jedną jednostkę w zmiennej , tj. , wtedy nowe szanse sąx1x1+1
Odds(Y=1)=eα+β1(x1+1)+β2x2=eα+β1x1+β1+β2x2
- Iloraz szans (OR) jest zatem
Odds(x1+1)Odds(x1)=eα+β1(x1+1)+β2x2eα+β1x1+β2x2=eβ1
Współczynniki interpretacyjne
Jak interpretowałbyś wartość współczynnika ? Zakładając, że wszystko inne pozostaje nieruchome:βj
- Z każdym wzrostem jednostki współczynnik logarytmiczny zwiększa się o .xjβj
- Z każdym wzrostem jednostki iloraz szans wzrasta o .xjeβj
- Z każdym wzrostem od do współczynnik szans wzrasta oxjkk+ΔeβjΔ
- Jeśli współczynnik jest ujemny, wówczas wzrost prowadzi do zmniejszenia ilorazu szans.xj
Przedziały ufności dla jednego parametruβj
Czy muszę tylko użyć ? Czy też muszę konwertować SE za pomocą opisanego tutaj podejścia?1.96∗SE
Ponieważ parametr jest szacowany za pomocą oszacowania wiarygodności Maxiumum, teoria MLE mówi nam, że jest asymptotycznie normalna, a zatem możemy użyć dużego przedziału ufności Walda, aby uzyskać zwykłeβj
βj±z∗SE(βj)
Co daje przedział ufności w stosunku logarytmicznym. Użycie właściwości niezmienniczości MLE pozwala nam na wykładnik, aby uzyskać
eβj±z∗SE(βj)
który jest przedziałem ufności dla ilorazu szans. Pamiętaj, że te przedziały dotyczą tylko jednego parametru.
Jeśli chcę zrozumieć błąd standardowy dla obu zmiennych, jak bym to rozważyć?
Jeśli podasz kilka parametrów, możesz użyć procedury Bonferroniego, w przeciwnym razie dla wszystkich parametrów możesz użyć przedziału ufności do oszacowania prawdopodobieństwa
Procedura Bonferroniego dla kilku parametrów
Jeżeli parametry mają być oszacowane przy współczynniku ufności rodziny wynoszącym około , wspólne granice ufności Bonferroniego wynosząg1−α
βg±z(1−α2g)SE(βg)
Przedziały ufności dla oszacowań prawdopodobieństwa
Model logistyczny generuje oszacowanie prawdopodobieństwa zaobserwowania jednego, a naszym celem jest zbudowanie interwału częstości wokół rzeczywistego prawdopodobieństwa tak abypPr(pL≤p≤pU)=.95
Jedno podejście zwane transformacją punktu końcowego wykonuje następujące czynności:
- Oblicz górne i dolne granice przedziału ufności dla kombinacji liniowej (używając Wald CI)xTβ
- Zastosuj transformację monotoniczną do punktów końcowych aby uzyskać prawdopodobieństwa.F(xTβ)
Ponieważ jest monotoniczną transformacjąPr(xTβ)=F(xTβ)xTβ
[Pr(xTβ)L≤Pr(xTβ)≤Pr(xTβ)U]=[F(xTβ)L≤F(xTβ)≤F(xTβ)U]
Konkretnie oznacza to obliczenie a następnie zastosowanie transformacji logit do wyniku w celu uzyskania dolnej i górnej granicy:βTx±z∗SE(βTx)
[exTβ−z∗SE(xTβ)1+exTβ−z∗SE(xTβ),exTβ+z∗SE(xTβ)1+exTβ+z∗SE(xTβ),]
Oszacowaną przybliżoną wariancję można obliczyć za pomocą macierzy kowariancji współczynników regresji za pomocąxTβ
Var(xTβ)=xTΣx
Zaletą tej metody jest to, że granice nie mogą znajdować się poza zakresem(0,1)
Istnieje również kilka innych podejść, przy użyciu metody delta, ładowania początkowego itp., Które mają swoje własne założenia, zalety i ograniczenia.
Źródła i informacje
Moją ulubioną książką na ten temat jest „Zastosowane liniowe modele statystyczne” Kutnera, Neter, Li, rozdział 14
W przeciwnym razie oto kilka źródeł online: