Dotarcie do nas zajmie trochę czasu, ale podsumowując, zmiana o jedną jednostkę w zmiennej odpowiadającej B zwiększy względne ryzyko wyniku (w porównaniu do wyniku podstawowego) przez 6,012.
Można to wyrazić jako wzrost względnego ryzyka o „5012%” , ale jest to mylący i potencjalnie wprowadzający w błąd sposób, ponieważ sugeruje, że powinniśmy myśleć o zmianach w sposób addytywny, podczas gdy w rzeczywistości wielomianowy model logistyczny zdecydowanie zachęca nas do myśl multiplikatywnie. Modyfikator „względny” jest niezbędny, ponieważ zmiana zmiennej jednocześnie zmienia przewidywane prawdopodobieństwa wszystkich wyników, a nie tylko tego, o którym mowa, więc musimy porównać prawdopodobieństwa (za pomocą współczynników, a nie różnic).
Pozostała część tej odpowiedzi rozwija terminologię i intuicję potrzebną do prawidłowej interpretacji tych stwierdzeń.
tło
Zacznijmy od zwykłej regresji logistycznej, zanim przejdziemy do przypadku wielomianowego.
W przypadku zmiennej zależnej (binarnej) Y i zmiennej niezależnej Xi model to
Pr[Y=1]=exp(β1X1+⋯+βmXm)1+exp(β1X1+⋯+βmXm);
równoważnie, przyjmując 0≠Pr[Y=1]≠1 ,
log(ρ(X1,⋯,Xm))=logPr[Y=1]Pr[Y=0]=β1X1+⋯+βmXm.
(Definiuje to po prostu ρ , czyli iloraz szans w funkcji Xi .)
Bez utraty ogólności indeksuj Xi , aby Xm była zmienną, a X m δβm jest „B” na pytanie (tak,exp(βm)=6.012 ). Mocowanie wartościXi,1≤i<m , a różneniewielką ilościąWydajnośćXmδ
log(ρ(⋯,Xm+δ))−log(ρ(⋯,Xm))=βmδ.
Zatem jest marginalną zmianą szansy na log w stosunku do .X mβm Xm
Aby odzyskać , oczywiście musimy ustawić i potęgować lewą stronę:δ = 1exp(βm)δ=1
exp( βm)= exp( βm× 1 )= exp( log( ρ ( ⋯ , Xm+ 1 ) ) - log( ρ ( ⋯ , Xm) ) )= ρ ( ⋯ , Xm+ 1 )ρ ( ⋯ , Xm).
To pokazuje jako iloraz szans dla jednostkowego wzrostu . Aby rozwinąć intuicję dotyczącą tego, co to może znaczyć, tabeluj niektóre wartości zakresu początkowych szans, zaokrąglając mocno, aby wyróżnić wzorce:X mexp( βm)Xm
Starting odds Ending odds Starting Pr[Y=1] Ending Pr[Y=1]
0.0001 0.0006 0.0001 0.0006
0.001 0.006 0.001 0.006
0.01 0.06 0.01 0.057
0.1 0.6 0.091 0.38
1. 6. 0.5 0.9
10. 60. 0.91 1.
100. 600. 0.99 1.
W przypadku naprawdę małych szans, które odpowiadają naprawdę małym prawdopodobieństwom, wzrost o jednej jednostki polega na pomnożeniu szansy lub prawdopodobieństwa przez około 6,012. Współczynnik multiplikatywny maleje wraz ze wzrostem prawdopodobieństwa (i prawdopodobieństwa) i zasadniczo zanika, gdy szanse przekraczają 10 (prawdopodobieństwo przekracza 0,9).Xm
Jako zmiana addytywna , nie ma dużej różnicy między prawdopodobieństwem 0,0001 a 0,0006 (to tylko 0,05%), ani też nie ma dużej różnicy między 0,99 a 1. (tylko 1%). Największy efekt addytywny występuje, gdy szanse wynoszą , gdzie prawdopodobieństwo zmienia się z 29% na 71%: zmiana o + 42%.1/6.012−−−−√∼0.408
Widzimy zatem, że jeśli wyrażamy „ryzyko” jako iloraz szans, = „B” ma prostą interpretację - iloraz szans wynosi dla wzrostu jednostki ale kiedy wyrażamy ryzyko w niektórych inne mody, takie jak zmiana prawdopodobieństwa, interpretacja wymaga staranności, aby określić prawdopodobieństwo początkowe.β m X mβmβmXm
Wielomianowa regresja logistyczna
(Zostało to dodane jako późniejsza edycja).
Po rozpoznaniu wartości wykorzystania logarytmowych szans do wyrażenia szans przejdźmy do przypadku wielomianowego. Teraz zmienna zależna może być równa jednej z k ≥ 2 kategorii, indeksowanych przez i = 1 , 2 , … , k . Względne prawdopodobieństwo, że w kategorii I jestYk≥2i=1,2,…,ki
Pr[Yi]∼exp(β(i)1X1+⋯+β(i)mXm)
z parametrami β(i)j które należy określić, i wpisując Yi dla Pr [ Y= kategoria i ] . Jako skrót napiszmy prawe wyrażenie jako pja( X, β) lub, gdzie X ip iβ są jasne z kontekstu, po prostu . Normalizacja, aby wszystkie te względne prawdopodobieństwa sumowały się do jedności dajepja
Pr [ Yja] = pja( X, β)p1( X, β) + ⋯ + pm( X, β).
(Parametry są dwuznaczne: jest ich zbyt wiele. Konwencjonalnie wybiera się kategorię „podstawową” do porównania i wymusza wyzerowanie wszystkich jej współczynników. Jednak jest to konieczne, aby podać unikalne szacunki wartości beta, interpretacja współczynników nie jest potrzebna. Aby zachować symetrię - to znaczy uniknąć jakichkolwiek sztucznych rozróżnień między kategoriami - nie egzekwujmy takiego ograniczenia, chyba że musimy).
Jednym ze sposobów interpretacji tego modelu jest zapytanie o krańcowe tempo zmian logarytmicznych dla dowolnej kategorii (powiedzmy kategorii ) w odniesieniu do dowolnej z niezależnych zmiennych (powiedzmy ). Oznacza to, że gdy zmienimy to zmianę logarytmicznej . Jesteśmy zainteresowani stałą proporcjonalności związaną z tymi dwiema zmianami. Chain Rule of Calculus, wraz z małą algebrą, mówi nam, że ta szybkość zmian wynosiX j X j Y ijaXjotXjotYja
∂ dzienne szanse ( Yja)∂ Xjot= β( i )jot- β( 1 )jotp1+ ⋯ + β(i−1)jpi−1+β(i+1)jpi+1+⋯+β(k)jpkp1+⋯+pi−1+pi+1+⋯+pk.
Ten ma stosunkowo prostą interpretację jako współczynnik z we wzorze na prawdopodobieństwo, że należy do kategorii minus „regulacja”. Korekta jest średnią ważoną prawdopodobieństwem współczynników we wszystkich pozostałych kategoriach . Ciężary są obliczane przy użyciu prawdopodobieństw związanych z aktualnymi wartościami zmiennych niezależnych . Zatem marginalna zmiana logów niekoniecznie musi być stała: zależy od prawdopodobieństwa wszystkich innych kategorii, a nie tylko od prawdopodobieństwa danej kategorii (kategoria ).β(i)jXjYiXjXi
Gdy istnieją tylko kategorie, powinno to zostać zredukowane do zwykłej regresji logistycznej. Rzeczywiście, ważenie prawdopodobieństwa nic nie robi i (wybierając ) daje po prostu różnicę . Uznanie, że kategoria jest przypadkiem podstawowym, zmniejsza to dodatkowo do , ponieważ . Tak więc nowa interpretacja uogólnia to, co stare.k=2i=2β(2)j−β(1)jiβ(2)jβ(1)j=0
Aby bezpośrednio zinterpretować , wyodrębnimy ją po jednej stronie poprzedniej formuły, prowadząc do:β(i)j
Współczynnik dla kategorii jest równy marginalnej zmianie logarytmicznych szans kategorii w odniesieniu do zmiennej , plus średnia ważona prawdopodobieństwem współczynników wszystkich pozostałych dla kategorii .XjiiXjXj′i
Inną interpretację, choć nieco mniej bezpośrednią, zapewnia (tymczasowo) ustawienie kategorii jako przypadku podstawowego, dzięki czemu dla wszystkich zmiennych niezależnych :iβ(i)j=0Xj
Krańcowa stopa zmian szansy logarytmicznej przypadku podstawowego dla zmiennej jest ujemna ze średniej ważonej prawdopodobieństwem jej współczynników dla wszystkich pozostałych przypadków.Xj
W rzeczywistości stosowanie tych interpretacji zazwyczaj wymaga wyodrębnienia beta i prawdopodobieństwa z danych wyjściowych oprogramowania i wykonania obliczeń, jak pokazano.
Na koniec, w przypadku współczynników wykładniczych należy zauważyć, że stosunek prawdopodobieństwa między dwoma wynikami (czasami nazywany „ryzykiem względnym” porównaniu do ) wynosiii′
YiYi′=pi(X,β)pi′(X,β).
Wzrost Chodźmy o jedną jednostkę do . To mnoży przez i przez , skąd ryzyko względne jest mnożone przez = . Uznanie kategorii za podstawowy przypadek sprowadza to do , co prowadzi nas do stwierdzenia:XjXj+1piexp(β(i)j)pi′exp(β(i′)j)exp(β(i)j)/exp(β(i′)j)exp(β(i)j−β(i′)j)i′exp(β(i)j)
Potęgowania współczynnik jest wartością, w którym względne ryzyko jest mnożony gdy zmienna jest zwiększona o jedną jednostkę.exp(β(i)j)Pr[Y=category i]/Pr[Y=base category]Xj