Kursy są sposobem na wyrażenie szans. Stosunki szans są takie: jeden kurs podzielony przez drugi. Oznacza to, że iloraz szans jest pomnożony przez jeden kurs, aby uzyskać inny. Zobaczmy, jak działają w tej wspólnej sytuacji.
Przeliczanie szans i prawdopodobieństw
Y10 Pr ( Y = 0 )Pr(Y=1)0Pr(Y=0)
Odds(Y)=Pr(Y=1)Pr(Y=0)=Pr(Y=1)1−Pr(Y=1).
Równoważne wyrażenie po prawej stronie pokazuje, że wystarczy model aby znaleźć szanse. I odwrotnie, pamiętaj, że możemy rozwiązaćPr(Y=1)
Pr(Y=1)=Odds(Y)1+Odds(Y)=1−11+Odds(Y).
Regresja logistyczna
Regresja logistyczna modeluje logarytm szansy jako liniowej funkcji zmiennych objaśniających. , pisząc te zmienne jako i włączając możliwy stały wyraz w funkcji liniowej, możemy nazwać współczynniki (które należy oszacować na podstawie danych) jako i . Formalnie tworzy to modelx 1 , … , x p β 1 , … , β p β 0Yx1,…,xpβ1,…,βpβ0
log(Odds(Y))=β0+β1x1+⋯+βpxp.
Same szanse można odzyskać, cofając logarytm:
Odds(Y)=exp(β0+β1x1+⋯+βpxp).
Korzystanie ze zmiennych jakościowych
Zmienne kategorialne, takie jak grupa wiekowa, płeć, obecność jaskry itp. , Włącza się za pomocą „kodowania zastępczego”. Aby pokazać, że sposób kodowania zmiennej nie ma znaczenia, przedstawię prosty przykład jednej małej grupy; uogólnienie na wiele grup powinno być oczywiste. W tym badaniu jedną zmienną jest „wielkość źrenicy” z trzema kategoriami: „Duża”, „Średnia” i „Mała”. (Badanie traktuje je jako czysto kategoryczne, najwyraźniej nie zwracając uwagi na ich naturalną kolejność.) Intuicyjnie, każda kategoria ma swoje własne szanse, powiedz dla „Large”, dla „Medium” i dla „Small” . Oznacza to, że wszystkie inne rzeczy są równe,α M α S.αLαMαS
Odds(Y)=exp(αL+β0+β1x1+⋯+βpxp)
dla każdego w kategorii „Duża”,
Odds(Y)=exp(αM+β0+β1x1+⋯+βpxp)
dla każdego w kategorii „Medium” oraz
Odds(Y)=exp(αS+β0+β1x1+⋯+βpxp)
dla osób z kategorii „Małe”.
Tworzenie możliwych do zidentyfikowania współczynników
Pokolorowałem pierwsze dwa współczynniki, aby je podświetlić, ponieważ chcę, abyście zauważyli, że pozwalają one na prostą zmianę: możemy wybrać dowolną liczbę , dodając ją do i odejmując od każdego z , i , nie zmienilibyśmy żadnych przewidywanych szans. Wynika to z oczywistych równoważników formyβ 0 α Lγβ0αLα SαMαS
αL+β0=(αL−γ)+(γ+β0),
itp. Chociaż nie stanowi to problemu dla modelu - nadal przewiduje dokładnie te same rzeczy - pokazuje, że parametry same w sobie nie są interpretowalne. Po wykonaniu tego manewru dodawania i odejmowania pozostają te same różnice między współczynnikami. Konwencjonalnie, aby zaradzić temu brakowi identyfikowalności, ludzie (i domyślnie oprogramowanie) wybierają jedną z kategorii w każdej zmiennej jako „podstawową” lub „referencyjną” i po prostu zastrzegają, że jej współczynnik wyniesie zero. To usuwa dwuznaczność.
W artykule wymieniono najpierw kategorie referencyjne; „Duży” w tym przypadku. Tak więc jest odejmowane od każdego z i i dodawane do celu kompensacji.α L , α M , α S β 0αLαL,αM,αSβ0
szanse dla hipotetycznej osoby do wszystkich podstawowych kategorii zatem plus kilka terminów związanych ze wszystkimi innymi „zmiennymi towarzyszącymi” - zmiennymi :β0
Odds(Base category)=exp(β0+β1X1+⋯+βpXp).
Nie pojawiają się tutaj terminy związane z żadnymi zmiennymi kategorialnymi. (W tym momencie nieznacznie zmieniłem notację: beta są teraz współczynnikami tylko zmiennych towarzyszących , podczas gdy pełny model zawiera dla różnych kategorii).βiαj
Porównywanie szans
Porównajmy szanse. Załóżmy, że hipotetyczna osoba to
mężczyzna w wieku 80–89 lat z białą zaćmą, bez widocznego widoku i małym uczniem operowanym przez specjalistę ...
Z tym pacjentem (nazwijmy go Charlie) związane są szacunkowe współczynniki dla każdej kategorii: dla jego grupy wiekowej, za bycie mężczyzną i tak dalej. Wszędzie tam, gdzie jego atrybut jest podstawą dla jego kategorii, zgodnie z konwencją współczynnik wynosi zero , jak widzieliśmy. Ponieważ jest to model liniowy, współczynniki się dodają. Tak więc, do podanych powyżej podstawowych logarytmicznych szans logarytmicznych dla tego pacjenta uzyskuje się przez dodanieα80-89αmale
α80-89+αmale+αno Glaucoma+⋯+αspecialist registrar.
Jest to dokładnie kwota, o którą dzienne szanse tego pacjenta różnią się od podstawy. Aby przeliczyć z logarytmów, cofnij logarytm i przypomnij sobie, że zamienia to dodawanie w mnożenie. Dlatego kurs podstawowy należy pomnożyć
exp(α80-89)exp(αmale)exp(αno Glaucoma)⋯exp(αspecialist registrar).
Są to liczby podane w tabeli pod „Skorygowanym OR” (skorygowany iloraz szans). (Nazywa się to „skorygowane”, ponieważ w modelu uwzględniono zmienne towarzyszące . Nie odgrywają one żadnej roli w żadnym z naszych obliczeń, jak się przekonacie. Nazywa się to „współczynnikiem”, ponieważ jest to dokładnie które podstawowe szanse należy pomnożyć, aby uzyskać przewidywane szanse pacjenta: patrz pierwszy akapit tego postu.) W tabeli są to: , , i tak dalej. Zgodnie z artykułem ich produkt działa do . W związku z tymx1,…,xpexp(α80-89)=1.58exp(αmale)=1.28exp(αno Glaucoma)=1.0034.5
Odds(Charlie)=34.5×Odds(Base).
(Zauważ, że wszystkie kategorie podstawowe mają iloraz szans , ponieważ włączenie do produktu pozostawia niezmienione. W ten sposób możesz dostrzec kategorie podstawowe w tabeli.) 1.00=exp(0)1
Przekształcenie wyników jako prawdopodobieństwa
Na koniec przekonwertujmy ten wynik na prawdopodobieństwa. Powiedziano nam, że przewidywane prawdopodobieństwo wynosi . Dlatego korzystając ze wzorów odnoszących się do szans i prawdopodobieństw wyprowadzonych na wstępie, możemy obliczyć0.736%=0.00736
Odds(Base)=0.007361−0.00736=0.00741.
W związku z tym szanse Charliego są
Odds(Charlie)=34.5×0.00741=0.256.
Wreszcie, przekształcenie tego z powrotem w prawdopodobieństwa daje
Pr(Y(Charlie)=1)=1−11+0.256=0.204.