Jesteś na dobrej drodze, ale zawsze spójrz do dokumentacji używanego oprogramowania, aby zobaczyć, który model jest odpowiedni. Załóżmy sytuację z kategorycznie zależną zmienną z uporządkowanymi kategoriami 1 , … , g , … , k i predyktorami X 1 , … , X j , … , X p .Y1,…,g,…,kX1,…,Xj,…,Xp
„Na wolności” można napotkać trzy równoważne opcje do napisania teoretycznego modelu proporcjonalnych kursów o różnych implikowanych znaczeniach parametrów:
- logit(p(Y⩽g))=lnp(Y⩽g)p(Y>g)=β0g+β1X1+⋯+βpXp(g=1,…,k−1)
- logit(p(Y⩽g))=lnp(Y⩽g)p(Y>g)=β0g−(β1X1+⋯+βpXp)(g=1,…,k−1)
- logit(p(Y⩾g))=lnp(Y⩾g)p(Y<g)=β0g+β1X1+⋯+βpXp(g=2,…,k)
(Modele 1 i 2 mają takie ograniczenie, że w oddzielnych binarnych regresjach logistycznych β j nie różnią się w zależności od g , a β 0 1 < … < β 0 g < … < β 0 k - 1 , model 3 ma to samo ograniczenie o p j , i wymaga, że β 0 2 > ... > β 0 g > ... > β 0 k )k−1βjgβ01<…<β0g<…<β0k−1βjβ02>…>β0g>…>β0k
- We wzorze 1, a pozytywne oznacza, że wzrost czynnikiem X J wiąże się ze wzrostem kursów dla niższej kategorii w Y .βjXjY
- Model 1 jest nieco sprzeczny z intuicją, dlatego model 2 lub 3 wydaje się być preferowanym oprogramowaniem. Tutaj pozytywny oznacza, że wzrost predyktora X j jest związana ze zwiększonym kursów dla wyższych kategorii w Y .βjXjY
- Modele 1 i 2 prowadzą do tych samych szacunków dla , ale ich szacunki dla p j mają przeciwne znaki.β0gβj
- Modele 2 i 3 prowadzą do tych samych oszacowań dla , ale ich oszacowania dla β 0 g mają przeciwne znaki.βjβ0g
Zakładając, że twoje oprogramowanie korzysta z modelu 2 lub 3, możesz powiedzieć „przy wzroście o 1 jednostkę , ceteris paribus, przewidywane szanse na zaobserwowanie„ Y = dobry ”vs. zaobserwowanie„ Y = neutralny LUB zły ”zmiana o współczynnik e β 1 = 0,607 . „a także” ze wzrostem 1 jednostka w X 1 , przy pozostałych warunkach równych, gdy przewidywane szans zaobserwowania « Y = dobre lub neutralny » w porównaniu z obserwacji « strony Y = złych zmiana» o współczynnik e βX1Y=GoodY=Neutral OR Badeβ^1=0.607X1Y=Good OR NeutralY=Bad. ”Zauważ, że w przypadku empirycznym mamy tylko przewidywane szanse, a nie rzeczywiste.eβ^1=0.607
Oto kilka dodatkowych ilustracji dla modelu 1 z kategoriami . Po pierwsze, założenie modelu liniowego dla logarytmów skumulowanych o proporcjonalnych szansach. Po drugie, implikowane prawdopodobieństwa zaobserwowania co najwyżej kategorii g . Prawdopodobieństwa są zgodne z funkcjami logistycznymi o tym samym kształcie.
k=4g
Dla samych prawdopodobieństw kategorii przedstawiony model implikuje następujące uporządkowane funkcje:
PS O ile mi wiadomo, model 2 jest używany w SPSS, a także w funkcjach R MASS::polr()
i ordinal::clm()
. Model 3 jest używany w funkcjach R rms::lrm()
i VGAM::vglm()
. Niestety nie wiem o SAS i Stacie.