Jeśli umieścisz tylko ten samotny predyktor w modelu, wówczas iloraz szans między predyktorem a odpowiedzią będzie dokładnie równy współczynnikowi regresji wykładniczej . Nie sądzę, aby wyprowadzenie tego wyniku było obecne na stronie, więc skorzystam z okazji, aby go podać.
Rozważmy wynik binarny i pojedynczy predyktor binarny X :YX
X=1X=0Y=1p11p01Y=0p10p00
Następnie jeden sposób obliczenia ilorazu szans między i Y i jestXiYi
OR=p11p00p01p10
Z definicji prawdopodobieństwa warunkowego . W stosunku, on ma marginalne prawdopodobieństwa związane z anulowaniem X i możesz przepisać iloraz szans w kategoriach prawdopodobieństw warunkowych Y | X :pij=P(Y=i|X=j)⋅P(X=j)XY|X
OR=P(Y=1|X=1)P(Y=0|X=1)⋅P(Y=0|X=0)P(Y=1|X=0)
W regresji logistycznej modelujesz te prawdopodobieństwa bezpośrednio:
log(P(Yi=1|Xi)P(Yi=0|Xi))=β0+β1Xi
Możemy więc obliczyć te prawdopodobieństwa warunkowe bezpośrednio z modelu. Pierwszy stosunek powyższego wyrażenia dla to:OR
P(Yi=1|Xi=1)P(Yi=0|Xi=1)=(11+e−(β0+β1))(e−(β0+β1)1+e−(β0+β1))=1e−(β0+β1)=e(β0+β1)
a drugi to:
P(Yi=0|Xi=0)P(Yi=1|Xi=0)=(e−β01+e−β0)(11+e−β0)=e−β0
OR=e(β0+β1)⋅e−β0=eβ1
Z1,...,Zp
P(Y=1|X=1,Z1,...,Zp)P(Y=0|X=1,Z1,...,Zp)⋅P(Y=0|X=0,Z1,...,Zp)P(Y=1|X=0,Z1,...,Zp)
so it is the odds ratio conditional on the values of the other predictors in the model and, in general, in not equal to
P(Y=1|X=1)P(Y=0|X=1)⋅P(Y=0|X=0)P(Y=1|X=0)
So, it is no surprise that you're observing a discrepancy between the exponentiated coefficient and the observed odds ratio.
Note 2: I derived a relationship between the true β and the true odds ratio but note that the same relationship holds for the sample quantities since the fitted logistic regression with a single binary predictor will exactly reproduce the entries of a two-by-two table. That is, the fitted means exactly match the sample means, as with any GLM. So, all of the logic used above applies with the true values replaced by sample quantities.