Krótka odpowiedź brzmi „tak, możesz” - ale powinieneś porównać maksymalne oszacowania wiarygodności (MLE) „dużego modelu” ze wszystkimi zmiennymi w obu modelach dopasowanych do obu.
Jest to „quasi-formalny” sposób na uzyskanie teorii prawdopodobieństwa, aby odpowiedzieć na twoje pytanie
W tym przykładzie i Y 2 są tego samego typu zmiennymi (ułamki / procenty), więc są porównywalne. Zakładam, że do obu pasuje ten sam model. Mamy więc dwa modele:Y1Y2
l o g ( p 1 i
M1:Y1i∼Bin(n1i,p1i)
M2:Y2i∼Bin(n2i,p2i)log(p 2 ilog(p1i1−p1i)=α1+β1Xi
M2:Y2i∼Bin(n2i,p2i)
log(p2i1−p2i)=α2+β2Xi
Masz więc hipotezę, którą chcesz ocenić:
H0:β1>β2
I masz trochę danych oraz kilka wcześniejszych informacji (takich jak zastosowanie modelu logistycznego). Obliczasz prawdopodobieństwo:{Y1i,Y2i,Xi}ni=1
P=Pr(H0|{Y1i,Y2i,Xi}ni=1,I)
Teraz nie zależy od rzeczywistej wartości któregokolwiek z parametrów regresji, więc należy je usunąć poprzez marginalizację.H0
P=∫∞−∞∫∞−∞∫∞−∞∫∞−∞Pr(H0,α1,α2,β1,β2|{Y1i,Y2i,Xi}ni=1,I)dα1dα2dβ1dβ2
Hipoteza po prostu ogranicza zakres integracji, więc mamy:
P=∫∞−∞∫∞β2∫∞−∞∫∞−∞Pr(α1,α2,β1,β2|{Y1i,Y2i,Xi}ni=1,I)dα1dα2dβ1dβ2
Ponieważ prawdopodobieństwo jest uzależnione od danych, zostanie ono uwzględnione w dwóch osobnych elementach bocznych każdego modelu
Pr(α1,β1|{Y1i,Xi,Y2i}ni=1,I)Pr(α2,β2|{Y2i,Xi,Y1i}ni=1,I)
Now because there is no direct links between Y1i and α2,β2, only indirect links through Xi, which is known, it will drop out of the conditioning in the second posterior. same for Y2i in the first posterior.
From standard logistic regression theory, and assuming uniform prior probabilities, the posterior for the parameters is approximately bi-variate normal with mean equal to the MLEs, and variance equal to the information matrix, denoted by V1 and V2 - which do not depend on the parameters, only the MLEs. so you have straight-forward normal integrals with known variance matrix. αj marginalises out with no contribution (as would any other "common variable") and we are left with the usual result (I can post the details of the derivation if you want, but its pretty "standard" stuff):
P=Φ(β^2,MLE−β^1,MLEV1:β,β+V2:β,β−−−−−−−−−−−√)
Where Φ() is just the standard normal CDF. This is the usual comparison of normal means test. But note that this approach requires the use of the same set of regression variables in each. In the multivariate case with many predictors, if you have different regression variables, the integrals will become effectively equal to the above test, but from the MLEs of the two betas from the "big model" which includes all covariates from both models.