Czytałem, że estymator 2SLS jest nadal spójny nawet z binarną zmienną endogenną ( http://www.stata.com/statalist/archive/2004-07/msg00699.html ). W pierwszym etapie zamiast modelu liniowego zostanie uruchomiony model leczenia probitowego.
Czy istnieje formalny dowód na to, że 2SLS jest nadal spójny, nawet jeśli 1. etap jest modelem probit lub logit?
A co jeśli wynik jest również binarny? Rozumiem, że jeśli mamy wynik binarny i binarną zmienną endogeniczną (1. i 2. etap to oba binarne modele probit / logit), naśladowanie metody 2SLS da niespójne oszacowanie. Czy jest na to jakiś formalny dowód? Książka ekonometryczna Wooldridge'a ma pewne dyskusje, ale myślę, że nie ma rygorystycznego dowodu, który wykazywałby niespójność.
data sim;
do i=1 to 500000;
iv=rand("normal",0,1);
x2=rand("normal",0,1);
x3=rand("normal",0,1);
lp=0.5+0.8*iv+0.5*x2-0.2*x3;
T=rand("bernoulli",exp(lp)/(1+exp(lp)));
Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
output;
end;
run;
****1st stage: logit model ****;
****get predicted values ****;
proc logistic data=sim descending;
model T=IV;
output out=pred1 pred=p;
run;
****2nd stage: ols model with predicted values****;
proc reg data=pred1;
model y=p;
run;
współczynnik p = 1.19984
. Prowadzę tylko jedną symulację, ale z dużą próbką.