yist=Ag+Bt+βDst+cXist+ϵist
i uzyskaj efekt przyczynowy leczenia jako oczekiwaną różnicę po wyniku przed leczeniem minus oczekiwaną różnicę po zakończeniu leczenia dla kontroli.
yit=αi+Bt+βDit+cXit+ϵit
Dit autor: Steve Pischke.
Ag
Oto przykład kodu, który pokazuje, że tak jest. Używam Staty, ale możesz to powtórzyć w wybranym pakiecie statystycznym. „Osoby” tutaj są w rzeczywistości krajami, ale nadal są pogrupowane według niektórych wskaźników leczenia.
* load the data set (requires an internet connection)
use "http://dss.princeton.edu/training/Panel101.dta"
* generate the time and treatment group indicators and their interaction
gen time = (year>=1994) & !missing(year)
gen treated = (country>4) & !missing(country)
gen did = time*treated
* do the standard DiD regression
reg y_bin time treated did
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .1212795 3.09 0.003 .1328576 .6171424
treated | .4166667 .1434998 2.90 0.005 .13016 .7031734
did | -.4027778 .1852575 -2.17 0.033 -.7726563 -.0328992
_cons | .5 .0939427 5.32 0.000 .3124373 .6875627
------------------------------------------------------------------------------
* now repeat the same regression but also including country fixed effects
areg y_bin did time treated, a(country)
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .120084 3.12 0.003 .1348773 .6151227
treated | 0 (omitted)
did | -.4027778 .1834313 -2.20 0.032 -.7695713 -.0359843
_cons | .6785714 .070314 9.65 0.000 .53797 .8191729
-------------+----------------------------------------------------------------
Widzisz więc, że współczynnik DiD pozostaje taki sam, gdy uwzględniane są poszczególne efekty stałe ( areg
jest to jedno z dostępnych poleceń szacowania efektów stałych w Stata). Standardowe błędy są nieco ściślejsze, a nasz oryginalny wskaźnik leczenia został pochłonięty przez poszczególne ustalone efekty i dlatego spadł w regresji.
W odpowiedzi na komentarz
wspomniałem przykład Pischke, aby pokazać, kiedy ludzie używają indywidualnych ustalonych efektów, a nie wskaźnika grupy leczenia. Twoje ustawienie ma dobrze zdefiniowaną strukturę grupy, więc sposób, w jaki napisałeś swój model, jest w porządku. Standardowe błędy powinny być grupowane na poziomie miasta, tj. Na poziomie agregacji, na którym następuje leczenie (nie zrobiłem tego w przykładowym kodzie, ale w ustawieniach DiD standardowe błędy należy poprawić, jak wykazali Bertrand i in. ).
Dstst
c=[E(yist|s=1,t=1)−E(yist|s=1,t=0)]−[E(yist|s=0,t=1)−E(yist|s=0,t=0)]
E(yist|s=1,t=1)E(yist|s=0,t=1). Aby wyjaśnić, dlaczego identyfikacja wynika z różnic grupowych w czasie, a nie od osób poruszających się, możesz to sobie wyobrazić za pomocą prostego wykresu. Przypuśćmy, że zmiana wyniku jest naprawdę tylko z powodu leczenia i że ma równoczesny efekt. Jeśli mamy osobę, która mieszka w leczonym mieście po rozpoczęciu leczenia, ale następnie przenosi się do miasta kontrolnego, ich wynik powinien powrócić do stanu sprzed leczenia. Jest to pokazane na poniższym stylizowanym wykresie.
Nadal możesz chcieć myśleć o przeprowadzkach z innych powodów. Na przykład, jeśli leczenie ma trwały efekt (tj. Nadal wpływa na wynik, nawet jeśli osoba się przeprowadziła)