Czym jest estymator
różnic w różnicach Różnica w różnicach (DiD) jest narzędziem do oszacowania efektów leczenia, porównując różnice przed i po leczeniu w wyniku leczenia i grupy kontrolnej. Ogólnie rzecz biorąc, jesteśmy zainteresowani oszacowaniem wpływu leczenia (np. Status związku, leki itp.) Na wynik (np. Płace, zdrowie itp.) Jak w
gdzie to indywidualne ustalone efekty (cechy jednostek, które nie zmieniają się w czasie), to efekty ustalone w czasie, to zmienne towarzyszące w czasie, takie jak wiek poszczególnych osób iDiYi
Yit=αi+λt+ρDit+X′itβ+ϵit
αiλtXitϵit jest terminem błędu. Osoby i czas są indeksowane przez i , odpowiednio. Jeśli istnieje korelacja między ustalonymi efektami a wówczas oszacowanie tej regresji za pomocą OLS będzie tendencyjne, biorąc pod uwagę, że ustalone efekty nie są kontrolowane. Jest to typowe
pominięte zmienne odchylenie .
itDit
Aby zobaczyć efekt leczenia, chcielibyśmy poznać różnicę między osobą w świecie, w którym otrzymywała leczenie, a tym, w którym nie. Oczywiście tylko jeden z nich można zaobserwować w praktyce. Dlatego szukamy osób z tymi samymi trendami w zakresie wstępnego leczenia w wyniku. Załóżmy, że mamy dwa okresy i dwie grupy . Następnie, przy założeniu, że trendy w grupach leczenia i kontrolnej byłyby kontynuowane w taki sam sposób jak poprzednio w przypadku braku leczenia, możemy oszacować efekt leczenia jako
t=1,2s=A,B
ρ=(E[Yist|s=A,t=2]−E[Yist|s=A,t=1])−(E[Yist|s=B,t=2]−E[Yist|s=B,t=1])
Graficznie wyglądałoby to mniej więcej tak:
Możesz po prostu obliczyć te środki ręcznie, tj. Uzyskać średni wynik grupy w obu okresach i przyjąć różnicę. Następnie uzyskaj średni wynik grupy w obu okresach i uwzględnij ich różnicę. Następnie weź różnicę w różnicach i to jest efekt leczenia. Jednak wygodniej jest to zrobić w ramach regresji, ponieważ pozwala to na toAB
- kontrolować współzmienne
- w celu uzyskania standardowych błędów efektu leczenia, aby sprawdzić, czy jest on znaczący
Aby to zrobić, możesz zastosować jedną z dwóch równoważnych strategii. Wygeneruj atrapę grupy kontrolnej która jest równa 1, jeśli dana osoba jest w grupie a w przeciwnym razie 0, wygeneruj atrapę czasu która jest równa 1, jeśli a w przeciwnym razie 0, a następnie regresuj
treatiAtimett=2
Yit=β1+β2(treati)+β3(timet)+ρ(treati⋅timet)+ϵit
Lub po prostu generujesz manekina który jest równy jeden, jeśli dana osoba jest w grupie leczenia ORAZ okres czasu jest okresem po leczeniu i w przeciwnym razie wynosi zero. Potem
Tit
Yit=β1γs+β2λt+ρTit+ϵit
gdzie jest znów atrapą dla grupy kontrolnej, a to manekiny czasu. Dwie regresje dają te same wyniki dla dwóch okresów i dwóch grup. Drugie równanie jest jednak bardziej ogólne, ponieważ łatwo rozciąga się na wiele grup i okresów. W obu przypadkach można w ten sposób oszacować parametr różnicy różnic w taki sposób, aby można było uwzględnić zmienne kontrolne (pominąłem te z powyższych równań, aby ich nie zaśmiecać, ale można je po prostu uwzględnić) i uzyskać standardowe błędy do wnioskowania.γsλt
Dlaczego przydatny jest kalkulator różnic w różnicach?
Jak stwierdzono wcześniej, DiD jest metodą szacowania efektów leczenia za pomocą danych nie eksperymentalnych. To najbardziej przydatna funkcja. DiD jest także wersją estymacji efektów stałych. Podczas gdy model efektów stałych zakłada , DiD przyjmuje podobne założenie, ale na poziomie grupy, . Zatem oczekiwaną wartością wyniku jest tutaj suma efektu grupy i czasu. Jaka jest różnica? Dla skończyłeś nie muszą danych panelowych o ile swoich wielokrotnych przekrojach pochodzą z tej samej jednostki kruszywo . To sprawia, że DiD ma zastosowanie do szerszego zakresu danych niż standardowe modele efektów stałych, które wymagają danych panelowych.E(Y0it|i,t)=αi+λtE(Y0it|s,t)=γs+λts
Czy możemy ufać różnicy różnic?
Najważniejszym założeniem w DiD jest założenie trendów równoległych (patrz rysunek powyżej). Nigdy nie ufaj badaniu, które nie pokazuje graficznie tych trendów! Dokumenty z lat 90. XX wieku mogły się z tym pogodzić, ale obecnie nasze rozumienie DiD jest znacznie lepsze. Jeśli nie ma przekonującego wykresu pokazującego równoległe trendy w wynikach leczenia wstępnego dla grup leczonych i kontrolnych, należy zachować ostrożność. Jeśli utrzyma się założenie o równoległych trendach i możemy w wiarygodny sposób wykluczyć wszelkie inne zmiany w czasie, które mogą zakłócać leczenie, to DiD jest wiarygodną metodą.
Należy zachować jeszcze jedno ostrzeżenie, jeśli chodzi o traktowanie standardowych błędów. W przypadku wieloletnich danych należy dostosować standardowe błędy autokorelacji. W przeszłości było to zaniedbywane, ale od czasu Bertrand i in. (2004) „Jak bardzo powinniśmy ufać szacunkom różnic w różnicach?” wiemy, że to jest problem. W artykule podają kilka sposobów zaradzenia autokorelacji. Najłatwiej jest skupić się na indywidualnym identyfikatorze panelu, co pozwala na dowolną korelację reszt pomiędzy poszczególnymi szeregami czasowymi. To koryguje zarówno autokorelację, jak i heteroscedastyczność.
Więcej informacji można znaleźć w notatkach z wykładów Waldingera i Pischke .