Kiedy stosować stałe efekty w porównaniu do używania klastrowych SE?

19

Załóżmy, że masz jeden przekrój danych, w którym poszczególne osoby znajdują się w grupach (np. Uczniowie w szkołach) i chcesz oszacować model postaci, w Y_i = a + B*X_iktórej Xwektor cech indywidualnych i astałych jest stały.

W takim przypadku załóżmy, że nieobserwowana heterogeniczność między grupami wpływa na twoje oszacowania punktowe Bi ich SE, ponieważ jest to skorelowane z twoją niezależną zmienną zainteresowania.

Jedną z opcji jest grupowanie SE w grupy (szkoły). Innym jest włączenie grupowych FE. Innym jest użycie obu. Co należy wziąć pod uwagę, wybierając jedną z tych opcji? Szczególnie niejasne jest, dlaczego można grupować SE według grupy ORAZ używać grupy FE. W moim konkretnym przypadku mam 35 grup i 5000 osobników zagnieżdżonych w każdej z nich grupie. Śledziłem dyskusję w tym pliku PDF , ale nie jest jasne, dlaczego i kiedy można użyć zarówno klastrowych SE, jak i ustalonych efektów.

(Proszę omówić zalety i wady klastrowanych SE vs. FE zamiast sugerować, że po prostu pasuję do modelu wielopoziomowego.)

— Pytanie odpowiedź
źródło

22

Oba podejścia, wykorzystujące efekty ustalone dla grupy i / lub błąd standardowy skorygowany o klaster, biorą pod uwagę różne problemy związane z danymi klastrowymi (lub panelowymi) i wyraźnie widziałbym je jako odrębne podejścia. Często chcesz korzystać z obu:

Po pierwsze, skorygowane klasterowo standardowe konto błędu dla korelacji wewnątrz klastra lub heteroscedastyczności, którego estymator efektów stałych nie bierze pod uwagę, chyba że jesteś gotów poczynić dalsze założenia, zobacz slajdy wykładowe Imbens i Wooldridge, aby uzyskać dobre omówienie krótkich oraz długie panele i różne problemy związane z tym problemem . Istnieje również artykuł na ten temat autorstwa Camerona i Millera: Przewodnik dla praktyków po wnioskowaniu o klastrach, który może być dla ciebie interesujący. Jeśli nie chcesz modelować macierzy wariancji-kowariancji i podejrzewasz, że istnieje korelacja w obrębie klastra, radzę użyć solidnego standardowego błędu klastra, ponieważ odchylenie w SE może być poważne (znacznie bardziej problematyczne niż w przypadku heteroscedastyczności, patrzAngrist & Pischke Rozdział III.8 za dyskusję na ten temat. Ale potrzebujesz wystarczającej liczby klastrów (Angrist i Pischke mówią 40-50 jako rola kciuka). Błąd standardowy skorygowany o klastry bierze pod uwagę błąd standardowy, ale pozostawia szacunki punktów bez zmian (błąd standardowy zwykle rośnie)!

Oszacowanie efektów stałych uwzględnia nieobserwowaną heterogeniczność niezmienną w czasie (jak wspomniałeś). Może to być dobre lub złe: z drugiej strony potrzebujesz mniej założeń, aby uzyskać spójne szacunki. Z drugiej strony odrzucasz wiele wariancji, które mogą być przydatne. Niektórzy ludzie, tacy jak Andrew Gelman, wolą modelowanie hierarchiczne niż stałe efekty, ale tutaj opinie są odmienne. Estymacja efektów stałych zmieni zarówno estymację punktową, jak i interwałową (również tutaj błąd standardowy będzie zwykle wyższy).

Podsumowując: Odporny na klastry błąd standardowy to łatwy sposób na wyjaśnienie możliwych problemów związanych z danymi w klastrze, jeśli nie chcesz zawracać sobie głowy modelowaniem korelacji między klastrami i wewnątrz klastra (a dostępnych jest wystarczająco dużo klastrów). Szacowanie efektów stałych będzie wymagać użycia tylko określonej odmiany, więc zależy od modelu, czy chcesz dokonywać oszacowań na podstawie mniejszej zmienności, czy nie. Jednak bez dalszych założeń estymacja efektów stałych nie zajmie się problemami związanymi z korelacją wewnątrz klastrów dla macierzy wariancji. Odporny na klastry błąd standardowy również nie uwzględni problemów związanych z wykorzystaniem oszacowania efektów stałych.

— Arne Jonas Warnke
źródło

2

Dobra odpowiedź. Pozostaje kluczowym pytaniem, dlaczego chce się ZARÓWNO. Imbens i Wooldridge w pewnym stopniu to pokrywają.

— Pytanie Odpowiedź

14

Naprawiono efekty usuwania nieobserwowanej heterogeniczności MIĘDZY różnymi grupami w danych.

Nie zgadzam się z implikacją przyjętej odpowiedzi, że decyzja o zastosowaniu modelu FE będzie zależała od tego, czy chcesz użyć „mniejszej zmienności, czy nie”. Jeśli na zmienną zależną wpływ mają zmienne nieobserwowalne, które systematycznie zmieniają się w różnych grupach w panelu, wówczas współczynnik każdej zmiennej skorelowanej z tą zmiennością będzie tendencyjny. O ile zmienne X nie zostały losowo przypisane (i nigdy nie będą miały danych obserwacyjnych), zwykle dość łatwo jest argumentować za pomijaniem zmiennych pominiętych. ty możebyć w stanie kontrolować niektóre z pominiętych zmiennych za pomocą dobrej listy zmiennych kontrolnych, ale jeśli silna identyfikacja jest twoim celem numer 1, nawet obszerna lista kontroli może pozostawić miejsce dla krytycznych czytelników, by wątpić w twoje wyniki. W takich przypadkach zwykle dobrym pomysłem jest użycie modelu z efektami stałymi.

Klastrowe błędy standardowe dotyczą rozliczania sytuacji, w których obserwacje W KAŻDEJ grupie nie są identyfikowane (niezależnie i identycznie).

Klasycznym przykładem jest sytuacja, gdy masz wiele obserwacji dla panelu firm w czasie. Można uwzględnić ustalone efekty na poziomie firmy, ale nadal może istnieć pewna niewyjaśniona odmiana w zmiennej zależnej, która jest skorelowana w czasie. Zasadniczo podczas pracy z danymi szeregów czasowych zwykle bezpieczne jest założenie czasowej korelacji szeregowej pod względem błędów w obrębie grup. Te sytuacje są najbardziej oczywistymi przypadkami użycia dla klastrowych SE.

Kilka przykładowych przykładów:

Jeśli masz dane eksperymentalne, w których losowo przypisujesz leczenie, ale z upływem czasu robisz wielokrotne obserwacje dla każdej osoby / grupy, uzasadnione byłoby pominięcie ustalonych efektów, ale chciałbyś zgrupować swoje SE.

Alternatywnie, jeśli masz wiele obserwacji na grupę dla danych nieeksperymentalnych, ale każdą obserwację wewnątrz grupy można uznać za losowanie z ich większej grupy (np. Masz obserwacje z wielu szkół, ale każda grupa jest losowo losowanym podzbiorem uczniów ze swojej szkoły), chciałbyś uwzględnić stałe efekty, ale nie potrzebujesz klastrowych SE.

— Alex P. Miller
źródło

2

Te odpowiedzi są w porządku, ale najnowszą i najlepszą odpowiedź udzielili Abadie i in. (2019) „Kiedy należy dostosować standardowe błędy do grupowania?” W przypadku stałych efektów głównym powodem klastrowania jest różnorodność efektów leczenia w klastrach. Istnieją inne powody, na przykład jeśli klastry (np. Firmy, kraje) są podzbiorem klastrów w populacji (o których się wnioskuje). Grupowanie jest kwestią projektową, głównym przesłaniem artykułu. Nie rób tego na ślepo.

— Kishore Gawande
źródło