Czy procedura stałych efektów Mundlak ma zastosowanie do regresji logistycznej z manekinami?

12

Mam zestaw danych z 8000 klastrami i 4 milionami obserwacji. Niestety moje oprogramowanie statystyczne, Stata, działa dość wolno, gdy używa swojej funkcji danych panelowych do regresji logistycznej: xtlogitnawet z podpróbką 10%.

Jednak w przypadku korzystania z logitfunkcji niepanelowej wyniki pojawiają się znacznie wcześniej. Dlatego mogę korzystać ze logitzmodyfikowanych danych uwzględniających ustalone efekty.

Uważam, że ta procedura jest ukuta jako „procedura stałych efektów Mundlaka” (Mundlak, Y. 1978. Łączenie szeregów czasowych i danych przekrojowych. Econometrica, 46 (1), 69-85.)

Intuicyjne wyjaśnienie tej procedury znalazłem w pracy Antonakisa, J., Bendahana, S., Jacquarta, P. i Lalive, R. (2010). Co do roszczeń przyczynowych: przegląd i zalecenia. The Leadership Quarterly, 21 (6). 1086–1120. Cytuję:

Jednym ze sposobów obejścia problemu pominiętych efektów stałych i włączenia zmiennych poziomu 2 jest uwzględnienie średnich skupień wszystkich zmiennych towarzyszących poziomu 1 w modelu szacunkowym (Mundlak, 1978). Środki klastra mogą być uwzględnione jako regresory lub odjęte (tj. Centrowanie średniej klastra) od współzmiennej poziomu 1. Średnie skupienia są niezmienne w obrębie skupiska (i różnią się między klastrami) i pozwalają na spójne oszacowanie parametrów poziomu 1 tak, jakby uwzględniono efekty stałe (patrz Rabe-Hesketh i Skrondal, 2008).

Dlatego centrowanie średnich skupień wydaje się idealne i praktyczne do rozwiązania mojego problemu obliczeniowego. Jednak te dokumenty wydają się być ukierunkowane na regresję liniową (OLS).

Czy ta metoda centrowania średniego klastra ma również zastosowanie do „replikacji” binarnej regresji logistycznej o ustalonych efektach?

Bardziej techniczne pytanie, które powinno dać tę samą odpowiedź, brzmiałoby: czy xtlogit depvar indepvars, fez zestawem danych A jest równy logit depvar indepvarsz zestawem danych B, gdy zestaw danych B jest wersją zestawu danych A zorientowaną na klastrze?

Dodatkową trudnością, jaką znalazłem w tym skupieniu, jest sposób radzenia sobie z manekinami. Ponieważ manekiny mają wartość 0 lub 1, czy są identyczne w regresji efektów losowych i stałych? Czy nie powinny być „wyśrodkowane”?

— Tomek
źródło

9

Pierwsze różnicowanie lub transformacje, takie jak poniżanie, nie są dostępne w modelach takich jak logit, ponieważ w przypadku modeli nieliniowych takie sztuczki nie usuwają niezauważonych stałych efektów. Nawet jeśli posiadasz mniejszy zestaw danych, w którym można było uwzględnić indywidualne manekiny N-1 w celu bezpośredniego oszacowania ustalonych efektów, doprowadziłoby to do stronniczych oszacowań, chyba że wymiar czasowy twoich danych jest duży. Eliminacja stałych efektów w logit panelu nie wynika zatem z różnicowania ani poniżania i jest możliwa tylko ze względu na funkcjonalną formę logit. Jeśli jesteś zainteresowany szczegółami, możesz zapoznać się z tymi notatkami Söderbom na PDF strona 30 (wyjaśnienie, dlaczego poniżanie / pierwsze różnicowanie w logit / probit nie pomaga) i strona 42 (wprowadzenie estymatora logit panelu).

Innym problemem jest to, że xtlogitmodele logit panelowe nie oceniają bezpośrednio stałych efektów, które są potrzebne do obliczenia efektów krańcowych. Bez nich interpretacja współczynników może być bardzo niewygodna, co może być rozczarowujące po uruchomieniu modelu przez wiele godzin.

Przy tak dużym zestawie danych i wspomnianych wcześniej trudnościach koncepcyjnych logitu panelu FE trzymałbym się liniowego modelu prawdopodobieństwa. Mam nadzieję, że ta odpowiedź Cię nie rozczaruje, ale istnieje wiele dobrych powodów, aby udzielać takich rad: LPM jest znacznie szybszy, współczynniki można interpretować od razu (dotyczy to zwłaszcza efektów interakcji w modelu, ponieważ interpretacja ich zmiany współczynników w modelach nieliniowych!), ustalone efekty są łatwo kontrolowane i można dostosować standardowe błędy autokorelacji i klastrów bez wydłużania czasów szacowania poza uzasadnienie. Mam nadzieję, że to pomoże.

— Andy
źródło

1

To nie jest rozwiązanie, ale odpowiedź. Dzięki :)

— Tom

1

Mały punkt: str. 20 tych slajdów stanowi twój przypadek, ale model korekcji Mundlaka, czyli „skorelowanych efektów losowych” jest opisany na s. 47 i wydaje się, że nie ma takich zastrzeżeń.

— conjugateprior

1

Uważam, że logit warunkowy („clogit” na Stata), to alternatywny estymator panelu logit o stałym efekcie.

http://www3.nd.edu/~rwilliam/stats3/Panel03-FixedEffects.pdf

— Francesco
źródło

5

Witamy na stronie! Myślę, że nie jest to akceptowalna odpowiedź, ponieważ pytanie w rzeczywistości brzmi: jak uniknąć warunkowej (o ustalonych skutkach) regresji logistycznej poprzez zmodyfikowaną przekrojową regresję logistyczną w celu przyspieszenia oceny. W miarę odniesienia wskazuje (na górze strony 3) „możemy użyć zarówno Stata„s clogitpolecenie lub xtlogit, fepolecenie, aby wykonać trwałe efekty analizy logarytmicznej. Oba dają takie same wyniki. (W rzeczywistości, wierzę xtlogit, few rzeczywistości nazywa clogit).”The OP wiedział już xtlogit, fena podstawie przedostatniego akapitu.

— Randel

0

Allison omówili ten problem w Allison (2009), „Modele regresji efektów stałych”, s. 32 f.

Allison twierdzi, że nie można oszacować bezwarunkowego modelu z maksymalnym prawdopodobieństwem. Dzieje się tak, ponieważ modele stają się stronnicze z powodu „problemu z parametrami przypadkowymi”. Zamiast tego zaleca stosowanie warunkowego modelu logit (Chamberlain, 1980). Dokonuje się tego poprzez uzależnienie funkcji wiarygodności od liczby zdarzeń zaobserwowanych dla każdej osoby.

— Ciasteczkowy potwór
źródło