Czy mediana-bezstronna Just-Identified 2SLS?

W „W większości nieszkodliwych ekonometriach: towarzysz empirysty” (Angrist i Pischke, 2009: strona 209) czytam:

(...) W rzeczywistości właśnie zidentyfikowana 2SLS (powiedzmy, prosty estymator Wald) jest w przybliżeniu bezstronna . Jest to trudne do formalnego wykazania, ponieważ właśnie zidentyfikowana 2SLS nie ma momentów (tj. Rozkład próbkowania ma ogony tłuszczu). Niemniej jednak, nawet przy słabych instrumentach, właśnie zidentyfikowany 2SLS jest w przybliżeniu wyśrodkowany tam, gdzie powinien. Dlatego mówimy, że właśnie zidentyfikowany 2SLS jest bezstronny względem mediany. (...)

Chociaż autorzy twierdzą, że właśnie zidentyfikowany 2SLS jest bezstronny pod względem mediany, nie dowodzą tego ani nie podają odniesienia do dowodu . Na stronie 213 ponownie wspominają tę propozycję, ale bez odniesienia do dowodu. Nie znajduję też żadnej motywacji dla tej propozycji w notatkach z wykładu na temat zmiennych instrumentalnych z MIT , strona 22.

Przyczyną może być fałszywa propozycja, ponieważ odrzucają ją w notatce na swoim blogu . Piszą, że właśnie zidentyfikowana 2SLS jest w przybliżeniu mediana-obiektywna. Motywują to za pomocą małego eksperymentu Monte-Carlo, ale nie dostarczają żadnego analitycznego dowodu ani wyrażenia w formie zamkniętej terminu błędu związanego z przybliżeniem. W każdym razie była to odpowiedź autorów na profesora Gary'ego Solona z Michigan State University, który skomentował, że właśnie zidentyfikowane 2SLS nie jest medianowo bezstronne.

Pytanie 1: Jak udowodnić, że właśnie zidentyfikowany 2SLS nie jest bezstronny, jak argumentuje Gary Solon?

Pytanie 2: Jak udowodnić, że właśnie zidentyfikowana 2SLS jest w przybliżeniu bezstronna, jak twierdzą Angrist i Pischke?

Na pytanie 1 szukam kontrprzykładu. W przypadku pytania 2 szukam (przede wszystkim) dowodu lub odniesienia do dowodu.

W tym kontekście szukam także formalnej definicji medianobezstronnej . Rozumiem pojęcie następująco: Estymator z na podstawie pewnego zbioru od zmiennych losowych jest mediana-bezstronna dla wtedy i tylko jeśli rozkład ma medianę . $\hat{\theta}(X_{1:n})$ $\theta$ $X_{1:n}$ $n$ $\theta$ $\hat{\theta}(X_{1:n})$ $\theta$

Notatki

W właśnie zidentyfikowanym modelu liczba endogennych regresorów jest równa liczbie instrumentów.
Ramy opisujące właśnie zidentyfikowany model zmiennych instrumentalnych można wyrazić w następujący sposób: Model przyczynowo-skutkowy będący przedmiotem zainteresowania i równanie pierwszego etapu to gdzie jest macierzą opisującą regresorów endogennych, a zmienne instrumentalne są opisane przez macierzy . Tutaj opisuje tylko pewną liczbę zmiennych kontrolnych (np. Dodanych w celu poprawy precyzji); i i są terminami błędach.
$\begin{matrix} (1) & {\begin{cases} Y & = X β + W γ + u \\ X & = Z δ + W ζ + v \end{cases} \end{matrix}$ $\begin{cases} Y&=X\beta+W\gamma+u \\ X&=Z\delta+W\zeta+v \end{cases}\tag{1}$ $X$ $k\times n+1$ $k$ $k\times n+1$ $Z$ $W$ $u$ $v$
Oszacować w za pomocą 2SLS Po pierwsze, cofanie się z kontrolując i uzyskiwania wartości przewidywanych ; nazywa się to pierwszym etapem. Po drugie, zresetuj na kontrolując dla ; nazywa się to drugim etapem. Szacowany współczynnik na w drugim etapie jest naszym oszacowaniem 2SLS na poziomie . $\beta$ $(1)$ $X$ $Z$ $W$ $\hat{X}$ $Y$ $\hat{X}$ $W$ $\hat{X}$ $\beta$
W najprostszym przypadku mamy model i instrumentujemy endogenny regresor pomocą . W tym przypadku oszacowanie 2SLS dla to gdzie oznacza próbkę kowariancji pomiędzy i . Możemy uprościć : gdzie , oraz
$y_{i} = α + β x_{i} + u_{i}$ $y_i=\alpha+\beta x_i+u_i$ $x_i$ $z_i$ $\beta$ $\begin{matrix} (2) & {\hat{β}}^{2SLS} = \frac{s_{Z Y}}{s_{Z X}}, \end{matrix}$ $\hat{\beta}^{\text{2SLS}}=\frac{s_{ZY}}{s_{ZX}}\tag{2},$ $s_{AB}$ $A$ $B$ $(2)$ $\begin{matrix} (3) & {\hat{β}}^{2SLS} = \frac{\sum_{i} (y_{i} - \bar{y}) z_{i}}{\sum_{i} (x_{i} - \bar{x}) z_{i}} = β + \frac{\sum_{i} (u_{i} - \bar{u}) z_{i}}{\sum_{i} (x_{i} - \bar{x}) z_{i}} \end{matrix}$ $\hat{\beta}^{\text{2SLS}}=\frac{\sum_i(y_i-\bar{y})z_i}{\sum_i(x_i-\bar{x})z_i}=\beta+\frac{\sum_i(u_i-\bar{u})z_i}{\sum_i(x_i-\bar{x})z_i}\tag{3}$ $\bar{y}=\sum_iy_i/n$ $\bar{x}=\sum_i x_i/n$ $\bar{u}=\sum_i u_i/n$ , gdzie jest liczbą obserwacji. $n$
Przeszukałem literaturę, używając słów „właśnie zidentyfikowany” i „bezstronny”, aby znaleźć referencje odpowiadające na pytania 1 i 2 (patrz wyżej). Nie znalazłem żadnego. Wszystkie znalezione przeze mnie artykuły (patrz poniżej) odnoszą się do Angrista i Pischke (2009: strona 209, 213), stwierdzając, że właśnie zidentyfikowana 2SLS jest bezstronna.
- Jakiela, P., Miguel, E., i Te Velde, VL (2015). Zasłużyłeś na to: oszacowanie wpływu kapitału ludzkiego na preferencje społeczne. Experimental Economics , 18 (3), 385–407.
- An, W. (2015). Szacunkowe zmienne instrumentalne efektów rówieśniczych w sieciach społecznościowych. Social Science Research , 50, 382–394.
- Vermeulen, W., i Van Ommeren, J. (2009). Czy planowanie przestrzenne kształtuje gospodarki regionalne? Jednoczesna analiza podaży mieszkań, migracji wewnętrznej i lokalnego wzrostu zatrudnienia w Holandii. Journal of Housing Economics , 18 (4), 294-310.
- Aidt, TS i Leon, G. (2016). Demokratyczna szansa: dowody zamieszek w Afryce Subsaharyjskiej. Journal of Conflict Resolution , 60 (4), 694-717.

— Elias
źródło

Nie mogłem odpowiedzieć na to formalnym dowodem, ale raczej z niektórymi badaniami symulacyjnymi wykazującymi, że LIML jest medianą obiektywną (plus definicja) oraz że LIML i 2SLS z jedną zmienną endogenną i jednym instrumentem mają ten sam rozkład małych próbek (stąd, jeśli LIML jest w tym wielkość liter jest mediana-bezstronna, podobnie jak 2SLS). Czy to wystarczy, aby odpowiedzieć na twoje pytanie?

— Andy,

@Andy To byłaby naprawdę dobra odpowiedź! Może wystarczające, w zależności od tego, co powiedzą inni użytkownicy. Prawdopodobnie wystarcza, ponieważ uważam, że nie ma dowodu na to, że właśnie zidentyfikowana 2SLS jest w przybliżeniu mediana bezstronna. Byłoby miło, gdyby kontrprzykład pokazał, że właśnie zidentyfikowany 2SLS nie jest jednak bezstronny; ale myślę, że jest możliwe (choć może trudne) wymyślenie kontrprzykładu.

— Elias

Przez w przybliżeniu bezstronny, czy masz na myśli to, że odchylenie jest zerowe jako funkcja liczby obserwacji, na przykład 1 / n lub 1 / n ^ 2 itd.?

— Igor

@Igor Nie używam wyrażenia „w przybliżeniu bez mediany”. Ponieważ nie wiem, co formalnie oznacza „bezstronna mediana”, nie mogę odpowiedzieć na twoje pytanie. Ale wydaje ci się, że myślisz o tym, że estymator jest asymptotycznie bezstronny.

— Elias

W badaniach symulacyjnych termin odchylenie środkowe odnosi się do wartości bezwzględnej odchyleń estymatora od jego wartości rzeczywistej (którą znasz w tym przypadku, ponieważ jest to symulacja, więc wybierasz wartość prawdziwą). Możesz zobaczyć dokument roboczy Younga (2017), który określa takie średnie odchylenie w tabeli 15, lub Andrews i Armstrong (2016), którzy kreślą wykresy średniego błędu dla różnych estymatorów na rycinie 2.

Część zamieszania (również w literaturze) wydaje się wynikać z faktu, że istnieją dwa odrębne podstawowe problemy:

słabe instrumenty
wiele (potencjalnie) słabych instrumentów

Problem posiadania słabego instrumentu w właśnie zidentyfikowanym otoczeniu jest bardzo różny od posiadania wielu instrumentów, w których niektóre są słabe, jednak te dwa problemy czasem się łączą.

Przede wszystkim rozważmy związek między estymatorami, o których tu mówimy. Theil (1953) w „Estimation and Simultaneous Correlation in Complete Equation Systems” wprowadził tak zwany estymator -klass: $\kappa$

\hat{β} = {[X^{'} (I - κ M_{Z}) X]}^{- 1} [X^{'} (I - κ M_{Z})_{y})]

$\widehat{\beta} = \left[ X'(I-\kappa M_Z)X \right]^{-1}\left[ X'(I-\kappa M_Z)_y) \right]$

$M_Z = I-Z(Z'Z)^{-1}Z'$

\begin{aligned} y & = X β + u \\ X & = Z π + e . \end{aligned}

$\begin{align} y &= X\beta + u \\ X &= Z\pi + e. \end{align}$

$\kappa$ $\kappa = 0$ $\kappa = 1$ $\kappa$ $\det (X'X - \kappa X'M_ZX))=0$

Asymptotycznie LIML i 2SLS mają ten sam rozkład, jednak w małych próbkach może to być bardzo różne. Jest tak szczególnie w przypadku, gdy mamy wiele instrumentów, a niektóre z nich są słabe. W takim przypadku LIML działa lepiej niż 2SLS. Wykazano, że LIML jest medianą obiektywną. Ten wynik pochodzi z szeregu badań symulacyjnych. Zwykle artykuły stwierdzające ten wynik odnoszą się do Rothberga (1983) „Właściwości asymptotyczne niektórych estymatorów w modelach strukturalnych”, Sawa (1972) lub Anderson i in. (1982) .

Steve Pischke przedstawia symulację tego wyniku w swoich notatkach z 2016 roku na slajdzie 17, pokazujących rozkład OLS, LIML i 2SLS za pomocą 20 instrumentów, z których tylko jeden jest w rzeczywistości przydatny. Rzeczywista wartość współczynnika wynosi 1. Widzisz, że LIML jest wyśrodkowany na wartości rzeczywistej, podczas gdy 2SLS jest nastawiony na OLS.

Teraz wydaje się, że argument jest następujący: biorąc pod uwagę, że LIML można wykazać jako medianę bezstronną oraz że w właśnie zidentyfikowanym przypadku (jedna zmienna endogenna, jeden instrument) LIML i 2SLS są równoważne, 2SLS musi również być medianą bezstronną.

Wydaje się jednak, że ludzie znów mieszają „słaby instrument” i przypadek „wielu słabych instrumentów”, ponieważ w właśnie zidentyfikowanym ustawieniu zarówno LIML, jak i 2SLS będą stronnicze, gdy instrument jest słaby. Nie widziałem żadnego wyniku, w którym wykazano, że LIML jest bezstronny w właśnie zidentyfikowanym przypadku, gdy instrument jest słaby i nie sądzę, że to prawda. Podobny wniosek wychodzi Angrist i Pischke'S (2009) odpowiedzi Gary Solo na stronie 2, gdzie one symulować stronniczość OLS, 2SLS i LIML przy zmianie siły instrumentu.

Dla bardzo małych współczynników pierwszego stopnia <0,1 (utrzymujących stały błąd standardowy), tj. Niskiej siły instrumentu, właśnie zidentyfikowana 2SLS (a zatem właśnie zidentyfikowana LIML) jest znacznie bliższa granicy prawdopodobieństwa estymatora OLS w porównaniu do prawdziwa wartość współczynnika 1.

Gdy współczynnik pierwszego etapu wynosi między 0,1 a 0,2, zauważają, że statystyka pierwszego etapu F jest powyżej 10, a zatem nie ma już problemu ze słabym instrumentem zgodnie z regułą F> 10 autorstwa Stocka i Yogo (2005). W tym sensie nie rozumiem, w jaki sposób LIML ma być rozwiązaniem problemu słabego instrumentu w właśnie zidentyfikowanym przypadku. Zauważ również, że i) LIML jest bardziej rozproszony i wymaga korekty standardowych błędów (patrz Bekker, 1994) oraz ii) jeśli twój instrument jest rzeczywiście słaby, nie znajdziesz niczego w drugim etapie ani z 2SLS, ani LIML ponieważ standardowe błędy będą po prostu zbyt duże.

— Andy
źródło

Dziękuję za odpowiedź! To wszystko wyjaśniło mi wszystko.

— Elias,