Jaka jest różnica między warunkową i bezwarunkową regresją kwantową?

38

Estymator warunkowej regresji kwantyli autorstwa Koenkera i Basset (1978) dla kwantyla jest zdefiniowany jako gdzie to funkcja ponownego ważenia (zwana funkcją „sprawdź”) reszt . $\tau^{th}$

{\hat{β}}_{Q R} = min_{b} \sum_{i = 1}^{n} ρ_{τ} (y_{i} - X_{i}^{'} b_{τ})

$\widehat{\beta}_{QR} = \min_{b} \sum^{n}_{i=1} \rho_\tau (y_i - X'_i b_\tau)$

ρ_{τ} = u_{i} \cdot (τ - 1 (u_{i} < 0))

$\rho_\tau = u_i\cdot (\tau - 1(u_i<0))$

u_{i}

$u_i$

W artykule Firpo i in. (2009) , autorzy stwierdzają, że warunkowa regresja kwantylowa nie daje interesujących efektów. Mówią, że wyników warunkowych nie można uogólnić na populację (w OLS zawsze możemy przejść od warunkowego do bezwarunkowego poprzez prawo iterowanych oczekiwań, ale nie jest to dostępne dla kwantyli). Jest tak, ponieważ $\tau^{th}$ bezwarunkowy kwantyl $y_i$ może nie być taki sam jak $\tau^{th}$ kwantyl warunkowy $y_i |X_i$ .

Jeśli dobrze rozumiem, część problemu polega na tym, że zmienne towarzyszące uwzględnione w $X_i$ mają wpływ na zmienną rankingową $u_i$ ponieważ włączenie zmiennych towarzyszących dzieli błąd na obserwowane i nieobserwowane składniki. Po prostu nie do końca rozumiem, dlaczego powoduje to problemy.

Oto moje pytania:

Co sprawia, że warunkowe i bezwarunkowe efekty kwantylowe różnią się od siebie?
Jak interpretować współczynniki warunkowych regresji kwantylowych?
Czy warunkowe regresje kwantylowe są stronnicze?

Bibliografia:

Koenker, R., i Bassett, G. (1978) „Regression Quantiles”, Econometrica , tom. 46 (1), s. 33–50.
Firpo, S. i in. (2009) „Bezwarunkowe regresje kwantylowe”, Econometrica , t. 77 (3), s. 953–973.

quantile-regression

— AlexH
źródło

1

Poleciłbym zapoznać się z rozdziałem 7 „W większości nieszkodliwych ekonometrii” autorstwa Angrista i Pischke. Zawiera kilka przykładów interpretacji współczynnika regresji kwantylowej i implikacji kwantyli uwarunkowanych względem X. Zgadzam się z tobą, że te implikacje nie unieważniają korzystania z modelu, chyba że szukasz izolacji oddzielić jedną zmienną towarzyszącą. Myślę, że regresje kwantowe również mogą być stronnicze; Angrist i Pischke badają na przykład niektóre proponowane metody kontroli pominiętych zmiennych.

— Juan C

1

Nie jest to odpowiedź, ale być może regresja kwantowa może być traktowana jako problem „brakujących danych”, gdzie brakujące dane to wagi używane w ważonej regresji OLS. Na przykład użycie rozkładu wykładniczego dla odwrotnej masy daje regresję medianową ( ).

τ = 50

$\tau=50$

— probabilityislogic

29

Konfiguracja
Załóżmy, że masz prostą regresję formularza gdzie wynikiem są zarobki osoby , to liczba lat nauki, a jest termin błędu. Zamiast patrzeć tylko na średni wpływ wykształcenia na zarobki, które uzyskałbyś za pośrednictwem OLS, chcesz również zobaczyć efekt w różnych częściach rozkładu wyników.

\ln y_{i} = α + β S_{i} + ϵ_{i}

$\ln y_i = \alpha + \beta S_i + \epsilon_i$

i

$i$

S_{i}

$S_i$

ϵ_{i}

$\epsilon_i$

1) Jaka jest różnica między ustawieniem warunkowym i bezwarunkowym
Najpierw wykreśl zarobki z dziennika i wybierzmy dwie osoby, i , gdzie znajduje się w dolnej części bezwarunkowego rozkładu zarobków, a jest w górnej części. $A$ $B$ $A$ $B$ wprowadź opis zdjęcia tutaj

Nie wygląda to normalnie, ale to dlatego, że wykorzystałem tylko 200 obserwacji w symulacji, więc nie przejmuj się. Co się stanie, jeśli uzależnimy nasze zarobki od lat edukacji? Dla każdego poziomu edukacji otrzymujesz „warunkowy” rozkład zarobków, tj. Wymyślisz wykres gęstości jak wyżej, ale dla każdego poziomu edukacji osobno.

wprowadź opis zdjęcia tutaj

Dwie ciemnoniebieskie linie to przewidywane zarobki z liniowych regresji kwantyli na środkowej (dolnej linii) i 90. percentylu (górnej linii). Czerwone gęstości przy 5 latach i 15 latach edukacji dają oszacowanie warunkowego podziału zarobków. Jak widać, osoba ma 5 lat edukacji, a osoba ma 15 lat edukacji. Najwyraźniej jednostka radzi sobie całkiem dobrze wśród swoich gruszek w pięcioletnim okresie edukacji, stąd jest w 90. percentylu. $A$ $B$ $A$

Kiedy więc uzależnisz się od innej zmiennej, stało się teraz, że jedna osoba znajduje się teraz w górnej części rozkładu warunkowego, podczas gdy ta osoba będzie w dolnej części rozkładu bezwarunkowego - to właśnie zmienia interpretację współczynników regresji kwantowej . Dlaczego?

Powiedziałeś już, że z OLS możemy przejść z , stosując prawo iterowanych oczekiwań, jednak jest to właściwość operatora oczekiwań, która nie jest dostępna dla kwantyli (niestety!). Dlatego ogólnie , w dowolnym kwantylu . Można to rozwiązać, najpierw wykonując warunkową regresję kwantylową, a następnie integrując zmienne warunkowe, aby uzyskać efekt marginalizacji (efekt bezwarunkowy), który można interpretować jak w OLS. Przykład takiego podejścia podaje Powell (2014) . $E[y_i|S_i] = E[y_i]$ $Q_{\tau}(y_i|S_i) \neq Q_{\tau}(y_i)$ $\tau$

2) Jak interpretować współczynniki regresji kwantyli?
To trudna część i nie twierdzę, że posiadam całą wiedzę na ten temat na świecie, więc może ktoś wymyśli lepsze wyjaśnienie tego. Jak zauważyłeś, pozycja jednostki w rozkładzie zysków może być bardzo różna, niezależnie od tego, czy rozważasz rozkład warunkowy, czy bezwarunkowy.

W przypadku warunkowej regresji kwantyli
Ponieważ nie jesteś w stanie określić, gdzie będzie osoba w rozkładzie wyników przed i po leczeniu, możesz składać tylko oświadczenia o rozkładzie jako całości. Na przykład w powyższym przykładzie wartość oznaczałaby, że dodatkowy rok nauki zwiększa zarobki w 90. percentylu warunkowej dystrybucji zarobków (ale nie wiesz, kto nadal jest w tym kwantylu przed tobą przypisany osobom dodatkowy rok nauki). Dlatego szacunkowe kwantyle warunkowe lub efekty warunkowego leczenia kwantylowego często nie są uważane za „interesujące”. Zwykle chcielibyśmy wiedzieć, jak leczenie wpływa na nasze indywidualne osoby, a nie tylko na dystrybucję. $\beta_{90} = 0.13$

W przypadku bezwarunkowej regresji kwantyli
Są to współczynniki OLS, które są używane do interpretacji. Trudność nie polega na interpretacji, ale na uzyskaniu tych współczynników, co nie zawsze jest łatwe (integracja może nie działać, np. Przy bardzo rzadkich danych). Dostępne są inne sposoby marginalizacji współczynników regresji kwantyli, takie jak metoda Firpo (2009) wykorzystująca najnowszą funkcję wpływu. W książce Angrista i Pischke (2009) wspomnianej w komentarzach stwierdzono, że marginalizacja współczynników regresji kwantowej jest nadal aktywną dziedziną badań w ekonometrii - choć, o ile wiem, większość ludzi decyduje się obecnie na metodę integracji (przykładem może być Melly i Santangelo (2015), którzy stosują go do modelu zmian w zmianach).

3) Czy współczynniki warunkowej regresji kwantyli są tendencyjne? Nie (zakładając, że masz poprawnie określony model), po prostu mierzą coś innego, czym możesz być lub nie być zainteresowany. Szacunkowy wpływ na rozkład, a nie na poszczególne osoby, jest, jak powiedziałem, niezbyt interesujący - przez większość czasu. Aby dać kontrprzykład: zastanów się nad decydentem, który wprowadza dodatkowy rok obowiązkowej nauki i chce wiedzieć, czy to zmniejszy nierówność zarobków w populacji.

Dwa górne panele pokazują czystą zmianę lokalizacji, gdzie jest stałą dla wszystkich kwantyli, tj. Stały efekt leczenia kwantylami, co oznacza, że jeśli , dodatkowy rok edukacji zwiększa zarobki o 8% w całym podziale zarobków. $\beta_{\tau}$ $\beta_{10} = \beta_{90} = 0.8$

Kiedy efekt leczenia kwantylowego NIE jest stały (jak w dwóch dolnych panelach), oprócz efektu lokalizacji masz również efekt skali. W tym przykładzie dolna część rozkładu zarobków przesuwa się w górę o więcej niż górna granica, więc różnica 90-10 (standardowa miara nierówności zarobków) zmniejsza się w populacji. wprowadź opis zdjęcia tutaj

Nie wiesz, jakie osoby na tym korzystają lub w jakiej części dystrybucji są ludzie, którzy zaczynali od dołu (aby odpowiedzieć na to pytanie, potrzebujesz bezwarunkowych współczynników regresji kwantyli). Być może ta polityka ich boli i stawia je w jeszcze niższej części w stosunku do innych, ale jeśli celem było dowiedzieć się, czy dodatkowy rok obowiązkowej edukacji zmniejsza rozpiętość zarobków, jest to pouczające. Przykładem takiego podejścia jest Brunello i in. (2009) .

Jeśli nadal interesuje Cię stronniczość regresji kwantylowych spowodowanych źródłami endogeniczności, spójrz na Angrista i in. (2006), gdzie wywodzą oni pominięty wzór zmiennej zmienności stronniczości dla kontekstu kwantowego.

— Andy
źródło

1

Czy obecnie istnieje implementacja R tej techniki?

— chandler

1

Oprócz doskonałej odpowiedzi udzielonej przez @Andy. Możesz sprawdzić:

Borah, BJ i Basu, A. (2013). „Podkreślanie różnic między podejściami do warunkowej i bezwarunkowej regresji kwantyli poprzez aplikację do oceny przylegania leków”. Health Economics, 22 (9), 1052–1070. http://doi.org/10.1002/hec.2927

— JustGettinStarted
źródło