Konfiguracja
Załóżmy, że masz prostą regresję formularza
gdzie wynikiem są zarobki osoby , to liczba lat nauki, a jest termin błędu. Zamiast patrzeć tylko na średni wpływ wykształcenia na zarobki, które uzyskałbyś za pośrednictwem OLS, chcesz również zobaczyć efekt w różnych częściach rozkładu wyników.
lnyi=α+βSi+ϵi
iSiϵi
1) Jaka jest różnica między ustawieniem warunkowym i bezwarunkowym
Najpierw wykreśl zarobki z dziennika i wybierzmy dwie osoby, i , gdzie znajduje się w dolnej części bezwarunkowego rozkładu zarobków, a jest w górnej części.
ABAB
Nie wygląda to normalnie, ale to dlatego, że wykorzystałem tylko 200 obserwacji w symulacji, więc nie przejmuj się. Co się stanie, jeśli uzależnimy nasze zarobki od lat edukacji? Dla każdego poziomu edukacji otrzymujesz „warunkowy” rozkład zarobków, tj. Wymyślisz wykres gęstości jak wyżej, ale dla każdego poziomu edukacji osobno.
Dwie ciemnoniebieskie linie to przewidywane zarobki z liniowych regresji kwantyli na środkowej (dolnej linii) i 90. percentylu (górnej linii). Czerwone gęstości przy 5 latach i 15 latach edukacji dają oszacowanie warunkowego podziału zarobków. Jak widać, osoba ma 5 lat edukacji, a osoba ma 15 lat edukacji. Najwyraźniej jednostka radzi sobie całkiem dobrze wśród swoich gruszek w pięcioletnim okresie edukacji, stąd jest w 90. percentylu.ABA
Kiedy więc uzależnisz się od innej zmiennej, stało się teraz, że jedna osoba znajduje się teraz w górnej części rozkładu warunkowego, podczas gdy ta osoba będzie w dolnej części rozkładu bezwarunkowego - to właśnie zmienia interpretację współczynników regresji kwantowej . Dlaczego?
Powiedziałeś już, że z OLS możemy przejść z , stosując prawo iterowanych oczekiwań, jednak jest to właściwość operatora oczekiwań, która nie jest dostępna dla kwantyli (niestety!). Dlatego ogólnie , w dowolnym kwantylu . Można to rozwiązać, najpierw wykonując warunkową regresję kwantylową, a następnie integrując zmienne warunkowe, aby uzyskać efekt marginalizacji (efekt bezwarunkowy), który można interpretować jak w OLS. Przykład takiego podejścia podaje Powell (2014) .E[yi|Si]=E[yi]Qτ(yi|Si)≠Qτ(yi)τ
2) Jak interpretować współczynniki regresji kwantyli?
To trudna część i nie twierdzę, że posiadam całą wiedzę na ten temat na świecie, więc może ktoś wymyśli lepsze wyjaśnienie tego. Jak zauważyłeś, pozycja jednostki w rozkładzie zysków może być bardzo różna, niezależnie od tego, czy rozważasz rozkład warunkowy, czy bezwarunkowy.
W przypadku warunkowej regresji kwantyli
Ponieważ nie jesteś w stanie określić, gdzie będzie osoba w rozkładzie wyników przed i po leczeniu, możesz składać tylko oświadczenia o rozkładzie jako całości. Na przykład w powyższym przykładzie wartość oznaczałaby, że dodatkowy rok nauki zwiększa zarobki w 90. percentylu warunkowej dystrybucji zarobków (ale nie wiesz, kto nadal jest w tym kwantylu przed tobą przypisany osobom dodatkowy rok nauki). Dlatego szacunkowe kwantyle warunkowe lub efekty warunkowego leczenia kwantylowego często nie są uważane za „interesujące”. Zwykle chcielibyśmy wiedzieć, jak leczenie wpływa na nasze indywidualne osoby, a nie tylko na dystrybucję.β90=0.13
W przypadku bezwarunkowej regresji kwantyli
Są to współczynniki OLS, które są używane do interpretacji. Trudność nie polega na interpretacji, ale na uzyskaniu tych współczynników, co nie zawsze jest łatwe (integracja może nie działać, np. Przy bardzo rzadkich danych). Dostępne są inne sposoby marginalizacji współczynników regresji kwantyli, takie jak metoda Firpo (2009) wykorzystująca najnowszą funkcję wpływu. W książce Angrista i Pischke (2009) wspomnianej w komentarzach stwierdzono, że marginalizacja współczynników regresji kwantowej jest nadal aktywną dziedziną badań w ekonometrii - choć, o ile wiem, większość ludzi decyduje się obecnie na metodę integracji (przykładem może być Melly i Santangelo (2015), którzy stosują go do modelu zmian w zmianach).
3) Czy współczynniki warunkowej regresji kwantyli są tendencyjne?
Nie (zakładając, że masz poprawnie określony model), po prostu mierzą coś innego, czym możesz być lub nie być zainteresowany. Szacunkowy wpływ na rozkład, a nie na poszczególne osoby, jest, jak powiedziałem, niezbyt interesujący - przez większość czasu. Aby dać kontrprzykład: zastanów się nad decydentem, który wprowadza dodatkowy rok obowiązkowej nauki i chce wiedzieć, czy to zmniejszy nierówność zarobków w populacji.
Dwa górne panele pokazują czystą zmianę lokalizacji, gdzie jest stałą dla wszystkich kwantyli, tj. Stały efekt leczenia kwantylami, co oznacza, że jeśli , dodatkowy rok edukacji zwiększa zarobki o 8% w całym podziale zarobków.βτβ10=β90=0.8
Kiedy efekt leczenia kwantylowego NIE jest stały (jak w dwóch dolnych panelach), oprócz efektu lokalizacji masz również efekt skali. W tym przykładzie dolna część rozkładu zarobków przesuwa się w górę o więcej niż górna granica, więc różnica 90-10 (standardowa miara nierówności zarobków) zmniejsza się w populacji.
Nie wiesz, jakie osoby na tym korzystają lub w jakiej części dystrybucji są ludzie, którzy zaczynali od dołu (aby odpowiedzieć na to pytanie, potrzebujesz bezwarunkowych współczynników regresji kwantyli). Być może ta polityka ich boli i stawia je w jeszcze niższej części w stosunku do innych, ale jeśli celem było dowiedzieć się, czy dodatkowy rok obowiązkowej edukacji zmniejsza rozpiętość zarobków, jest to pouczające. Przykładem takiego podejścia jest Brunello i in. (2009) .
Jeśli nadal interesuje Cię stronniczość regresji kwantylowych spowodowanych źródłami endogeniczności, spójrz na Angrista i in. (2006), gdzie wywodzą oni pominięty wzór zmiennej zmienności stronniczości dla kontekstu kwantowego.