Chociaż to pytanie ma już zaakceptowaną odpowiedź, myślę, że nadal mogę się do tego przyczynić. Książka Koenkera (2005) naprawdę nie zaprowadzi cię daleko, ponieważ rozwój w IV regresji kwantylowej zaczął zauważać w tym czasie.
Wczesne techniki regresji kwantylowej IV obejmują szkielet łańcucha przyczynowego autorstwa Cheshera (2003) , który został rozwinięty w podejściu średnich ważonych odchyleń (WAD) przez Ma i Koenkera (2006) . W tym artykule wprowadzono również podejście zmiennego sterowania. Podobny pomysł wykorzystał Lee (2007), który wyprowadził estymator regresji kwantylowej IV za pomocą funkcji kontrolnych.
Wszystkie te estymatory wykorzystują założoną trójkątną strukturę błędu, która jest niezbędna do identyfikacji. Problem polega na tym, że ta trójkątna struktura jest niewiarygodna z powodu problemów związanych z endogennością, które powstają z powodu jednoczesności. Na przykład nie można użyć tych estymatorów do problemu oszacowania popytu i podaży.
Estymator Abadiego, Angrista i Imbensa (2002), o którym wspomniał Dimitriy V. Masterov, zakłada, że masz zarówno binarną zmienną endogenną, jak i instrument binarny. Zasadniczo jest to bardzo restrykcyjne ramy, ale rozszerza podejście LATE z regresji liniowej IV na regresje kwantowe. Jest to miłe, ponieważ wielu badaczy, zwłaszcza w dziedzinie ekonomii, zna koncepcję LATE i interpretację uzyskanych współczynników.
Przełomowy artykuł Czernozhukova i Hansena (2005) naprawdę zapoczątkował tę literaturę i ci dwaj faceci wykonali wiele pracy w tej dziedzinie. Estymator regresji kwantyli IV (IVQR) zapewnia naturalny związek z estymatorem 2SLS w kontekście kwantylu. Ich estymator jest implementowany za pośrednictwem Matlaba lub Oxa, jak zauważył Dimitriy, ale można zapomnieć o tym artykule Kwaka (2010). Ten artykuł nigdy nie trafił do dziennika Stata, a także jego kod nie działa poprawnie. Zakładam, że porzucił ten projekt.
Zamiast tego należy wziąć pod uwagę wygładzone równanie estymatora IVQR (SEE-IVQR) autorstwa Kaplana i Słońca (2012). Jest to najnowszy estymator, który stanowi ulepszenie w stosunku do pierwotnego estymatora IVQR pod względem szybkości obliczeniowej (pozwala uniknąć uciążliwego algorytmu wyszukiwania siatki) i średniego błędu kwadratu. Kod Matlab jest dostępny tutaj .
Artykuł Frölicha i Melly'ego (2010) jest fajny, ponieważ rozważa różnicę między warunkową i bezwarunkową regresją kwantową. Problem z regresją kwantową jest taki, że po uwzględnieniu zmiennych towarzyszących w regresji zmienia się interpretacja. W OLS zawsze możesz przejść od warunkowego do bezwarunkowego oczekiwania poprzez prawo iterowanych oczekiwań, ale w przypadku kwantyli nie jest to możliwe. Problem ten został po raz pierwszy pokazany przez Firpo (2007) i Firpo i in. (2009). Używa ponownie wyśrodkowanej funkcji wpływu w celu zmarginalizowania warunkowych regresji kwantyli, tak aby można je interpretować jako zwykłe współczynniki OLS. Dla twojego celu ten estymator niewiele pomoże, ponieważ dopuszcza tylko zmienne egzogeniczne. Jeśli jesteś zainteresowany, Nicole Fortin udostępnia kod Stata na swojej stronie internetowej.
Najnowszy estymator bezwarunkowej regresji kwantylowej IV, o którym wiem, to Powell (2013) . Jego uogólniony (IV) estymator regresji kwantylu pozwala oszacować marginalne efekty leczenia kwantylu w obecności endogeniczności. Gdzieś na stronie RAND udostępnia również swój kod Stata, ale nie mogłem go teraz znaleźć. Ponieważ o to prosiłeś: we wcześniejszym artykule zaimplementował ten estymator w kontekście danych panelu (patrz Powell, 2012 ). Ten estymator jest świetny, ponieważ w przeciwieństwie do wszystkich wcześniejszych metod QR danych panelowych, estymator ten nie opiera się na dużych asymptotycznych T (których zwykle nie masz, a przynajmniej nie w danych mikroekonometrycznych).
Wreszcie, bardziej egzotyczny wariant: ocenzurowany estymator IVQR (CQIV) autorstwa Chernozhukova i in. (2011) pozwala dbać o cenzurowane dane - jak sama nazwa wskazuje. Jest to rozszerzenie artykułu Czernozhukova i Honga (2003), którego nie łączę, ponieważ nie jest to w kontekście IV. Ten estymator jest ciężki obliczeniowo, ale jeśli masz cenzurowane dane i nie ma innej możliwości, możesz to zrobić. Amanda Kowalski opublikowała kod Stata na swojej stronie internetowej lub można go pobrać z RePEc. Ten estymator (a przy okazji także IVQR i SEE-IVQR) zakładają, że masz ciągłą zmienną endogenną. Użyłem tych estymatorów w kontekście regresji zarobków, gdzie edukacja była moją endogenną zmienną, która przyjmowała od 18 do 20 wartości, więc nie do końca ciągła. Ale w ćwiczeniach symulacyjnych zawsze mogłem pokazać, że to nie jest problem. Jest to jednak prawdopodobnie zależne od aplikacji, więc jeśli zdecydujesz się go użyć, sprawdź go dwukrotnie.