Modele dwustopniowe: Różnica między modelami Heckmana (do radzenia sobie z wyborem próbek) i zmiennymi instrumentalnymi (do czynienia z endogennością)

16

Staram się omijać różnicę między wyborem próbki a endogennością, a tym samym tym, w jaki sposób modele Heckmana (radzenie sobie z selekcją próbek) różnią się od instrumentalnych regresji zmiennych (radzenie sobie z endogennością).

Czy słuszne jest stwierdzenie, że wybór próbki jest specyficzną formą endogeniczności, w przypadku której zmienna endogeniczna jest prawdopodobieństwem poddana obróbce?

Wydaje mi się również, że zarówno modele Heckmana, jak i regresja IV są modelami 2-etapowymi, gdzie pierwszy etap przewiduje prawdopodobieństwo leczenia - zakładam, że muszą się różnić pod względem tego, co robią empirycznie, swoich celów i założeń, ale jak?

— Kyrenia
źródło

23

Aby odpowiedzieć na pierwsze pytanie, masz rację, że dobór próby jest specyficzną formą endogeniczności (zobacz dobry przegląd endogenności i typowych środków zaradczych w Antonakis i in. 2010), jednak nie masz racji twierdząc, że prawdopodobieństwo leczenia jest zmienną endogenną, ponieważ jest to sama zmienna terapeutyczna („nieprzypadkowe przypisanie leczenia”) - a nie prawdopodobieństwo leczenia - która jest endogenna w doborze próby. Przypomnijmy, że endogeniczność odnosi się do sytuacji, w której nieprawidłowo zidentyfikowano związek przyczynowy między czynnikiem X i czynnikiem Y, gdy zaobserwowana „zależność” jest w rzeczywistości spowodowana innym czynnikiem Z, który wpływa zarówno na X, jak i Y. Mówiąc inaczej, biorąc pod uwagę model regresji :

$y_i=\beta_0+\beta_1x_i+...+\epsilon_i$

endogeniczność występuje, gdy jeden lub więcej predyktorów jest powiązanych z terminem błędu w modelu. To znaczy, gdy . $Cov(x,\epsilon)\ne0$

Typowe przyczyny endogenności obejmują:

Pominięte zmienne (niektórych rzeczy, których po prostu nie możemy zmierzyć)
- Motywacja / wybór
- Umiejętność / talent
- Samowybór
Błąd pomiaru (chcielibyśmy uwzględnić , ale obserwujemy tylko ) $x_j$ $x_j*$
Jednoczesność / dwukierunkowość (u dzieci poniżej 5 roku życia związek między wskaźnikiem stanu odżywienia „waga dla wieku” a tym, czy dziecko niedawno chorowało, może być jednoczesny.

Różne rodzaje problemów wymagają nieco odmiennych rozwiązań, na tym polega różnica między korektami typu IV i Heckmana. Oczywiście istnieją różnice w mechanice leżącej u podstaw tych metod, ale założenie jest takie samo: polegające na usunięciu endogeniczności, najlepiej poprzez ograniczenie wykluczenia, tj. Jeden lub więcej instrumentów w przypadku IV lub zmiennej wpływającej na wybór, ale nie wynik w przypadku Heckmana.

Aby odpowiedzieć na drugie pytanie, musisz pomyśleć o różnicach w rodzajach ograniczeń danych, które doprowadziły do opracowania tych rozwiązań. Lubię myśleć, że podejście do zmiennej instrumentalnej (IV) stosuje się, gdy jedna lub więcej zmiennych jest endogennych i po prostu nie ma dobrych pośredników, które można by trzymać w modelu, aby usunąć endogenność, ale zmienne towarzyszące i wyniki są obserwowane dla wszystkich obserwacji. Z drugiej strony korekty typu Heckmana są używane, gdy występuje obcięcie, tzn. Informacja nie jest obserwowana dla próbek w próbce, w których wartość zmiennej selekcyjnej == 0.

Podejście do zmiennej instrumentalnej (IV)

Pomyśl o klasycznym ekonometrycznym przykładzie regresji IV z dwustopniowym estymatorem najmniejszych kwadratów (2SLS): wpływ edukacji na zarobki.

(1) $Earnings_i=\beta_0+ \beta_1OwnEd_i + \epsilon_i$

Tutaj poziom osiągnięć edukacyjnych ma charakter endogenny, ponieważ jest częściowo determinowany motywacją i umiejętnościami danej osoby, które wpływają również na zarobki danej osoby. Motywacja i zdolność zwykle nie są mierzone w badaniach gospodarstw domowych lub ekonomii. Równanie 1 można zatem napisać tak, aby wyraźnie zawierało motywację i umiejętności:

(2) $Earnings_i=\beta_0+ \{\beta_1OwnEd_i + \beta_2Motiv_i + \beta_3Abil_i\} + \epsilon_i$

Ponieważ i nie są w rzeczywistości zaobserwować, Równanie 2 można zapisać jako: $Motiv$ $Abil$

(3), $Earnings_i=\beta_0+ \beta_1OwnEd_i + u_i$

gdzie (4). $u_i=\beta_2Motiv_i + \beta_3Abil_i + \epsilon_i$

Dlatego naiwne oszacowanie wpływu edukacji na zarobki za pośrednictwem OLS byłoby tendencyjne. Ta część, którą już znasz.

W przeszłości ludzie wykorzystywali edukację rodziców jako narzędzia dla własnego poziomu wykształcenia badanego, ponieważ spełniają 3 wymagania dla ważnego instrumentu ( ): $z$

musi być związane z endogennym predyktorem - , $z$ $𝐶𝑜𝑣(𝑧,𝑥)≠0$
nie może być bezpośrednio związane z wynikiem - i $z$ $𝐶𝑜𝑣(𝑧,𝑦)=0$
nie można z nieobserwowalną (u) cechą (to znaczy, jest egzogenny) - $z$ $z$ $𝐶𝑜𝑣(𝑧,𝑢)=0$

Po oszacowaniu wykształcenia badanego ( ) przy użyciu wykształcenia rodziców ( i ) na pierwszym etapie i użyj przewidywanej wartości wykształcenia ( ) do oszacowania w drugim etapie, to jest (w sposób bardzo uproszczony) określającą na podstawie tej części $OwnEd$ $MomEd$ $DadEd$ $\widehat{OwnEd}$ $Earnings$ $Earnings$ który nie jest determinowany motywacją / umiejętnościami. $OwnEd$

Korekty typu Heckmana

Jak ustaliliśmy wcześniej, nieprzypadkowy dobór próby jest szczególnym rodzajem endogeniczności. W tym przypadku pominiętą zmienną jest sposób wyboru osób do próby. Zazwyczaj, gdy masz problem z wyborem próbki, twój wynik jest obserwowany tylko dla tych, dla których wybór próbki variable == 1. Ten problem jest również znany jako „przypadkowe obcięcie”, a rozwiązanie jest powszechnie znane jako korekcja Heckmana. Klasycznym przykładem w ekonometrii jest oferta płacowa zamężnych kobiet:

(5 ) $Wage_i = \beta_0 + \beta_1Educ_i + \beta_2Experience_i + \beta_3Experience^2_i+\epsilon_i$

$Wage$ $s$

$Wage_i^* = X\beta^\prime+\epsilon_i$

$LaborForce_i^* = Z\gamma^\prime+\nu_i$

That is, $Wage = Wage_i^*$ IFF $LaborForce_i^*>0$ and $Wage = .$ IFF $LaborForce_i^*\leq 0$

The solution here is therefore to predict the likelihood of participation in the labor force at first stage using a probit model and the exclusion restriction (the same criteria for valid instruments apply here), calculate the predicted inverse Mills ratio ( $\hat{\lambda}$ ) for each observation, and in second stage, estimate the wage offer using the $\hat{\lambda}$ as a predictor in the model (Wooldridge 2009). If the coefficient on $\hat{\lambda}$ is statistically equal to zero, there is no evidence of sample selection (endogeneity), and OLS results are consistent and can be presented. If the coefficient on $\hat{\lambda}$ is statistically significantly different from zero, you will need to report the coefficients from the corrected model.

References

Antonakis, John, Samuel Bendahan, Philippe Jacquart, and Rafael Lalive. 2010. “On Making Causal Claims: A Review and Recommendations.” The Leadership Quarterly 21 (6): 1086–1120. doi:10.1016/j.leaqua.2010.10.010.
Wooldridge, Jeffrey M. 2009. Introductory Econometrics: A Modern Approach. 4th ed. Mason, OH, USA: South-Western, Cengage Learning.

— Marquis de Carabas
źródło

1

In Heckman-type correction, how to interprete inverse Mills ratio values for each observation? Does it says the number of people who will work from the non-working population at a given moment?

— Quirik

2

One should make a distinction between the specific Heckman sample selection model (where only one sample is observed) and Heckman-type corrections for self-selection, which can also work for the case where the two samples are observed. The latter is referred to as control function approach, and amounts to include into your second stage a term controlling for the endogeneity.

Let us have a standard case with an endogeneous dummy variable D, an instrument Z:

Y = β + β_{1} D + ϵ

$Y= \beta + \beta_1 D +\epsilon$

D = γ + γ_{1} Z + u

$D= \gamma + \gamma_1 Z +u$

Both approaches run a first stage (D on Z). IV uses a standard OLS (even if D is a dummy) Heckman uses a probit. But besides this, the main difference is on the way they use this first stage into the main equation:

IV: break the endogeneity by decomposing D into parts uncorrelated with $\epsilon$ , given by the prediction of D: $Y= \beta + \beta_1 \hat{D}+\epsilon$
Heckman: model the endogeneity: keep the endogenous D, but add a function of the predicted values of the first stage. For this case, it is a pretty complicated function: $Y= \beta + \beta_1 D + \beta_2 \left[\lambda(\hat{D})-\lambda(-\hat{D})\right ] +\epsilon$ where $\lambda()$ is the inverse Mills ratio

The advantage of the Heckman procedure is that it provides a direct test for endogeneity: the coefficient $\beta_2$ . On the other side, the Heckman procedure relies on the assumption of joint normality of the errors, while the IV does not make any such assumption.

So you have the standard story that with normal errors, the control function will be more efficient (especially if ones uses the MLE instead of the two-step shown here) than the IV, but that if the assumption does not hold, IV would be better. As researchers have become more suspicious about the assumption of normality, the IV is used more often.

— Matifou
źródło

0

From Heckman, Urzua and Vytlacil (2006):

Example of selection bias: Consider the effects of a policy on the outcome of a country (e.g. GDP). If the countries that would have done well in terms of the unobservable even in the absence of the policy are the ones that adopt the policy, then the OLS estimates are biased.

Two main approaches have been adopted to solve this problem: (a) selection models and (b) instrumental variable models.

The selection approach models levels of conditional means. The IV approach models the slopes of the conditional means. IV does not identify the constants estimated in selection models.

The IV approach does not condition on D (the treatment). The selection (control function) estimator identifies the conditional means using control functions.

When using control functions with curvature assumptions, one does not require an exclusion restriction (does not require $Z\neq X$ ) in the selection model. By assuming a functional form for the distribution of the error terms, one rules out the possibility that the conditional mean of the outcome equation equals the conditional control function, and thus you can correct for selection without exclusion restrictions. See also Heckman and Navarro (2004).

— José Gabriel Astaiza-Gómez
źródło