To jest bardzo standardowe pytanie dotyczące zmiennych instrumentalnych modeli liniowych z jednym równaniem. Biorąc pod uwagę prymitywy twojego pytania, jedyną zmienną endogenną jest ćwiczenie . Aby odpowiedzieć na to konkretne pytanie, potrzebujesz zmiennej egzogenicznej, z , która spełnia dwa warunki:
- cov (z, u) = 0.
- Musi istnieć związek między zmienną endogenną a tą zmienną egzogeniczną, którą proponujesz, ale że nie była ona częścią prawdziwego modelu postulowanego (modelu strukturalnego). Innymi słowy,
exercise=β0+β1age+β2weight+β3height+β4male+β5work+ϕz+εexercise
z cp ≠ 0, mi(εe x e r c i s e) = 0i prostopadły do wszystkich zmiennych objaśniających (innych niż ćwiczenie) i do.
Przed przejściem dalej uwaga. Przez model strukturalny rozumiem, zgodnie z konwencją Wooldridge'a i Goldbergera, model postulowany. To znaczy model określający związek przyczynowy między zdrowiem a twoimi współzmiennymi. Jest to kluczowa różnica i brak zgody w stosunku do poprzednich odpowiedzi.
Wracając do omawianego problemu, warunek 2 jest tym, co w literaturze równań równań nazywane jest równaniem formy zredukowanej , które jest niczym innym jak liniowym rzutem endogenicznym na wszystkie zmienne egzogeniczne, w tym z.
Teraz podłącz zredukowaną formę do postulowanego modelu, a dostaniesz
h e a l t h =α0+α1ge +α2)w e i gh t +α3)h e i gh t +α4m a l e +α5w o r k + δz+ ν
gdzie
αja=bja+b6βja,∀ i ∈ { 1 , … , 5 },
δ=b6ϕ i
ν= u +b6εe x e r c i s e. Z definicji rzutu liniowego
ν jest nieskorelowany ze wszystkimi zmiennymi objaśniającymi, a zatem OLS tego ostatniego równania da spójne oszacowania dla
αja i
δ, a nie podstawa
bja w prawdziwym modelu.
Identyfikacja wymaga nieco manipulacji w formie matrycy, ale zasadniczo sprowadza się do tak zwanego warunku rangi . Definiowaćb =(b0, ... ,b6)′ i x =(1,ge , … , e x e r c i s e)′ tak aby Twój model konstrukcyjny był h e a l t h =x′b +u. Teraz zdefiniujz ≡(1,age , ... , w o r k , oo)′. Według warunku 1 (cov (z, u) = 0, tak że E (z, u) = 0),
E ( z u)=0
Jeśli pomnożysz dolne boki modelu konstrukcji przez
z i weź swoje oczekiwania
E ( zx′) b = E ( z y)
Stan warunku stwierdza, że
E ( zx′)to pełna pozycja w kolumnie. W tym konkretnym przykładzie i podanych warunkach na z jest to równoważne
r a n k ( E ( zx′) = 6. Dlatego mamy 6 równań w 6 niewiadomych. Dlatego istnieje unikalne rozwiązanie dla systemu, tj
b jest zidentyfikowany i równy
[ E ( zx′)]- 1E ( z y), zgodnie z życzeniem.
Uwagi: Warunek 1 jest przydatny, aby uzyskać warunek momentu, ale model o zmniejszonej formie z ϕma kluczowe znaczenie dla stanu rangi. Oba warunki są normalne.
W tym momencie powinno być jasne, dlaczego tego potrzebujemy. Z jednej strony, bez z OLS estymator prawdziwego modelu wytworzy niespójne estymatory nie tylko dlab6 ale dla wszystkich bja. Z drugiej strony (i do pewnego stopnia spokrewnione) nasze parametry są jednoznacznie identyfikowane, więc jesteśmy pewni, że szacujemy prawdziwy związek przyczynowy, jak stwierdzono w naszym prawdziwym modelu.
W odniesieniu do testowania warunek 2 (z i ćwiczenia są częściowo skorelowane) można przetestować bezpośrednio i zawsze należy zgłosić ten krok wbrew komentarzowi w poprzedniej odpowiedzi. Istnieje ogromna literatura związana z tym krokiem, szczególnie literatura na temat słabych instrumentów.
Drugi warunek nie może być jednak bezpośrednio przetestowany. Czasami możesz powołać się na teorię ekonomiczną, aby uzasadnić lub przedstawić alternatywne hipotezy, które wspierają użycie z.