[Poniższe być może wydaje się trochę techniczne ze względu na zastosowanie równań, ale opiera się głównie na wykresach strzałek, aby zapewnić intuicję, która wymaga jedynie bardzo podstawowej znajomości OLS - więc nie odpieraj się.]
Załóżmy, że chcemy, aby oszacować wpływ przyczynowy na Y i podane przez szacowany współczynnik dla beta , ale z jakiegoś powodu nie ma korelacji między zmienną objaśniającą a termin błędzie:xjayjaβ
yja=α+βxja+↖c o r rϵja↗
To może się zdarzyć, bo zapomniał włączyć ważną zmienną, która również koreluje z . Problem ten jest znany jako pominięte zmienne nastawienia i wówczas β nie daje efektu przyczynowego (patrz tutaj dla szczegółów). Jest to przypadek, gdy chcesz użyć instrumentu, ponieważ tylko wtedy możesz znaleźć prawdziwy efekt przyczynowy.xjaβˆ
Instrument jest nową zmienną która jest nieskorelowana z ϵ i , ale która dobrze koreluje z x i i która wpływa tylko na y i przez x i - więc nasz instrument jest tak zwany „egzogeniczny”. To jest jak na tej tabeli tutaj:zjaϵjaxjayjaxja
zja→xja↑ϵja→↗yja
Jak więc korzystać z tej nowej zmiennej?
Być może pamiętasz ideę typu ANOVA kryjącą się za regresją, w której dzielisz całkowitą zmienność zmiennej zależnej na wyjaśniony i niewyjaśniony składnik. Na przykład, jeśli regresujesz swoje na instrumencie,xja
xjacałkowita zmienność= a+πzjawyjaśniona odmiana+ ηjaniewyjaśniona odmiana
wtedy wiesz, że wyjaśniona tutaj odmiana jest egzogeniczna w stosunku do naszego pierwotnego równania, ponieważ zależy tylko od egzogenicznej zmiennej . W tym sensie podzieliliśmy nasze x i na część, którą możemy twierdzić, że jest z pewnością egzogenna (jest to część, która zależy od z i ) i pewną niewyjaśnioną część η i, która zachowuje wszystkie złe warianty, które korelują z ϵ i . Teraz bierzemy egzogeniczną część tej regresji, nazwijmy to ^ x i ,zjaxjaziηiϵixiˆ
xi=a+πzigood variation=xˆi+ηibad variation
i umieścić to w naszej pierwotnej regresji:
yja= α + βxˆja+ ϵja
Teraz od X i nie jest już skorelowany z ε I (należy pamiętać, że „odfiltrowane” ta część z X I i zostawił go w η I ), możemy oszacować konsekwentnie naszą p ponieważ przyrząd pomógł nam przełamać korelację pomiędzy wyjaśnienie zmienne i błąd. To był jeden ze sposobów na zastosowanie zmiennych instrumentalnych. Metoda ta jest w rzeczywistości nazywa się 2-poziomowy najmniejszych kwadratów, gdzie nasza regresji x i na Z i nazywany jest „pierwszy etap” a ostatni równanie tutaj nazywa się „drugi etap”.xˆjaϵjaxjaηjaβxjazja
Pod względem naszego oryginalnego obrazu (I pominąć nie zrobić bałaganu jednak pamiętać, że jest tam!), Zamiast brać bezpośredni ale błędną drogę między X i do rw I wzięliśmy etap pośredni poprzez x íϵjaxjayjaxˆja
zja→xja↗→xˆja↓yja
Dzięki temu niewielkiemu odwróceniu naszej drogi do skutku przyczynowego byliśmy w stanie konsekwentnie oszacować za pomocą przyrządu. Kosztem tego przekierowania jest to, że modele zmiennych instrumentalnych są na ogół mniej precyzyjne, co oznacza, że mają one zwykle większe błędy standardowe.β
Jak znaleźć instrumenty?
To nie jest łatwe pytanie, ponieważ musisz dobrze uzasadnić, dlaczego twój nie byłby skorelowany z ϵ i - nie można tego formalnie przetestować, ponieważ prawdziwy błąd nie jest obserwowany. Głównym wyzwaniem jest zatem wymyślenie czegoś, co może być postrzegane jako egzogeniczne, takiego jak klęski żywiołowe, zmiany polityki, a czasem można nawet przeprowadzić randomizowany eksperyment. Inne odpowiedzi zawierały kilka bardzo dobrych przykładów, więc nie powtórzę tej części.zjaϵja