Odpowiedź JohnRos jest bardzo dobra. Mówiąc wprost, endogeniczność oznacza, że przyczyna jest błędna. To, że model, który zanotowałeś i oszacowałeś, nie oddaje w prawidłowy sposób związku przyczynowego w prawdziwym świecie. Kiedy piszesz:
Yi=β0+β1Xi+ϵi
możesz pomyśleć o tym równaniu na wiele sposobów. Można to uznać za wygodny sposób przewidywania na podstawie wartościMożna to uznać za wygodny sposób modelowania . W obu tych przypadkach nie ma czegoś takiego jak endogeniczność i nie musisz się tym martwić.X E { Y | X }YXE{Y|X}
Można jednak również traktować to równanie jako ucieleśnienie związku przyczynowego. Możesz pomyśleć o jako odpowiedzi na pytanie: „Co by się stało z gdybym sięgnął do tego systemu i eksperymentalnie zwiększył o 1?” Jeśli chcesz myśleć o tym w ten sposób, użycie OLS do oszacowania sprowadza się do założenia, że: Y Xβ1YX
- YX powodujeY
- Yϵ powodujeY
- Xϵ nie powodujeX
- XY nie powodujeX
- Nic, co powoduje Xϵ również powodujeX
Niepowodzenie któregokolwiek z 3-5 spowoduje ogólnie , lub, nie całkiem równoważnie, . Zmienne instrumentalne są sposobem na skorygowanie faktu, że przyczyna jest błędna (poprzez przyjęcie innego, odmiennego, przyczynowego założenia). Doskonale przeprowadzona randomizowana, kontrolowana próba jest sposobem na wymuszenie 3-5. Jeśli wybierzesz losowo, to na pewno nie jest to spowodowane przezC o v ( X , ϵ ) ≠ 0 X Y ϵE{ϵ|X}≠0Cov(X,ϵ)≠0XY , lub cokolwiek innego. Tak zwane metody „naturalnego eksperymentu” to próby znalezienia specjalnych okoliczności na świecie, w których 3-5 jest prawdziwe, nawet jeśli nie uważamy, że 3-5 są prawdziwe.ϵ
W przykładzie JohnRos, aby obliczyć wartość płacy w edukacji, potrzebujesz przyczynowej interpretacji , ale istnieją dobre powody, by sądzić, że 3 lub 5 jest fałszywe.β1
Twoje zamieszanie jest jednak zrozumiałe. Jest to bardzo typowe podczas kursów na modelu liniowym, gdy instruktor stosuje interpretację przyczynowąβ1 który podałem powyżej, udając, że nie wprowadza związku przyczynowego, udając, że „wszystko to tylko statystyki”. To tchórzliwe kłamstwo, ale jest również bardzo powszechne.
W rzeczywistości jest częścią większego zjawiska w biomedycynie i naukach społecznych. Prawie zawsze jest tak, że próbujemy określić przyczynowo-skutkowy wpływ na - o to przecież chodzi w nauce. Z drugiej strony prawie zawsze zdarza się, że istnieje pewna historia, która prowadzi do wniosku, że jedna z 3-5 jest fałszywa. Istnieje więc rodzaj praktykowanej, płynnej, ekscytującej nieuczciwości, w której usuwamy obiekcje, mówiąc, że wykonujemy pracę związaną z stowarzyszeniem, a następnie przekradamy interpretację przyczynową z powrotem w innym miejscu (zwykle we wstępie i końcowych rozdziałach artykułu).YXY
Jeśli jesteś naprawdę zainteresowany, facetem do przeczytania jest Judea Perl. James Heckman jest także dobry.
R
.