W przeszłości zadawano mi wiele pytań dotyczących opublikowanych artykułów w wielu obszarach, w których regresję (i powiązane modele, takie jak modele panelowe lub GLM) stosuje się na danych obserwacyjnych (tj. Danych niepochodzących z kontrolowanego eksperymentu , w wielu przypadkach - ale nie zawsze - danych obserwowanych w czasie), ale nie podejmuje się próby wprowadzenia zmiennych instrumentalnych.
W odpowiedzi podniosłem szereg uwag (takich jak opisywanie problemów ze stronniczością, gdy mogą brakować ważnych zmiennych), ale ponieważ inni ludzie tutaj będą bez wątpienia znacznie lepiej poinformowani niż ja na ten temat, pomyślałem, że zapytam:
Jakie są główne problemy / konsekwencje próby wyciągnięcia wniosków na temat związków (szczególnie, ale nie wyłącznie, wniosków przyczynowych) w takich sytuacjach?
Czy cokolwiek użytecznego można zrobić z badaniami, które pasują do takich modeli przy braku instrumentów?
Jakie są dobre odniesienia (książki lub artykuły) na temat zagadnień związanych z takim modelowaniem (najlepiej z wyraźną, nietechniczną motywacją konsekwencji, ponieważ zwykle ludzie, którzy pytają, mają różne pochodzenie, niektórzy bez dużej statystyki), do których ludzie mogą odnosić się w krytyce papier? Przydałaby się również dyskusja na temat środków ostrożności / problemów z instrumentami.
(Podstawowe odniesienia do zmiennych instrumentalnych są tutaj , chociaż jeśli masz coś do dodania, to też byłoby pomocne).
Wskazanie dobrych praktycznych przykładów znajdowania i używania instrumentów byłoby dodatkowym atutem, ale nie jest kluczowe dla tego pytania.
[Prawdopodobnie wskażę tutaj inne dobre odpowiedzi, ponieważ takie pytania do mnie przychodzą. Mogę dodać jeden lub dwa przykłady w miarę ich otrzymywania.]