Regresję w nie musi być przyczynowy, jeżeli pominięto zmienne, które mają wpływ zarówno i . Ale jeśli nie w przypadku pominiętych zmiennych i błędu pomiaru, to czy regresja jest przyczyną? To znaczy, czy regresja obejmuje każdą możliwą zmienną?
Regresję w nie musi być przyczynowy, jeżeli pominięto zmienne, które mają wpływ zarówno i . Ale jeśli nie w przypadku pominiętych zmiennych i błędu pomiaru, to czy regresja jest przyczyną? To znaczy, czy regresja obejmuje każdą możliwą zmienną?
Odpowiedzi:
Nie, nie, pokażę wam kilka kontrprzykładów.
Pierwszym z nich jest odwrotna przyczyna . Rozważmy, że modelem przyczynowym jest , gdzie i są standardowymi zmiennymi losowymi gaussowskimi. Następnie , ponieważ nie powoduje , ale zależy od .
Drugi przykład to kontrola zderzaczy (patrz tutaj ). Rozważmy model przyczynowy , to znaczy nie powoduje a jest częstą przyczyną. Pamiętaj jednak, że jeśli uruchomisz regresję obejmującą , współczynnik regresji nie będzie wynosił zero, ponieważ uwarunkowanie wspólnej przyczyny spowoduje powiązanie między i (możesz również zobaczyć tutaj Analiza ścieżki w obecności Zderzak warunkowany ).
Mówiąc bardziej ogólnie, regresja na będzie przyczynowa, jeśli zmienne zawarte w regresji spełniają kryterium backdoora .
Oprócz ważnej odpowiedzi Carlosa Cinelli na to pytanie istnieje jeszcze kilka powodów, dla których współczynniki regresji mogą nie być przyczynowe.
Po drugie, i związane z tematem odwrotnej przyczynowości, istnieje również ryzyko, że możesz mieć uprzedzenie selekcyjne , tj. Że twoja próbka została wybrana w taki sposób, że nie jest reprezentatywna dla populacji, do której chcesz wyciągnąć wnioski. Ponadto brakujące dane mogą również powodować błąd systematyczny, jeśli dane nie zostaną całkowicie przypadkowo usunięte.