Dlaczego zamieszanie musi być przyczynowo związane z wynikiem? Czy wystarczyłoby, aby pomieszacz był powiązany z wynikiem?
Nie, to nie wystarczy.
Zacznijmy od przypadku, w którym możesz mieć zmienną, która jest zarówno związana z wynikiem, jak i leczeniem, ale kontrolowanie jej wpłynęłoby na twoje oszacowanie.
Z
W tym przypadku nie ma żadnych problemów, możesz bezpośrednio oszacować wpływ X na Y.
Zauważ jednak, że Z wiąże się zarówno z leczeniem, jak i z wynikiem. Ale nadal nie jest to mylące. W rzeczywistości, jeśli kontrolujesz Z w tym przypadku, popchnąłbyś swoje oszacowania. Ta sytuacja nazywa się stronniczością M (ze względu na strukturę grafu).
X i wyniku Y. Weź ten prosty wykres zderzacza:
Tutaj znowu Z jest powiązane z X i Y, ale nie jest współzałożycielem. Nie powinieneś tego kontrolować.
Teraz warto zauważyć, że nawet jeśli zmienna jest przyczynowo związana z wynikiem , niekoniecznie jest to również myląca.
Weźmy przypadek mediatorów na prostym wykresie poniżej:
Jeśli chcesz zmierzyć całkowity wpływ D na Y, nie powinieneś kontrolować rzeczy, które pośredniczą w tym efekcie --- w tym przypadku M. albo całkowity wpływ D na Y albo.
Zauważ jednak, że zdefiniowanie konfirmacji jest znacznie łatwiejsze niż zdefiniowanie, czym jest zamieszanie . Aby uzyskać bardziej szczegółową dyskusję na temat definicji konfouder , możesz przeczytać ten artykuł autorstwa VanderWeele i Shpitser.
Dlaczego tak jest? Ponieważ podstawową koncepcją tutaj jest samo zamieszanie, a nie zamieszanie. W przypadku pytania badawczego powinieneś zadać sobie pytanie „w jaki sposób mogę wyeliminować zamieszanie?” zamiast „czy ta zmienna powoduje zamieszanie?”.
Na koniec warto wspomnieć, że te nieporozumienia są nadal powszechne. Aby to zilustrować, weź cytat z artykułu z 2016 roku :
Wnioskowanie przyczynowe przy braku randomizowanego eksperymentu lub silnego quasi-eksperymentalnego projektu wymaga odpowiedniego uwarunkowania wszystkich zmiennych przed leczeniem, które przewidują zarówno leczenie, jak i wynik, znane również jako mylące zmienne towarzyszące.
Jak pokazaliśmy w poprzednich przykładach, jest to niepoprawne. Mylące nie są „wszystkimi zmiennymi sprzed leczenia, które przewidują zarówno leczenie, jak i wynik”. Kontrolowanie wszystkich z nich może nie być konieczne do wyeliminowania nieporozumień lub może nawet wpływać na wyniki. Pearl ma tutaj bardzo dobry przegląd mylących kwestii.