Wierzę, że szybka odpowiedź jednego pytania na twoje pytanie,
Kiedy należy kontrolować zmienną Y, a kiedy nie?
jest „kryterium tylnych drzwi”.
Strukturalny model przyczynowy Judei Pearl może definitywnie powiedzieć, które zmienne są wystarczające (i kiedy jest to konieczne) do warunkowania, aby wywnioskować wpływ przyczynowy jednej zmiennej na drugą. Mianowicie na to odpowiada kryterium tylnych drzwi, które opisano na stronie 19 tego artykułu przeglądowego autorstwa Pearl.
Głównym zastrzeżeniem jest to, że wymaga znajomości związku przyczynowego między zmiennymi (w postaci strzałek kierunkowych na wykresie). Nie można tego obejść. To tutaj może mieć znaczenie trudność i możliwa subiektywność. Strukturalny model przyczynowy Pearl'a pozwala tylko wiedzieć, jak odpowiedzieć na właściwe pytania, biorąc pod uwagę model przyczynowy (tj. Wykres kierowany), który zestaw modeli przyczynowych jest możliwy, biorąc pod uwagę rozkład danych, lub jak szukać struktury przyczynowej, wykonując właściwy eksperyment. Nie mówi ci, jak znaleźć właściwą strukturę przyczynową, biorąc pod uwagę tylko rozkład danych. W rzeczywistości twierdzi, że jest to niemożliwe bez korzystania z zewnętrznej wiedzy / intuicji na temat znaczenia zmiennych.
Kryteria tylnych drzwi można określić w następujący sposób:
XY,S
SX
SXY
YX.
S,XY
S,
SS
Jest to kryterium lub , w przeciwieństwie do ogólnego kryterium tylnych drzwi, które jest kryterium i .
Aby wyjaśnić kryterium „tylnych drzwi”, mówi ono, że dla danego modelu przyczynowego, gdy uwarunkowane jest wystarczającą zmienną, można nauczyć się wpływu przyczynowego z rozkładu prawdopodobieństwa danych. (Jak wiemy, sam rozkład połączeń nie jest wystarczający do znalezienia zachowania przyczynowego, ponieważ wiele struktur przyczynowych może być odpowiedzialnych za ten sam rozkład. Dlatego też wymagany jest również model przyczynowy.) Rozkład można oszacować za pomocą zwykłych danych statystycznych / metody uczenia maszynowego na podstawie danych obserwacyjnych. Tak długo, jak wiesz że struktura przyczynowa pozwala na warunkowanie zmiennej (lub zestawu zmiennych), twoje oszacowanie wpływu przyczynowego jednej zmiennej na drugą jest równie dobre, jak twoje oszacowanie rozkładu danych, które otrzymujesz metodami statystycznymi.
Oto, co znajdujemy, gdy zastosujemy kryterium tylnych drzwi do twoich dwóch schematów:
ZX.YYX,Y
YXZXYYYZ.YY.X.YYYXY
YYXZ.
YX.ZX.
Z←Y→XZ←W→B←A→X. YY B,B,YZ←Y→X
Z←W→B→Y→X. Y Z←Y→XZ←W→B←A→X,B.
YAWXZB.XZB,BAWBAWXZ
Jak wspomniałem wcześniej, zastosowanie kryterium tylnych drzwi wymaga znajomości modelu przyczynowego (tj. „Prawidłowego” schematu strzałek między zmiennymi). Ale moim zdaniem strukturalny model przyczynowy daje również najlepszy i najbardziej formalny sposób poszukiwania takiego modelu lub wiedzieć, kiedy poszukiwania są daremne. Ma również cudowny efekt uboczny polegający na tym, że terminy takie jak „zakłócanie porządku”, „mediacja” i „fałszywe” (wszystkie mnie mylą) są nieaktualne. Po prostu pokaż mi zdjęcie, a powiem ci, które kręgi powinny być kontrolowane.