Akcja odpowiada interwencji na zmiennej która ustawia ją naX xdo(x)Xx . Kiedy interweniujemy na , oznacza to, że rodzice nie wpływają już na jego wartość, co odpowiada usunięciu strzałek wskazujących na Więc reprezentujmy tę interwencję na nowym DAG.X XXXX
Nazwijmy pierwotny rozkład obserwacyjny i rozkład po interwencji . Naszym celem jest, aby wyrazić w kategoriach . Zauważmy, że w mamy, że . Ponadto prawdopodobieństwa przed interwencją i po interwencji mają te dwie niezmienności: i ponieważ nie dotykaliśmy każda strzałka wprowadzająca te zmienne w naszej interwencji. Więc:P ∗ P ∗ P P ∗ U ⊥ X P ∗ ( U ) = P ( U ) P ∗ ( Y | X , U ) = P ( Y | X , U )PP∗P∗PP∗U⊥XP∗(U)=P(U)P∗(Y|X,U)=P(Y|X,U)
P(Y|do(X)):=P∗(Y|X)=∑UP∗(Y|X,U)P∗(U|X)=∑UP∗(Y|X,U)P∗(U)=∑UP(Y|X,U)P(U)
Wyprowadzenie drzwi wejściowych jest nieco bardziej skomplikowane. Po pierwsze zauważ, że nie ma pomieszania między i , stądXZ
P(Z|do(X))=P(Z|X)
Ponadto, używając tej samej logiki do wyprowadzenia , widzimy, że kontrolowanie jest wystarczające do uzyskania efektu na , to znaczyP(Y|do(X))XZY
P(Y|do(Z))=∑X′P(Y|X′,Z)P(X′)
Gdzie używam liczby pierwszej dla wygody notacji dla następnego wyrażenia. Te dwa wyrażenia są już w kategoriach rozkładu przedinterwencyjnego, a my po prostu wykorzystaliśmy poprzednie uzasadnienie backdoor do ich wyprowadzenia.
Ostatnim elementem należy jedynie wywnioskować efekt w łączący efekt o i w . Aby to zrobić, zauważ na naszym wykresie , ponieważ efekt o jest całkowicie pośredniczy i ścieżka backdoor od do jest zablokowany, gdy interweniowania . W związku z tym:XYZYXZP(Y|Z,do(X))=P(Y|do(Z),do(X))=P(Y|do(Z))XYZZYX
P(Y|do(X))=∑ZP(Y|Z,do(X))P(Z|do(X))=∑ZP(Y|do(Z))P(Z|do(X))=∑Z∑X′P(Y|X′,Z)P(X′)P(Z|X)=∑ZP(Z|X)∑X′P(Y|X′,Z)P(X′)
Gdzie można zrozumieć w następujący sposób: kiedy interweniuję na , wówczas rozkład zmienia się na ; ale tak naprawdę interweniuję w więc chcę wiedzieć, jak często przyjmuje określoną wartość, gdy zmieniam , czyli .∑ZP(Y|do(Z))P(Z|do(X))ZYP(Y|do(Z))XZXP(Z|do(X))
Dlatego te dwie korekty zapewniają taki sam rozkład po interwencji na tym wykresie, jak pokazaliśmy.
Ponownie czytając twoje pytanie, przyszło mi do głowy, że możesz być zainteresowany bezpośrednim pokazaniem, że prawa strona obu równań jest równa w rozkładzie przedinterwencyjnym (którym muszą być, biorąc pod uwagę nasze poprzednie wyprowadzenie). Nie jest to również trudne do pokazania bezpośrednio. Wystarczy pokazać, że w DAG:
∑X′P(Y|Z,X′)P(X′)=∑UP(Y|Z,U)P(U)
Zauważ, że DAG oznacza i a następnie:Y⊥X|U,ZU⊥Z|X
∑X′P(Y|Z,X′)P(X′)=∑X′(∑UP(Y|Z,X′,U)P(U|Z,X′))P(X′)=∑X′(∑UP(Y|Z,U)P(U|X′))P(X′)=∑UP(Y|Z,U)∑X′P(U|X′)P(X′)=∑UP(Y|Z,U)P(U)
W związku z tym:
∑ZP(Z|X)∑X′P(Y|X′,Z)P(X′)=∑ZP(Z|X)∑UP(Y|Z,U)P(U)=∑UP(U)∑ZP(Y|Z,U)P(Z|X)=∑UP(U)∑ZP(Y|Z,X,U)P(Z|X,U)=∑UP(Y|X,U)P(U)