Jeśli tak, to czy niezależność statystyczna automatycznie oznacza brak związku przyczynowego?
Nie, a oto prosty licznik z wielowymiarową normą,
set.seed(100)
n <- 1e6
a <- 0.2
b <- 0.1
c <- 0.5
z <- rnorm(n)
x <- a*z + sqrt(1-a^2)*rnorm(n)
y <- b*x - c*z + sqrt(1- b^2 - c^2 +2*a*b*c)*rnorm(n)
cor(x, y)
Z odpowiednim wykresem
Tutaj mamy to i Y są niezależne marginalnie (w normalnym przypadku wielowymiarowej, zerowa korelacja oznacza niezależność). Dzieje się tak, ponieważ ścieżka backdoora przez z dokładnie anuluje bezpośrednią ścieżkę od x do y , to znaczy c o v ( x , y ) = b - a ∗ c = 0,1 - 0,1 = 0 . Zatem E [ Y | X = x ] = E [ Y ]xyzxyc o v ( x , y) = b - a ∗ c = 0,1 - 0,1 = 0 . Jednak x bezpośrednio powoduje y , a my mamy to E [ Y | d o ( X = x ) ] = b x , który różni się od E [ Y ] = 0 .mi[ Y| X= x ] = E[ Y] = 0xymi[ Y| reo ( X= x ) ] = b xmi[ Y] = 0
Stowarzyszenia, interwencje i scenariusze alternatywne
Myślę, że ważne jest, aby tu wyjaśnić niektóre skojarzenia, interwencje i scenariusze alternatywne.
Modele przyczynowe zawierają stwierdzenia dotyczące zachowania systemu: (i) pod obserwacjami pasywnymi, (ii) pod interwencjami, a także (iii) scenariusz alternatywny. Niezależność na jednym poziomie niekoniecznie przekłada się na drugi.
Jak pokazuje powyższy przykład, nie możemy mieć żadnego związku między i Y , to znaczy P ( YXY , i nadal tak jest, że manipulacje na X zmieniają rozkład Y , to znaczy P ( Y | d o ( x ) ) ≠ P ( Y ) .P(Y|X)=P(Y)XYP(Y|do(x))≠P(Y)
XYP(Y|do(x))=P(Y)YX
Te trzy poziomy tworzą hierarchię zadań wnioskowania przyczynowego pod względem informacji potrzebnych do udzielenia odpowiedzi na pytania dotyczące każdego z nich.