A jest pozytywnie związany z B.
C jest wynikiem A i B, ale wpływ A na C jest ujemny, a wpływ B na C jest pozytywny.
Czy to może się zdarzyć?
A jest pozytywnie związany z B.
C jest wynikiem A i B, ale wpływ A na C jest ujemny, a wpływ B na C jest pozytywny.
Czy to może się zdarzyć?
Odpowiedzi:
Pozostałe odpowiedzi są naprawdę cudowne - dają przykłady z życia.
Chcę wyjaśnić, dlaczego tak się może stać pomimo naszej intuicji, wręcz przeciwnie.
Korelacja to cosinus kąta między wektorami. Zasadniczo pytasz, czy to możliwe
Tak oczywiście:
W tym przykładzie ( oznacza korelację):
Jednak twoje zaskoczenie nie jest niewłaściwe.
Kąt między wektorami jest miarą odległości na kuli jednostkowej, więc spełnia nierówność trójkąta:
skoro więc ,
Więc,
Tak, dwa współwystępujące warunki mogą mieć przeciwne skutki.
Na przykład:
Słyszałem analogię samochodu, która dobrze pasuje do pytania:
Kluczem tutaj jest zamiar kierowcy utrzymania stałej prędkości (C), dlatego dodatnia korelacja między A i B naturalnie wynika z tego zamiaru. W ten sposób można konstruować nieskończone przykłady A, B, C.
Analogia pochodzi z interpretacji termostatu Miltona Friedmana i pochodzi z interesującej analizy polityki pieniężnej i ekonometrii, ale nie ma to znaczenia dla pytania.
Tak, demonstracja za pomocą symulacji jest banalna:
Symuluj 2 zmienne, A i B, które są dodatnio skorelowane:
> require(MASS)
> set.seed(1)
> Sigma <- matrix(c(10,3,3,2),2,2)
> dt <- data.frame(mvrnorm(n = 1000, rep(0, 2), Sigma))
> names(dt) <- c("A","B")
> cor(dt)
A B
A 1.0000000 0.6707593
B 0.6707593 1.0000000
Utwórz zmienną C:
> dt$C <- dt$A - dt$B + rnorm(1000,0,5)
Ujrzeć:
> (lm(C~A+B,data=dt))
Coefficients:
(Intercept) A B
0.03248 0.98587 -1.05113
Edycja: Alternatywnie (zgodnie z sugestią Kodiologa), po prostu symulując z normalnej zmiennej wielowymiarowej, takiej jak , i
> set.seed(1)
> Sigma <- matrix(c(1,0.5,0.5,0.5,1,-0.5,0.5,-0.5,1),3,3)
> dt <- data.frame(mvrnorm(n = 1000, rep(0,3), Sigma, empirical=TRUE))
> names(dt) <- c("A","B","C")
> cor(dt)
A B C
A 1.0 0.5 0.5
B 0.5 1.0 -0.5
C 0.5 -0.5 1.0
cor(C, A)
i cor(C, B)
niż lm(C ~ A + B)
tutaj. Interesuje nas np. Niekontrolowany związek A i C, a nie związek kontrolowany dla B.
następnie
Wtedy kowariancja między C i A może być ujemna w dwóch warunkach: