Wiem, że korelacja nie implikuje przyczynowości, ale czy brak korelacji implikuje brak przyczynowości?
Wiem, że korelacja nie implikuje przyczynowości, ale czy brak korelacji implikuje brak przyczynowości?
Odpowiedzi:
czy brak korelacji oznacza brak przyczynowości?
Nie. Każdy kontrolowany system jest kontrprzykładem.
Bez związków przyczynowych kontrola jest oczywiście niemożliwa, ale skuteczna kontrola oznacza - z grubsza mówiąc - że pewna ilość jest utrzymywana na stałym poziomie, co oznacza, że nie będzie ona skorelowana z niczym, w tym z niczym, co powoduje, że jest stała.
Zatem w tej sytuacji błędem byłoby stwierdzenie braku związku przyczynowego z powodu braku korelacji.
Oto nieco aktualny przykład .
Nie. Głównie dlatego, że przez korelację najprawdopodobniej masz na myśli korelację liniową . Dwie zmienne mogą być skorelowane nieliniowo i mogą nie wykazywać korelacji liniowej . Łatwo jest skonstruować taki przykład, ale dam ci przykład, który jest bliższy twojemu (węższemu) pytaniu.
Spójrzmy na losową zmienną i nieprzypadkową funkcję , za pomocą której tworzymy losową zmienną . Ta ostatnia jest wyraźnie spowodowana przez pierwszą zmienną, a nie tylko skorelowaną. Narysujmy wykres punktowy:
Ładny, wyraźny obraz korelacji nieliniowej , ale w tym przypadku jest to również bezpośrednia przyczynowość. Jednak współczynnik korelacji liniowej jest nieistotny, tzn. Nie ma korelacji liniowej pomimo oczywistej korelacji nieliniowej, a nawet przyczynowości:
>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)
rho =
0.0140
pval =
0.8904
AKTUALIZACJA: @Kodiologist ma rację w komentarzu. Matematycznie można wykazać, że współczynnik korelacji liniowej dla tych dwóch zmiennych rzeczywiście wynosi zero. W moim przykładzie jest standardową zmienną normalną, więc mamy następujące: Stąd, kowariancja (a następnie korelacja) wynosi zero:
Otrzymalibyśmy ten sam wynik dla dowolnego rozkładu symetrycznego, takiego jak jednolity .
Nie . W szczególności zmienne losowe mogą być zależne, ale nieskorelowane.
Oto przykład. Załóżmy, że mam maszynę, która pobiera pojedyncze dane wejściowe i generuje losową liczbę , która jest równa albo albo z jednakowym prawdopodobieństwem. Oczywiście powoduje . Teraz niech będzie zmienną losową równomiernie rozmieszczoną na i wybierz pomocą , indukując łączny rozkład na . i są zależne, ponieważ
Jednak korelacja i wynosi 0, ponieważY
Lepszą odpowiedzią na to pytanie jest to, że korelacja jest relacją statystyczną, matematyczną i / lub fizyczną, podczas gdy związek przyczynowy jest relacją metafizyczną. Nie można logicznie przejść od korelacji (lub braku korelacji) do przyczynowości, bez (dużego) zestawu założeń wiążących metafizykę z fizyką. (Jednym z przykładów jest to, że to, co dwoje ludzi może zgodzić się na „racjonalnego obserwatora”, jest w dużej mierze arbitralne i prawdopodobnie dwuznaczne). Jeśli A płaci B za wykonanie C, co skutkuje D, jaka jest przyczyna D? Po prostu nie ma żadnego racjonalnego powodu, aby wybrać C, B lub A (lub dowolne z zdarzeń poprzedzających A). Teoria sterowania dotyczy systemów w królestwach, w których są one kontrolowane. Jednym ze sposobów uzyskania kontroli nad zmienną zależną jest zmniejszenie odpowiedzi tej zmiennej na możliwy zakres (kontrolowanej) zmiany zmiennej niezależnej na szum statystyczny. Na przykład wiemy, że ciśnienie powietrza jest skorelowane ze zdrowiem (po prostu spróbuj oddychać próżniowo), ale jeśli kontrolujemy ciśnienie powietrza do 1 +/- 0,001 atm, jak prawdopodobne jest, że DOWOLNA zmiana ciśnienia powietrza ma wpływ na zdrowie?
Tak , w przeciwieństwie do poprzednich odpowiedzi. Przyjmuję to pytanie jako nietechniczne, szczególnie definicję „korelacji”. Może używam go zbyt szeroko, ale zobacz moją drugą kulę. Mam nadzieję, że rozważenie innych odpowiedzi tutaj zostanie uznane za właściwe, ponieważ wyjaśniają one różne części pytania. Opieram się na podejściu Pearl do związku przyczynowego, a zwłaszcza na moim podejściu w niektórych dokumentach z Kevinem Korbem. Woodward prawdopodobnie ma najczystsze konto nietechniczne.
@conjugateprior mówi „każdy kontrolowany system jest kontrprzykładem”. Tak, silniejsze twierdzenie, że brak korelacji zaobserwowany w eksperymencie nie oznacza związku przyczynowego. Zakładam, że pytanie jest bardziej ogólne. Z pewnością w jednym eksperymencie mogło nie być możliwe kontrolowanie przyczyn maskowania lub niewłaściwie kontrolowane pod kątem typowych efektów i ukryto korelację. Ale jeśli spowoduje , nastąpi kontrolowany eksperyment, w którym związek zostanie ujawniony. Prawie wszystkie definicje lub relacje przyczynowe traktują to jako różnicę, która robi różnicę. Dlatego nie ma związku przyczynowego bez (pewnego rodzaju) korelacji. Jeśli istnieje bezpośredni link w przyczynowej sieci bayesowskiej, nie oznacza to, żey x → y x y y x y zawsze robi różnicę w stosunku do , tyle że istnieje pewien eksperyment ustalający wszystkie inne przyczyny których poruszenie porusza .
@aksakal ma świetny przykład, dlaczego przyczynowość liniowa jest niewystarczająca. Zgadzam się, ale chcę być szeroki i nietechniczny. Jeśli , niepełne jest powiedzenie klientowi, że jest nieskorelowane z . Wykorzystam więc korelację bardzo szeroko, aby oznaczać różnicę która jest niezawodnie powiązana z różnicą . Może być tak nieliniowy, jak i nieparametryczny, jak chcesz. Efekty progowe są w porządku ( robi różnicę w stosunku do , ale tylko w ograniczonym zakresie lub tylko dlatego, że jest większy lub mniejszy od określonej wartości, np. Napięcie w obwodach cyfrowych). y x x y x y
@Kodiologist tworzy przykład, w którym , więcale brak korelacji liniowej. Ale wyraźnie istnieje związek, który można odkryć, więc jest on skorelowany w szerokim tego słowa znaczeniu.| y | = | x |
@Szabolcs używa generatorów liczb losowych, aby pokazać strumień wyjściowy skonstruowany tak, aby wyglądał na nieskorelowany. Podobnie jak cyfry , strumień wydaje się losowy, ale deterministyczny. Zgadzam się, że prawdopodobnie nie znajdziesz relacji, jeśli podasz tylko dane, ale ona istnieje.
@Li Zhi zauważa, że nie można logicznie przejść od korelacji do związku przyczynowego. Tak, żadnych przyczyn, żadnych przyczyn. Ale pytanie zaczyna się od związku przyczynowego: czy oznacza korelację? W przykładzie ciśnienia powietrza mamy efekt progowy. Istnieje zakres, w którym ciśnienie powietrza nie jest skorelowane ze zdrowiem. Rzeczywiście, prawdopodobnie nie ma to wpływu przyczynowego na zdrowie. Ale jest zasięg, w którym to działa. To wystarczy. Ale prawdopodobnie lepiej zanotować zakresy, w których występuje i nie ma żadnego efektu. Jeśli , wówczas istnieje korelacja na całym łańcuchu, ponieważ istnieje związek przyczynowy. Powtarzająca się obserwacja (lub eksperyment) może wykazać, że nie powoduje bezpośrednioD. ale korelacja istnieje, ponieważ istnieje historia przyczynowa.
Nie wiem, co miał na myśli @ user2088176, ale myślę, że jeśli przyjmiemy to pytanie bardzo ogólnie, odpowiedź brzmi tak. Przynajmniej myślę, że taka odpowiedź jest wymagana w literaturze na temat odkrywania przyczyn i interwencjonistycznego opisu przyczyn. Przyczyny są różnicami, które robią różnicę. Różnica ta zostanie ujawniona w pewnym eksperymencie jako trwałe powiązanie.