Bardzo prawdopodobnym powodem korelacji 2 zmiennych jest to, że ich zmiany są powiązane z trzecią zmienną. Innymi prawdopodobnymi przyczynami są przypadek (jeśli przetestujesz wystarczającą liczbę nieskorelowanych zmiennych do korelacji, niektóre wykażą korelację) lub bardzo złożone mechanizmy, które wymagają wielu kroków.
Zobacz http://tylervigen.com/ przykładów takich jak ten:
Aby pewnie stwierdzić związek przyczynowy A -> B, potrzebujesz eksperymentu, w którym możesz kontrolować zmienną A i nie wpływać na inne zmienne. Następnie mierzysz, czy korelacja A i B nadal istnieje, jeśli zmienisz zmienną.
W prawie wszystkich praktycznych zastosowaniach prawie nie jest możliwe, aby nie wpływać również na inne (często nieznane) zmienne, dlatego najlepiej możemy udowodnić brak związku przyczynowego.
Aby móc określić związek przyczynowy, zaczynasz od hipotezy, że 2 zmienne mają związek przyczynowy, użyj eksperymentu, aby obalić hipotezę, a jeśli ci się nie uda, możesz stwierdzić z pewnym stopniem pewności, że hipoteza jest prawdziwa. To, jak wysoki musi być Twój poziom pewności, zależy od dziedziny badań.
W wielu dziedzinach powszechne lub konieczne jest równoległe prowadzenie 2 części eksperymentu, jednej, w której zmienna A jest zmieniana, i grupy kontrolnej, w której zmienna A nie jest zmieniana, ale eksperyment jest inny dokładnie taki sam - np. W przypadku lekiem, który nadal przykleja się pacjentom igłą lub powoduje, że połykają tabletki. Jeśli eksperyment wykazuje korelację między A i B, ale nie między A i B '(B grupy kontrolnej), możesz założyć związek przyczynowy.
Istnieją również inne sposoby wnioskowania o przyczynowości, jeśli eksperyment jest albo niemożliwy, albo niewskazany z różnych powodów (moralność, etyka, PR, koszt, czas). Jednym z powszechnych sposobów jest zastosowanie odliczenia. Biorąc przykład z komentarza: aby udowodnić, że palenie powoduje raka u ludzi, możemy użyć eksperymentu, aby udowodnić, że palenie powoduje raka u myszy, a następnie udowodnić, że istnieje korelacja między paleniem a rakiem u ludzi, i wywnioskować, że dlatego jest niezwykle prawdopodobnie palenie powoduje raka u ludzi - dowód ten można wzmocnić, jeśli również obalimy, że rak powoduje palenie. Innym sposobem na stwierdzenie przyczynowości jest wykluczenie innych przyczyn korelacji, pozostawiając przyczynowość jako najlepsze pozostałe wyjaśnienie korelacji - ta metoda nie zawsze ma zastosowanie, ponieważ czasami niemożliwe jest wyeliminowanie wszystkich możliwych przyczyn korelacji (zwanych „ścieżkami tylnymi drzwiami” w innej odpowiedzi). W przykładzie palenia / raka moglibyśmy prawdopodobnie zastosować to podejście, aby udowodnić, że palenie jest odpowiedzialne za smołę w płucach, ponieważ nie ma tak wielu możliwych źródeł.
Te inne sposoby „udowodnienia” przyczynowości nie zawsze są idealne z naukowego punktu widzenia, ponieważ nie są tak jednoznaczne jak prostszy eksperyment. Debata na temat globalnego ocieplenia jest doskonałym przykładem pokazującym, jak znacznie łatwiej jest odrzucić związek przyczynowy, który nie został jeszcze jednoznacznie udowodniony za pomocą powtarzalnego eksperymentu.
Dla komicznej ulgi, oto przykład eksperymentu, który jest technicznie możliwy, ale nie jest wskazany z przyczyn innych niż naukowe (moralność, etyka, PR, koszt):