Przykłady nauczania: Korelacja nie oznacza związku przyczynowego


74

Istnieje stare powiedzenie: „Korelacja nie oznacza związku przyczynowego”. Kiedy uczę, zwykle ilustruję ten punkt w następujących standardowych przykładach:

  1. liczba bocianów i wskaźnik urodzeń w Danii;
  2. liczba księży w Ameryce i alkoholizm;
  3. na początku XX wieku zauważono silną korelację między „liczbą radiotelefonów” a „liczbą osób przebywających w zakładach dla obłąkanych”
  4. i mój ulubiony: piraci powodują globalne ocieplenie .

Jednak nie mam żadnych odniesień do tych przykładów i chociaż są zabawne, są oczywiście fałszywe.

Czy ktoś ma jakieś inne dobre przykłady?


2
Przeanalizuj Freakonomics, by znaleźć świetne przykłady. Ich bibliografia jest pełna referencji.
Stephen Turner,


5
To, że piraci / globalne ocieplenie jest wyraźnie przygotowane przez teoretyków spiskowych - każdy może zobaczyć, że celowo zaplanowali nawet odstępy w nierównych przedziałach czasowych, aby uniknąć pokazania ostatniego gwałtownego wzrostu temperatury, ponieważ piraci są prawie całkowicie wymazani. Wszyscy wiemy, że wraz ze wzrostem temperatury rum odparowuje, a piraci nie są w stanie przetrwać tych warunków. ;-)
AdamV

4
WTF działa z osią X na tym pirackim wykresie?
naught101

1
Lub właściwie wszystko, co umieścisz w Google Correlate , przejdź do tego.
conjugateprior

Odpowiedzi:


39

Przydatne może być wyjaśnienie, że „przyczyny” to relacja asymetryczna (X powoduje, że Y różni się od Y powoduje X), podczas gdy „koreluje z” to relacja symetryczna.

Na przykład populacja bezdomnych i wskaźnik przestępczości mogą być skorelowane, ponieważ oba są zwykle wysokie lub niskie w tych samych lokalizacjach. Równie słuszne jest stwierdzenie, że populacja bezdomnych jest skorelowana ze wskaźnikiem przestępczości lub wskaźnik przestępczości jest skorelowany z populacją bezdomnych. Stwierdzenie, że przestępstwo powoduje bezdomność lub populacja bezdomnych powoduje przestępstwo, to różne stwierdzenia. A korelacja nie oznacza, że ​​jedno z nich jest prawdziwe. Na przykład przyczyną może być trzecia zmienna, taka jak nadużywanie narkotyków lub bezrobocie.

Matematyka statystyki nie jest dobra w identyfikowaniu przyczyn, które wymagają innej formy oceny.


3
Osąd to dobre słowo, ponieważ wszystko, co możemy kiedykolwiek zaobserwować, to korelacja. Wszystko, co mogą zrobić eksperymenty i / lub sprytne statystyki, pozwala nam wykluczyć niektóre alternatywne wyjaśnienia tego, co mogło spowodować efekt.
Jonas

Bardzo dobry komentarz na temat relacji symetrycznych / asymetrycznych. Można również twierdzić, że globalne ocieplenie powoduje wzrost piractwa.
Andre Holzner,

27

Moje ulubione:

1) Im więcej strażaków zostaje wysłanych do ognia, tym więcej wyrządzonych szkód.

2) Dzieci, które otrzymają korepetycje, otrzymają gorsze oceny niż dzieci, które nie otrzymają korepetycji

i (to mój najlepszy)

3) We wczesnych latach szkoły podstawowej znak astrologiczny jest skorelowany z ilorazem inteligencji, ale korelacja ta słabnie z wiekiem i znika w wieku dorosłym.


2
(@xmjx Dostarczyłem pierwszy przykład w zeszłym roku.) Uwielbiam przykład astrologii.
whuber

Czy możesz wyjaśnić próbkę znakiem astrologicznym?
Eugene D. Gubenkov

2
Nieważne, mam to. Ma to związek z różnicą wieku między osobami urodzonymi na początku roku a tymi urodzonymi na końcu. Miły.
Eugene D. Gubenkov

24

Zawsze lubiłem ten:

cytryny a śmierć

źródło: http://pubs.acs.org/doi/abs/10.1021/ci700332k


1
Fajnie, ale nie widzę nikogo, kto próbowałby wyciągnąć z tego wniosek o przyczynowości. A może meksykańscy kierowcy ciężarówek z cytryną są wyjątkowo niebezpieczni po przekroczeniu granicy?
AdamV

2
Oczywiście nieprzewidziany efekt uboczny obfitości przepisów dotyczących cytryn w Stanach Zjednoczonych. Na przykład patrz: en.wikipedia.org/wiki/Lemon_law
Thylacoleo

11
Mój kolega spojrzał na dane z tego okresu po 2000 r. I stwierdził, że związek utrzymywał się dość dobrze „poza próbą”, co jest jeszcze bardziej niepokojące ...
shabbychef


Prosta racjonalizacja polegałaby na tym, że oba zmniejszają się z czasem. Czy dane po 2000 roku to obsługują? PS, Box Hunter i Hunter (patrz poniżej) wyjaśniają przykład bocianów w ten sam sposób: oba wzrosły z czasem w omawianym okresie.
Emil Friedman

23
  1. Czasami wystarcza korelacja. Na przykład w ubezpieczeniach samochodowych męscy kierowcy są skorelowani z większą liczbą wypadków, więc firmy ubezpieczeniowe naliczają je częściej. W żaden sposób nie można tego sprawdzić pod kątem związku przyczynowego. Nie można eksperymentalnie zmieniać płci kierowców. Google zarobił setki miliardów dolarów, nie dbając o związek przyczynowy.

  2. Aby znaleźć związek przyczynowy, na ogół potrzebujesz danych eksperymentalnych, a nie danych obserwacyjnych. Chociaż z ekonomicznego punktu widzenia często używają obserwowanych „szoków” w systemie, aby sprawdzić przyczynowość, na przykład jeśli dyrektor generalny umiera nagle, a cena akcji rośnie, można założyć przyczynę.

  3. Korelacja jest warunkiem koniecznym, ale niewystarczającym. Wykazanie związku przyczynowego wymaga kontr-faktów.


1
Podoba mi się pierwszy przykład, który podajesz. To z pewnością zachęci studentów do rozmowy;)
csgillespie

1
Ciekawa dyskusja Steve'a Steinberga na jego blogu tutaj: blog.steinberg.org/?p=11 na temat niektórych implikacji 1 i tego, gdzie może to prowadzić pod względem słabej AI.
Amos,

Czy ktoś mógłby trochę rozwinąć ostatnie zdanie?
naught101

4
Krótkie wyjaśnienie: korelacja nie jest konieczna w przypadku związku przyczynowego (w zależności od tego, co rozumie się przez korelację): jeśli korelacja jest korelacją liniową (którą całkiem sporo osób z niewielką statystyką przyjmuje domyślnie, gdy używa się tego terminu), ale związek przyczynowy jest nieliniowy. Na przykład, jeśli w bezpośrednio powoduje (co przyjmuje wartości w ), ale . Jeśli są rozmieszczone symetrycznie, i będą nieskorelowane, nawet jeśli są całkowicie zależne. ( - 1 , 1 ) Y ( 0 , 1 ) Y = X(1,1)Y(0,1) X"sXYY=1X2XsXY
Glen_b

18

Mam kilka przykładów, które lubię używać.

  1. Badając przyczynę przestępczości w Nowym Jorku w latach 80., kiedy próbowali posprzątać miasto, naukowiec stwierdził silną korelację między liczbą poważnych przestępstw i ilością lodów sprzedawanych przez sprzedawców ulicznych! (Jaka jest przyczyna i jaki jest skutek?) Oczywiście, istniała nieobserwowana zmienna powodująca jedno i drugie. Lata to okres największej przestępczości i sprzedaży większości lodów.

  2. Rozmiar dłoni jest ujemnie skorelowany z tym, jak długo będziesz żyć (naprawdę!). W rzeczywistości kobiety mają zwykle mniejsze dłonie i żyją dłużej.

  3. [Mój ulubiony] Kilka lat temu słyszałem o badaniu, w którym stwierdzono, że ilość napoju alkoholowego wypijanego przez osobę jest pozytywnie skorelowana z prawdopodobieństwem otyłości.(Powiedziałem sobie - to ma sens, ponieważ musi to być spowodowane tym, że ludzie piją słodką sodę i spożywają te wszystkie puste kalorie.) Kilka dni później pojawiły się dalsze szczegóły. Prawie cała korelacja wynikała ze zwiększonego spożycia dietetycznych napojów bezalkoholowych. (To rozwaliło moją teorię!) Więc w jaki sposób przyczyna? Czy dietetyczne napoje bezalkoholowe powodują zwiększenie masy ciała, czy też zwiększenie masy ciała powoduje wzrost spożycia napojów bezalkoholowych? (Zanim dojdziesz do wniosku, że to ten ostatni, zobacz badanie, w którym kontrolowane eksperymenty na szczurach wykazały, że grupa, która otrzymywała jogurt ze sztucznym słodzikiem, przybrała na wadze więcej niż grupa, która otrzymała normalny jogurt.) Dwie referencje: Pij więcej napojów dietetycznych , Przybrać na wadze? ; Dietetyczne napoje gazowane związane z otyłością. Myślę, że wciąż próbują rozwiązać ten problem.


4
Ten ostatni jest nieco bardziej skomplikowany niż go przedstawiłeś, ale zgadzam się, że wiele z obserwacyjnych powiązań między napojami gazowanymi / dietetycznymi a otyłością należy rozpatrywać krytycznym okiem. Teoretycznie niektórzy twierdzą, że fałszywe zamienniki cukru / tłuszczu mają inne efekty fizjologiczne poza zwykłym spożyciem kalorii. Zobacz na przykład ten eksperyment na szczurach i tłuszczach syntetycznych (zaczerpnięty z bloga Freakonomics).
Andy W

18

Liczba nagród Nobla wygranych przez kraj (dostosowując się do liczby ludności) dobrze koreluje ze spożyciem czekolady na mieszkańca. ( New England Journal of Medicine )

wprowadź opis zdjęcia tutaj


2
+1 Byłem bardzo rozczarowany NEJM, kiedy to opublikowali
MattBagg,

5
Wydaje się, że dość dobrze koreluje także z bliskością Szwecji.
naught101

2
Spożycie czekolady (na mieszkańca) również znacząco koreluje z liczbą seryjnych morderców na mieszkańca. replicatedtypo.com/…
Harvey Motulsky

2
Poprosiłem trzech laureatów Nagrody Nobla, których (niejasno) znam, i wszyscy trzej powiedzieli, że zjadli znacznie więcej czekolady niż większość ich kolegów. Oczywiście odpowiedzi te pojawiły się po przeczytaniu artykułu NEJM!
Harvey Motulsky

4
@MattBagg Zostało to opublikowane jako „Notatki okazjonalne” i oczywiście nie należy tego traktować poważnie.
Pascal


9

Istnieją dwa aspekty tego post hoc ergo propter hoc, które chciałbym omówić: (i) odwrotna przyczynowość i (ii) endogeniczność

Przykład „możliwej” odwrotnej przyczynowości: Picie społeczne i zarobki - pijacy zarabiają więcej pieniędzy według Bethany L. Peters i Edwarda Stringhama (2006. „No Booze? You Can Lose: Dlaczego pijący zarabiają więcej pieniędzy niż napoje bezalkoholowe”, Journal of Labor Research, Transaction Publishers, vol. 27 (3), strony 411-421, czerwiec). A może ludzie, którzy zarabiają więcej pieniędzy, piją więcej, ponieważ mają większy dochód do dyspozycji lub z powodu stresu? To świetny artykuł do omówienia z różnych powodów, w tym błędu pomiaru, błędu odpowiedzi, związku przyczynowego itp.

Przykład „możliwej” endogeniczności: równanie Mincer'a tłumaczy zarobki z logów wykształceniem, doświadczeniem i doświadczeniem do kwadratu. Istnieje długa literatura na ten temat. Ekonomiści pracy chcą oszacować związek przyczynowo-skutkowy edukacji z zarobkami, ale być może edukacja ma charakter endogenny, ponieważ „zdolność” może zwiększyć poziom wykształcenia, jaki jednostka ma (poprzez obniżenie kosztów jego uzyskania) i może prowadzić do wzrostu zarobków, niezależnie od Poziom wykształcenia. Potencjalnym rozwiązaniem tego problemu może być zmienna instrumentalna. Książka Angrista i Pischke'a „Głównie nieszkodliwa ekonometria” omawia to i odnosi się do tematów z dużą szczegółowością i jasnością.

Inne głupie przykłady, na które nie mam poparcia, to: - Liczba telewizorów na mieszkańca i liczba śmiertelności. Wyślijmy więc telewizory do krajów rozwijających się. Oczywiście oba są endogenne dla czegoś takiego jak PKB. - Liczba ataków rekinów i sprzedaży lodów. Oba są endogenne dla temperatury?

Lubię też opowiadać okropny żart o szaleńcu i pająku. Szalony wędruje po korytarzach azylu pająkiem, który nosi w dłoni. Widzi lekarza i mówi: „Patrz doktorze, mogę rozmawiać z pająkami. Patrz na to.” Pająk, idź w lewo! ”Pająk przesuwa się w lewo. Kontynuuje:„ Pająk, idź w prawo. ”Pająk przemierza z prawej strony. Lekarz odpowiada: „Interesujące, może powinniśmy porozmawiać o tym podczas następnej sesji grupowej.” Szaleniec odpowiada: „To nic, doktorze. Zobacz to. ”Ściąga nogi każdego pająka jeden po drugim, a następnie krzyczy:„ Pająku, idź w lewo! ”Pająk leży nieruchomo na dłoni, a wariat zwraca się do lekarza i konkluduje:„ Jeśli zdejmiesz pająka nogi ogłuchnie. ”


8

Najlepsza, której mnie nauczyłem, to liczba utopień, a sprzedaż lodów może być bardzo skorelowana, ale to nie oznacza, że ​​jedna powoduje drugą. Utonięcia i sprzedaż lodów są oczywiście wyższe w miesiącach letnich, gdy jest ładna pogoda. Powoduje je trzecia zmienna, czyli dobra pogoda.


6

Jako uogólnienie „piraci powodują globalne ocieplenie”: Wybierz dowolne dwie wielkości, które (monotonicznie) rosną lub maleją z czasem i powinieneś zobaczyć pewną korelację.


6

Możesz spędzić kilka minut w Google Correlate i wymyślić wszelkiego rodzaju fałszywe korelacje.


1
Chociaż ten link może odpowiedzieć na pytanie, lepiej jest dołączyć tutaj istotne części odpowiedzi i podać link w celach informacyjnych. Odpowiedzi zawierające tylko łącze mogą stać się nieprawidłowe, jeśli połączona strona ulegnie zmianie.
gung

1
@ Gung jesteś poważny? Link prowadzi do aplikacji, a nie do prostej strony opisującej odpowiedź. Odpowiedź stałaby się nieprawidłowa, gdyby połączona strona i tak się zmieniła, ponieważ narzędzie stałoby się niedostępne (w bieżącej formie).
Jerome Baum

6

Pracuję ze studentami w nauczaniu korelacji vs związku przyczynowego na moich zajęciach Algebra One. Badamy wiele możliwych przykładów. Uznałem, że przydatny jest artykuł „Niemowlęta w pakiecie i niebezpieczne lody: puzzle korelacyjne” od nauczyciela matematyki z lutego 2013 r. Podoba mi się pomysł mówienia o „czających się zmiennych”. Również ta kreskówka jest uroczym początkiem rozmowy:

wprowadź opis zdjęcia tutaj

Identyfikujemy zmienną niezależną i zależną w kreskówce i mówimy o tym, czy jest to przykład związku przyczynowego, jeśli nie, dlaczego nie.


4

Przeczytałem (dawno temu) interesujący przykład spadku liczby urodzeń (lub współczynników dzietności, jeśli wolisz ten środek), szczególnie w Stanach Zjednoczonych, począwszy od wczesnych lat 60. XX wieku, ponieważ testy broni jądrowej były najwyższe w historii (w 1961 r. przetestowano największą bombę nuklearną, jaką kiedykolwiek zdetonowano) w ZSRR. Wskaźniki nadal kształtowały się aż do końca XX wieku, kiedy większość z nich w końcu przestała to robić.

Nie mogę teraz znaleźć odniesienia, które łączyłoby te liczby, ale w tym artykule w Wikipedii są dane liczbowe dotyczące numerów testów broni jądrowej według kraju.

Oczywiście lepiej byłoby spojrzeć na korelację wskaźnika urodzeń z wprowadzeniem i legalizacją pigułki antykoncepcyjnej „przypadkowo” od wczesnych lat sześćdziesiątych. (Najpierw tylko w niektórych stanach, potem we wszystkich stanach tylko dla zamężnych kobiet, potem w niektórych stanach niezamężnych, a następnie we wszystkich kierunkach), Ale nawet to może być tylko częścią przyczyny; wiele innych aspektów równości, zmian gospodarczych i innych czynników odgrywa znaczącą rolę.


Ciekawy przykład, ponieważ na pierwszy rzut oka wygląda jak prawdopodobny związek przyczynowo-skutkowy, w przeciwieństwie do wielu najgłupszych przykładów.
Bossykena

1
Podoba mi się to, że możesz sprowokować wiele dyskusji na temat tego, czy „efekt” miał faktycznie wpłynąć na płodność (w medycznym sensie zdolności do poczęcia), czy też był społeczny („Nie chcę wciągać dziecka w tak złe świat"). Następnie upuść bombę na temat Pigułki, jeśli nikt jej nie wychował. Następnie zwróć uwagę, że nawet to może być tylko jeden możliwy czynnik, i omów niektóre inne.
AdamV

4

Sama korelacja nigdy nie może ustanowić związku przyczynowego. David Hume (1771-1776) argumentował dość skutecznie, że nie możemy uzyskać pewnej wiedzy na temat przyczyny za pomocą środków czysto empirycznych. Kant próbował rozwiązać ten problem, strona Wikipedii dla Kanta wydaje się całkiem ładnie podsumować:

Kant uważał, że tworzy kompromis między empirystami i racjonalistami. Empirycy wierzyli, że wiedza jest zdobywana wyłącznie przez doświadczenie, ale racjonaliści utrzymywali, że taka wiedza jest otwarta na wątpliwości kartezjańskie i że sam rozum dostarcza nam wiedzy. Kant twierdzi jednak, że używanie rozumu bez zastosowania go do doświadczenia prowadzi jedynie do złudzeń, podczas gdy doświadczenie będzie czysto subiektywne, bez uprzedniego zasadzenia się pod czystym rozumem.

Innymi słowy, Hume mówi nam, że nigdy nie możemy wiedzieć, że związek przyczynowy istnieje tylko poprzez obserwację korelacji, ale Kant sugeruje, że możemy być w stanie użyć naszego rozumu do odróżnienia korelacji, które implikują związek przyczynowy od tych, którzy tego nie robią. Nie sądzę, by Hume się nie zgodził, dopóki Kant pisał w kategoriach wiarygodności, a nie pewnej wiedzy.

Krótko mówiąc, korelacja dostarcza dowodów poszlakowych sugerujących związek przyczynowy, ale waga dowodów zależy w dużej mierze od konkretnych okoliczności, o których mowa, i nigdy nie możemy być absolutnie pewni. Zdolność przewidywania skutków interwencji jest jednym ze sposobów na zdobycie pewności siebie (nie możemy niczego udowodnić, ale możemy obalić dowody obserwacyjne, więc przynajmniej próbowaliśmy sfałszować teorię związku przyczynowego). Posiadanie prostego modelu, który wyjaśnia, dlaczego powinniśmy obserwować korelację, która wyjaśnia również inne formy dowodów, jest innym sposobem na zastosowanie naszego rozumowania, jak sugeruje Kant.

Zastrzegający emptor: Jest całkiem możliwe, że źle zrozumiałem filozofię, jednak pozostaje faktem, że korelacja nigdy nie może dostarczyć dowodu związku przyczynowego.


2
Jeśli chodzi o to, co warto, w obecnej terminologii uważam, że należy czytać Kanta, twierdząc np. W Drugiej analogii, że niezależnie od zaobserwowanych korelacji istnieje jakiś graf przyczynowy. O ile mi wiadomo, nie miał żadnej konkretnej metody identyfikacji struktury, ale założył, że musi być ona w pełni połączona (ponieważ „każde zdarzenie ma przyczynę”). W tym sensie jest współczesny: wnioskowanie przyczynowe wymaga kombinacji założeń przyczynowych, np. Wyrażonych za pomocą wykresu i obserwowanych prawidłowości danych. I zazwyczaj nie można uniknąć pierwszej części ani zaindukować jej na podstawie danych
sprzężony przed

+1 dobrze wyjaśnione! Może jestem zbyt Bayesowski, ale nie przejmuję się pomysłem, że nie możemy mieć pewnej wiedzy na temat związku przyczynowego.
Dikran Torbacz



3

Liczba plemników u samców w słoweńskich wioskach, a liczba niedźwiedzi (również w Słowenii) wykazuje ujemną korelację. Niektórzy uważają to za bardzo niepokojące. Spróbuję zdobyć badanie, które to zrobiło.


3

Niedawno byłem na konferencji, a jeden z prelegentów podał ten bardzo interesujący przykład (chociaż chodziło o zilustrowanie czegoś innego):

  • Amerykanie i Anglicy jedzą dużo tłustego jedzenia. W Stanach Zjednoczonych i Wielkiej Brytanii występuje wysoki odsetek chorób sercowo-naczyniowych.

  • Francuzi jedzą dużo tłustych potraw, ale mają niższy wskaźnik chorób sercowo-naczyniowych.

  • Amerykanie i Anglicy piją dużo alkoholu. W Stanach Zjednoczonych i Wielkiej Brytanii występuje wysoki odsetek chorób sercowo-naczyniowych.

  • Włosi piją dużo alkoholu, ale znowu mają niższy wskaźnik chorób sercowo-naczyniowych.

Konkluzja? Jedz i pij, co chcesz. A jeśli mówisz po angielsku, masz większe szanse na atak serca!


3
Jest to również dobry przykład błędu ekologicznego (tj. Wnioskowanie o poziomie indywidualnym na podstawie danych na poziomie grupy).
Jeromy Anglim


3

Innym przykładem stosowanej przeze mnie korelacji jest duży wzrost liczby osób jedzących żywność organiczną oraz wzrost liczby dzieci ze zdiagnozowanym autyzmem w USA. W sieci znajduje się wykres parodii - autyzm wykres parodii żywności organicznej


3

http://tylervigen.com/

Pokazuje to mnóstwo korelacji, które oczywiście nie mają nic wspólnego z przyczynowością - czy masz jakiś dobry pomysł, jaki jest związek z korelacją Age of Miss America koreluje z morderstwami przez parę, gorące opary i gorące przedmioty

??


2

Nauczanie „Korelacja nie oznacza związku przyczynowego” tak naprawdę nikomu nie pomaga, ponieważ na koniec dnia wszystkie argumenty dedukcyjne są częściowo oparte na korelacji.

Ludzie bardzo źle uczą się nie robić czegoś.

Cel powinien być raczej konstruktywny: zawsze myśl o alternatywach dla początkowych założeń, które mogą dawać te same dane.


1
To nie odpowiada na pytanie: być może należy to rozumieć jako komentarz.
whuber

2

Mój profesor zastosował je w klasie prawdopodobieństwa wprowadzenia:

1) Rozmiar buta jest skorelowany ze zdolnością czytania

2) Atak rekinów jest skorelowany ze sprzedażą lodów.


2

Im więcej wozów strażackich wysłanych do ognia, tym większe szkody.


1
Jedynym problemem z tym przykładem jest to, że istnieje wyraźna odwrotna przyczyna.
naught101

1

Myślę, że lepszym paradygmatem może być związek przyczynowy, który wymaga korelacji związanej z wiarygodnym i najlepiej sprawdzonym mechanizmem. Myślę, że słowo „sugeruj” powinno być używane bardzo oszczędnie w tym kontekście, ponieważ ma kilka znaczeń, w tym sugestię.


1

Przykład bocianów znajduje się na stronie 8 pierwszego wydania (1978) książki Box, Hunter & Hunter zatytułowanej „Statistics for Experimenters ...” (Wiley). Nie wiem, czy jest w 2. edycji. Określają miasto jako Oldenburg, a okres 1930–1936.

Odnoszą się do Ornithologische Monatsberichte , 44 , No 2, Jahrgang, 1936, Berlin, i 48 , No 1, Jahrgang, 1940, Berlin i Statistiches Jahrbuch Deutscher Gemeinden , 27-33, 1932-1938, Gustav Fischer, Jena.


0

W artykule widziałem zabawny.

Produkcja masła w Bangladeszu ma jedną z najwyższych korelacji z S&P 500 w ciągu dziesięciu lat.

http://www.forbes.com/sites/davidleinweber/2012/07/24/stupid-data-miner-tricks-quants-fooling-themself-the-economic-indicator-in-your-pants/


2
Co? Wykres pokazuje S&P w czasie. Tytuł mówi o produkcji masła i sera, które nie są widoczne na wykresie. ???
Harvey Motulsky,


3
OK, teraz widzę. Wykres pokazuje prognozę modelu regresji wielokrotnej, pokazując, że włączenie trzech głupich zmiennych całkiem nieźle wykonuje model przewidujący zmiany w SP500 w czasie. Jest to dobry przykład nadmiernego dopasowania w regresji wielokrotnej i pośrednio pokazuje, że korelacja (lub poprawiona zgodność dopasowania fantazyjnego modelu) nie oznacza związku przyczynowego.
Harvey Motulsky

0

Oto idealny. I, niestety, można go wykorzystać jako świetny punkt do nauki, ponieważ ani pracownicy Washington Post, ani Centra Kontroli i Zapobiegania Chorobom nie wykazują żadnej wiedzy o tym, że artykuł powinien być satyrycznym utworem w Cebuli.

https://www.washingtonpost.com/health/trumps-presidency-may-be-making-latinos-sick/2019/07/19/4e89b9f0-a97f-11e9-9214-246e594de5d5_story.html?utm_term=.9dd329c2e837


3
Proszę streścić to, co powiedziano za linkiem, nie tylko dlatego, że uważasz, że jest to błąd.
cbeleites

Przepraszam. Ale myślałem, że to jest oczywiste.
Mark C.

2
Link jest w porządku jako odniesienie do źródła, ale nie należy zakładać, że każdy może go przeczytać (lub nie bez większych problemów). Należy pamiętać: takie linki są bardzo podatne na gnicie linków i nie wszystkie gazety obsługują wszystkie regiony geograficzne (np. Są gazety amerykańskie, które uznały, że przestrzeganie unijnego RODO nie jest warte zawracania głowy i które w konsekwencji zablokują czytelnikom IP UE adres).
cbeleites

-2

Ktoś powiedział, że korelacja może nie oznaczać związku przyczynowego, ale z pewnością może być dobrą wskazówką :)

Ok, pomijając zabawną część, czym dokładnie jest związek przyczynowy? Czy naprawdę jesteśmy pewni, że piraci nie powodują globalnego ocieplenia?

Przeciwnie intuicyjne, ale to, co jest uważane za przyczynę, a co za efekt (w badaniu korelacji nie jest tak jasne). Oczywiście wiele razy oba mogą być tylko skutkami wspólnej przyczyny (a więc skorelowane)

Wszystko sprowadza się do metody określania związku przyczynowego.

Jest to przyczyna (zamierzona gra słów):

Są małe kłamstwa. Są wielkie kłamstwa I statystyki.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.