Czytam The Book of Why Judei Pearl i zaczyna się ona pod moją skórą 1 . W szczególności wydaje mi się, że bezwarunkowo krytykuje „klasyczne” statystyki, wysuwając argument słaby, że statystyki nigdy nie są w stanie zbadać związków przyczynowych, że nigdy nie są zainteresowane relacjami przyczynowymi, a statystyki „stały się modelem „oślepione przedsiębiorstwo redukcji danych”. Statystyka staje się brzydkim słowem w jego książce.
Na przykład:
Statystycy byli ogromnie zdezorientowani co do tego, jakie zmienne powinny i nie powinny być kontrolowane, więc domyślną praktyką było kontrolowanie wszystkiego, co można zmierzyć. [...] Jest to wygodna, prosta procedura do naśladowania, ale jest zarówno marnotrawna, jak i pełna błędów. Kluczowym osiągnięciem rewolucji przyczynowej było zakończenie tego zamieszania.
Jednocześnie statystycy znacznie nie doceniają kontroli w tym sensie, że nie lubią mówić o przyczynowości w ogóle [...]
Jednak modele przyczynowe są w statystykach takich jak zawsze. To znaczy, model regresji może być stosowany w zasadzie modelu przyczynowy, ponieważ są w istocie przy założeniu, że jedna zmienna jest przyczyną, a inny jest efekt (stąd korelacji różne podejścia z modelowaniem regresji) i testuje, czy związek przyczynowy wyjaśnia obserwowaną wzory .
Kolejny cytat:
Nic dziwnego, że w szczególności statystycy znaleźli tę zagadkę [problem Monty Hall] trudną do zrozumienia. Są przyzwyczajeni, jak to ujął RA Fisher (1922), do „redukcji danych” i ignorowania procesu generowania danych.
Przypomina mi to odpowiedź, którą Andrew Gelman napisał do słynnej kreskówki xkcd o Bayesianach i częstownikach: „Mimo wszystko uważam, że ta kreskówka jako całość jest niesprawiedliwa, ponieważ porównuje rozsądnego Bayesianina ze statystykami częstych, którzy ślepo podążają za radami płytkich podręczników . ”
Ilość błędnego przedstawienia słowa-s, które, jak go postrzegam, istnieje w książce Judei Pearls, sprawiło, że zastanawiam się, czy wnioskowanie przyczynowe (które do tej pory uważałem za użyteczny i interesujący sposób organizowania i testowania naukowej hipotezy 2 ) jest wątpliwe.
Pytania: czy uważasz, że Judea Pearl wprowadza w błąd statystyki, a jeśli tak, dlaczego? Żeby wnioskowanie przyczynowe brzmiało bardziej niż jest w rzeczywistości? Czy uważasz, że wnioskowanie przyczynowe jest rewolucją o dużym R, która naprawdę zmienia całe nasze myślenie?
Edytować:
Powyższe pytania są moim głównym problemem, ale skoro są one, co prawda, opiniowane, proszę odpowiedzieć na te konkretne pytania (1) jakie jest znaczenie „rewolucji przyczynowej”? (2) czym różni się od „ortodoksyjnych” statystyk?
1. Również dlatego, że jest takim skromnym facetem.
2. Mam na myśli w sensie naukowym, a nie statystycznym.
EDYCJA : Andrew Gelman napisał ten post na blogu o książce Judei Pearls i myślę, że zrobił znacznie lepszą robotę, tłumacząc moje problemy z tą książką niż ja. Oto dwa cytaty:
Na stronie 66 książki Pearl i Mackenzie piszą, że statystyki „stały się ślepym na model przedsięwzięciem ograniczania danych”. Hej! Co ty do cholery mówisz?? Jestem statystykiem, robię statystyki od 30 lat, pracuję w obszarach od polityki po toksykologię. „Redukcja danych ślepa na model”? To tylko bzdury. Cały czas używamy modeli.
I kolejny:
Popatrz. Wiem o dylemacie pluralisty. Z jednej strony Pearl uważa, że jego metody są lepsze niż wszystko, co było wcześniej. W porządku. Dla niego i dla wielu innych są najlepszymi narzędziami do badania wnioskowania przyczynowego. Jednocześnie jako pluralista lub student historii naukowej zdajemy sobie sprawę, że istnieje wiele sposobów upieczenia ciasta. Trudno jest okazywać szacunek podejściom, które tak naprawdę dla ciebie nie działają, a w pewnym momencie jedynym sposobem na to jest wycofanie się i uświadomienie sobie, że prawdziwi ludzie używają tych metod do rozwiązywania prawdziwych problemów. Na przykład myślę, że podejmowanie decyzji przy użyciu wartości p jest straszną i logicznie niespójną ideą, która doprowadziła do wielu katastrof naukowych; jednocześnie wielu naukowcom udaje się wykorzystać wartości p jako narzędzia do nauki. Rozumiem to. Podobnie, Poleciłbym, aby Pearl rozpoznała, że aparat statystyczny, modelowanie regresji hierarchicznej, interakcje, poststratyfikacja, uczenie maszynowe itp. Rozwiązuje prawdziwe problemy w wnioskowaniu przyczynowym. Nasze metody, takie jak Pearl, mogą również popsuć - GIGO! - i może Pearl ma rację, że lepiej byłoby przejść na jego podejście. Ale nie sądzę, żeby to pomogło, gdy wydaje niedokładne stwierdzenia na temat tego, co robimy.