Odpowiedzi:
Nie jest to paradoks sam w sobie , ale jest to zagadkowy komentarz, przynajmniej na początku.
Podczas II wojny światowej Abraham Wald był statystyką dla rządu USA. Spojrzał na bombowce powracające z misji i przeanalizował wzór „ran” pocisków na samolotach. Zalecił, aby Marynarka Wojenna wzmocniła obszary, w których samoloty nie zostały uszkodzone.
Dlaczego? Mamy efekty selekcji w pracy. Ta próbka sugeruje, że szkody wyrządzone w obserwowanych obszarach mogą zostać wytrzymane. Oba samoloty nigdy nie zostały trafione w nietknięte obszary, nieprawdopodobna propozycja lub uderzenia w te części były śmiertelne. Dbamy o samoloty, które upadły, a nie tylko o te, które powróciły. Ci, którzy polegli, prawdopodobnie zostali zaatakowani w miejscu nietkniętym na tych, którzy przeżyli.
Kopie jego oryginalnych memorandów można znaleźć tutaj . Bardziej nowoczesną aplikację można znaleźć w blogu Scientific American .
Zgodnie z tym postem na blogu podczas I wojny światowej wprowadzenie cynowego hełmu spowodowało więcej ran głowy niż standardowy kapelusz z tkaniny. Czy nowy hełm był gorszy dla żołnierzy? Nie; chociaż obrażenia były wyższe, liczba ofiar śmiertelnych była niższa.
Innym przykładem jest błąd ekologiczny .
Przykład
Załóżmy, że szukamy związku między głosowaniem a dochodami poprzez regresję udziału w głosowaniu dla ówczesnego senatora Obamy w stosunku do mediany dochodu państwa (w tysiącach). Otrzymujemy przecięcie około 20 i współczynnik nachylenia 0,61.
Wielu interpretuje ten wynik jako powiedzenie, że ludzie o wyższych dochodach częściej głosują na Demokratów; w rzeczy samej popularne książki prasowe przedstawiły ten argument.
Ale czekaj, myślałem, że bogaci ludzie są bardziej republikanami? Oni są.
Ta regresja naprawdę mówi nam, że bogate państwa częściej głosują na Demokratę, a biedne państwa częściej głosują na republikana. W danym państwie bogaci ludzie częściej głosują na republikanów, a biedni częściej głosują na Demokratów. Zobacz prace Andrew Gelmana i jego współautorów .
Bez dalszych założeń nie możemy wykorzystywać danych na poziomie grupy (agregować) do wyciągania wniosków na temat zachowań na poziomie poszczególnych osób. To błąd ekologiczny. Dane na poziomie grupy mogą nam powiedzieć tylko o zachowaniu na poziomie grupy.
Aby przejść do wnioskowania na poziomie indywidualnym, potrzebujemy założenia stałości . Tutaj głosowanie osób w większości nie zmienia się systematycznie w zależności od mediany dochodu państwa; osoba, która zarabia X USD w stanie bogatym, musi równie dobrze głosować na Demokratę, jak ktoś, kto zarabia X USD w stanie złym. Ale ludzie w Connecticut, na wszystkich poziomach dochodu, częściej głosują na Demokratę niż ludzie w Mississippi o tym samym poziomie dochodów . W związku z tym naruszono założenie dotyczące spójności i doprowadzono nas do błędnego wniosku (oszukanego przez uprzedzenie agregacyjne ).
Temat ten był częstym koniem hobby zmarłego Davida Freedmana ; zobacz na przykład ten artykuł . W tym artykule Freedman zapewnia sposób ograniczania prawdopodobieństwa na poziomie indywidualnym przy użyciu danych grupowych.
Porównanie do paradoksu Simpsona
Gdzie indziej w tym CW, @Michelle proponuje paradoks Simpsona jako dobry przykład, taki jaki jest. Paradoks Simpsona i błąd ekologiczny są ściśle powiązane, ale wyraźne. Te dwa przykłady różnią się naturą danych i zastosowanej analizy.
Standardowym sformułowaniem paradoksu Simpsona jest dwustronny stół. W naszym przykładzie załóżmy, że mamy indywidualne dane i klasyfikujemy każdą osobę jako o wysokim lub niskim dochodzie. Otrzymalibyśmy tabelę zdarzeń awaryjnych 2x2 sum całkowitych. Przekonalibyśmy się, że wyższy odsetek osób o wysokich dochodach głosował na Demokratę w porównaniu z udziałem osób o niskich dochodach. Gdybyśmy jednak stworzyli tabelę awaryjną dla każdego stanu, zobaczylibyśmy odwrotny wzór.
W błędach ekologicznych nie dzielimy dochodu na zmienną dychotomiczną (a może wielokhotomową). Aby uzyskać poziom państwowy, otrzymujemy średni (lub medianę) dochód państwowy i udział w głosowaniu stanowym, przeprowadzamy regres i stwierdzamy, że państwa o wyższych dochodach częściej głosują na Demokratę. Gdybyśmy zachowali dane na poziomie indywidualnym i przeprowadzili regresję osobno według stanu, znaleźlibyśmy efekt odwrotny.
Podsumowując, różnice są następujące:
Ogólna obserwacja
@NeilG komentuje, że wydaje się, że to po prostu mówi, że nie możesz mieć wyboru w kwestii regresji nieobserwowalnych / pominiętych zmiennych. Zgadza się! Przynajmniej w kontekście regresji myślę, że prawie jakikolwiek „paradoks” jest tylko szczególnym przypadkiem odchylenia pominiętych zmiennych.
Odchylenie wyboru (patrz moja inna odpowiedź na ten CW) można kontrolować, włączając zmienne, które sterują wyborem. Oczywiście te zmienne są zwykle nieobserwowane, co powoduje problem / paradoks. Regresję fałszywą (moją drugą odpowiedź) można pokonać, dodając trend czasowy. Przypadki te mówią zasadniczo, że masz wystarczającą ilość danych, ale potrzebujesz więcej predyktorów.
W przypadku błędu ekologicznego prawdą jest, że potrzebujesz więcej predyktorów (tutaj, specyficzne dla danego stoku zbocza i przechwyty). Ale potrzebujesz więcej obserwacji, zarówno indywidualnych, jak i grupowych, aby oszacować te relacje.
(Nawiasem mówiąc, jeśli masz ekstremalną selekcję, w której zmienna selekcji doskonale dzieli leczenie i kontrolę, tak jak w podanym przeze mnie przykładzie z II wojny światowej, możesz potrzebować więcej danych, aby oszacować regresję; tam, powalone płaszczyzny.)
Mój wkład jest paradoksem Simpsona, ponieważ:
naprawdę trudno jest wyjaśnić, dlaczego wyniki są sposobem, w jaki ludzie mają mówić po angielsku.
wersja paradoksu tl; dr: istotność statystyczna wyniku wydaje się być różna w zależności od sposobu podziału danych. Przyczyną często wydaje się być zmienna myląca.
Kolejny dobry zarys paradoksu jest tutaj .
W statystykach nie ma paradoksów, tylko zagadki czekające na rozwiązanie.
Niemniej jednak moim ulubionym jest „paradoks” dwóch kopert . Załóżmy, że położyłem przed tobą dwie koperty i powiem, że jedna zawiera dwa razy więcej pieniędzy niż druga (ale która nie jest która). Rozumujesz w następujący sposób. Załóżmy, że lewa koperta zawiera , a następnie z 50% prawdopodobieństwem prawa koperta zawiera a przy 50% prawdopodobieństwie zawiera , dla oczekiwanej wartości . Ale oczywiście możesz po prostu odwrócić koperty i stwierdzić, że lewa koperta zawiera wartości prawej koperty. Co się stało?
Problem Śpiącej Królewny .
To najnowszy wynalazek; było szeroko dyskutowane w niewielkim zestawie czasopism filozoficznych w ciągu ostatniej dekady. Istnieją zagorzali zwolennicy dwóch bardzo różnych odpowiedzi („Halfers” i „Thirders”). Stawia pytania o naturę wiary, prawdopodobieństwa i uwarunkowania, i zmusił ludzi do inwokowania kwantowo-mechanicznej interpretacji „wielu światów” (między innymi dziwacznych rzeczy).
Oto oświadczenie z Wikipedii:
Sleeping Beauty zgłosi się na ochotnika do poddania się następującemu eksperymentowi i otrzyma wszystkie następujące informacje. W niedzielę zostaje uśpiona. Następnie rzuca się uczciwą monetą, aby ustalić, która procedura eksperymentalna zostanie podjęta. Jeśli moneta podniesie głowę, Piękno obudzi się i przeprowadzi wywiad w poniedziałek, a następnie eksperyment się zakończy. Jeśli moneta wypłynie z reszki, budzi się i przeprowadza wywiad w poniedziałek i wtorek. Ale kiedy w poniedziałek zostaje ponownie uśpiona, otrzymuje dawkę leku wywołującego amnezję, który gwarantuje, że nie pamięta poprzedniego przebudzenia. W takim przypadku eksperyment kończy się po przesłuchaniu we wtorek.
Za każdym razem, gdy Śpiąca królewna jest budzona i przesłuchiwana, zostaje zapytana: „Jaka jest teraz twoja wiarygodność dla twierdzenia, że moneta wylądowała?”
Pozycja Pragnienia polega na tym, że SB powinna odpowiedzieć „1/3” (jest to proste obliczenie Twierdzenia Bayesa), a pozycja Halfera powinna powiedzieć „1/2” (ponieważ to jest prawidłowe prawdopodobieństwo dla uczciwej monety, oczywiście! ). IMHO, cała debata opiera się na ograniczonym zrozumieniu prawdopodobieństwa, ale czy nie o to chodzi w badaniu pozornych paradoksów?
(Ilustracja z projektu Gutenberg .)
Chociaż nie jest to miejsce do rozwiązywania paradoksów - tylko do ich stwierdzenia - nie chcę pozostawiać ludzi wiszących i jestem pewien, że większość czytelników tej strony nie chce przedzierać się przez wyjaśnienia filozoficzne. Możemy wyciągnąć wskazówkę od ET Jaynesa , który zastępuje pytanie „jak zbudować matematyczny model ludzkiego zdrowego rozsądku” - czego potrzebujemy, aby przemyśleć problem Śpiącej Królewny - „Jak moglibyśmy zbudować maszynę który przeprowadziłby użyteczne, wiarygodne rozumowanie, zgodnie z jasno określonymi zasadami wyrażającymi wyidealizowany zdrowy rozsądek? ”. Zatem, jeśli chcesz, zastąp SB myślącym robotem Jaynesa. Możesz sklonowaćten robot (zamiast podawania fantazyjnego leku na amnezję) we wtorkową część eksperymentu, tworząc w ten sposób przejrzysty model konfiguracji SB, który można jednoznacznie przeanalizować. Modelowanie to w sposób standardowy z zastosowaniem teorii decyzji statystycznych następnie ujawnia Tak naprawdę są dwa pytania zadawane są tutaj ( co jest szansa uzasadniona moneta wyląduje głowy? I jaka jest szansa, że moneta wylądował głowy, uzależnione od faktu, że byłeś klon, który został obudzony? ). Odpowiedź brzmi: 1/2 (w pierwszym przypadku) lub 1/3 (w drugim przypadku, używając twierdzenia Bayesa). W tym rozwiązaniu nie zastosowano zasad mechaniki kwantowej :-).
Arntzenius, Frank (2002). Refleksje na temat Śpiącej Królewny . Analiza 62,1 str. 53–62. Elga, Adam (2000). Samookreślająca się wiara i problem Śpiącej Królewny. Analiza 60 s. 143–7.
Franceschi, Paul (2005). Śpiąca królewna a problem redukcji świata . Przedruk
Groisman, Berry (2007). Koniec koszmaru Śpiącej Królewny .
Lewis, D (2001). Śpiąca królewna: odpowiedz Eldze . Analiza 61,3 s. 171–6.
Papineau, David and Victor Dura-Vila (2008). Pragnienie i Everettian: odpowiedź na „Quantum Sleeping Beauty” Lewisa .
Pust, Joel (2008). Horgan on Sleeping Beauty . Synthese 160 str. 97-101.
Vineberg, Susan (bez daty, być może 2003). Beauty's Cautionary Tale .
Wszystkie można znaleźć (lub przynajmniej kilka lat temu) w Internecie.
St.Petersburg paradoks , który sprawia, że można myśleć inaczej na koncepcji i znaczenia wartości oczekiwanej . Intuicja (głównie dla osób posiadających doświadczenie w statystyce) i obliczenia dają różne wyniki.
Jeffreys-Lindley paradoks , który pokazuje, że w pewnych okolicznościach i Bayesa częstościowym domyślnych metod testowania hipotez może dać całkowicie sprzeczne odpowiedzi. Naprawdę zmusza użytkowników do myślenia o tym, co dokładnie oznaczają te formy testowania i do rozważenia, czy tego właśnie chcą. Ostatni przykład znajduje się w tej dyskusji .
Istnieje słynny błąd dwóch dziewczyn:
W rodzinie z dwójką dzieci, jakie są szanse, że jedno z dzieci jest dziewczynką , że oboje są dziewczynkami?
Większość ludzi intuicyjnie mówi 1/2
, ale odpowiedź brzmi 1/3
. Problem polega zasadniczo na tym, że równomierne wybranie „jednej dziewczynki ze wszystkich dziewcząt z jednym rodzeństwem” przypadkowo nie jest tym samym, co jednolite wybranie „jednej rodziny ze wszystkich rodzin z dwójką dzieci i co najmniej jednej dziewczynki”.
Ten jest wystarczająco prosty, aby połączyć go z intuicją, gdy go zrozumiesz, ale istnieją bardziej skomplikowane wersje, które są trudniejsze do zrozumienia:
Jakie są szanse, że w rodzinie z dwójką dzieci, jeśli jedno z dzieci jest chłopcem urodzonym we wtorek , oboje są chłopcami? (Odpowiedź: 13/27)
W rodzinie z dwójką dzieci, jakie są szanse, jeśli jedno z dzieci to dziewczynka o imieniu Floryda , że oba dzieci są dziewczynkami? (Odpowiedź: bardzo blisko 1/2, zakładając, że „Floryda” jest niezwykle rzadką nazwą)
Więcej informacji na temat wszystkich tych zagadek można znaleźć w tej odpowiedzi .
(Również: Więcej informacji o chłopcu urodzonym we wtorek , więcej informacji o dziewczynie o imieniu Floryda )
1/3
nie jest 2/3
? Tylko jeden zGB, BG, GG
Przepraszam, ale nie mogę się powstrzymać (ja też uwielbiam paradoksy statystyczne!).
Ponownie, być może nie jest to paradoks per se i kolejny przykład odchylenia pominiętych zmiennych.
Fałszywa przyczyna / regresja
Każda zmienna z trendem czasowym będzie skorelowana z inną zmienną, która również ma trend czasowy. Na przykład moja waga od urodzenia do 27 roku życia będzie silnie skorelowana z twoją wagą od urodzenia do 27 roku życia. Oczywiście, moja waga nie jest spowodowana twoją wagą. Jeśli tak, proszę o częstsze chodzenie na siłownię.
Kiedy przeprowadzasz analizę szeregów czasowych, musisz mieć pewność, że twoje zmienne są nieruchome, w przeciwnym razie otrzymasz te fałszywe wyniki przyczynowe.
(W pełni przyznaję, że podrobiłem własną odpowiedź podaną tutaj ).
Jednym z moich ulubionych jest problem Monty Hall. Pamiętam, jak dowiadywałem się o tym na lekcji statystyk podstawowych, mówiąc ojcu, ponieważ oboje z niedowierzaniem symulowałem liczby losowe i próbowaliśmy rozwiązać problem. Ku naszemu zdziwieniu była to prawda.
Zasadniczo problem polega na tym, że jeśli miałeś troje drzwi w teleturnieju, za którym jedna jest nagrodą, a pozostałe dwie nic, jeśli wybrałeś drzwi, a następnie powiedziano ci o pozostałych dwóch drzwiach, jedno z dwóch nie było drzwiami z nagrodami i możesz zmienić swój wybór, jeśli tak wybierzesz, powinieneś zmienić obecne drzwi na pozostałe.
Oto również link do symulacji R: LINK
Paradoks Parrondo:
Z wikipdedii : „Paradoks Parrondo, paradoks w teorii gier, został opisany jako: Kombinacja strategii przegranych staje się strategią wygrywającą. Jej nazwa pochodzi od twórcy, Juana Parrondo, który odkrył paradoks w 1996 r. Bardziej objaśniający opis to :
Istnieją pary gier, każda z większym prawdopodobieństwem przegranej niż wygranej, dla których można zbudować strategię wygrywającą, grając na przemian.
Parrondo opracował paradoks w związku z analizą zapadki Browna, eksperymentu myślowego na temat maszyny, która rzekomo może pobierać energię z przypadkowych ruchów ciepła spopularyzowanych przez fizyka Richarda Feynmana. Paradoks znika jednak po dokładnej analizie ”.
Choć paradoks może wydawać się kuszący dla finansowych tłumów, ma pewne wymagania, które nie są łatwo dostępne w finansowych szeregach czasowych. Mimo że kilka strategii składowych może przegrywać, strategie kompensacji wymagają nierównych i stabilnych prawdopodobieństw znacznie większych lub mniejszych niż 50%, aby uruchomić efekt zapadkowy. Trudno byłoby znaleźć strategie finansowe, w których i inne, , przez długi czas.
Istnieje również nowszy powiązany paradoks zwany „ mieszaniną Allison ”, który pokazuje, że możemy wziąć dwie serie IID i nieskorelowane serie i losowo je szyfrować, tak aby niektóre mieszaniny mogły stworzyć wynikową serię z niezerową autokorelacją.
Interesujące jest to, że problem dwojga dzieci i problem Monty Hall tak często wspominane są w kontekście paradoksu. Oba ilustrują pozorny paradoks zilustrowany po raz pierwszy w 1889 r., Zwany Paradoksem Boxa Bertranda, który można uogólnić, by reprezentować oba. Uważam to za najbardziej interesujący „paradoks”, ponieważ ci sami bardzo wykształceni, bardzo inteligentni ludzie odpowiadają na te dwa problemy w odwrotny sposób w odniesieniu do tego paradoksu. Porównuje się również do zasady stosowanej w grach karcianych, takich jak brydż, znanej jako Zasada Ograniczonego Wyboru, w której rozdzielczość jest sprawdzana w czasie.
Powiedz, że masz losowo wybrany element, który nazywam „pudełkiem”. Każde możliwe pudełko ma co najmniej jedną z dwóch właściwości symetrycznych, ale niektóre mają oba. Nazwę właściwości „złotem” i „srebrem”. Prawdopodobieństwo, że pudełko jest tylko złotem, wynosi P; a ponieważ właściwości są symetryczne, P jest również prawdopodobieństwem, że pudełko jest po prostu srebrne. To sprawia, że prawdopodobieństwo, że pudełko ma tylko jedną właściwość 2P, oraz prawdopodobieństwo, że ma ono zarówno 1-2P.
Jeśli powiedziano ci, że pudełko jest złote, ale nie ma znaczenia, czy jest to srebro, możesz pokusić się o stwierdzenie, że szanse, że to tylko złoto, to P / (P + (1-2P)) = P / (1-P). Ale wtedy musisz podać to samo prawdopodobieństwo dla jednokolorowego pudełka, jeśli powiedziano ci, że jest srebrne. A jeśli prawdopodobieństwo to wynosi P / (1-P) za każdym razem, gdy powiedziano ci tylko jeden kolor, musi to być P / (1-P), nawet jeśli nie powiedziano ci koloru. Wiemy jednak, że jest to 2P z ostatniego akapitu.
Ten pozorny paradoks rozwiązuje się, zauważając, że jeśli pudełko ma tylko jeden kolor, nie ma dwuznaczności co do tego, jaki kolor zostaniesz poinformowany. Ale jeśli ma dwa, istnieje domyślny wybór. Musisz wiedzieć, jak dokonano tego wyboru, aby odpowiedzieć na pytanie, i to jest podstawa pozornego paradoksu. Jeśli nie zostaniesz o tym poinformowany, możesz założyć, że kolor został wybrany losowo, co daje odpowiedź P / (P + (1-2P) / 2) = 2P. Jeśli upierasz się, że P / (1-P) jest odpowiedzią, domyślnie zakładasz, że nie było możliwości, aby inny kolor mógł zostać wymieniony, chyba że byłby to jedyny kolor.
W Monty Hall Problem analogia kolorów nie jest bardzo intuicyjna, ale P = 1/3. Odpowiedzi oparte na dwóch nieotwartych drzwiach, które pierwotnie miałyby równie tę samą nagrodę, zakładają, że Monty Hall musiał otworzyć drzwi, które zrobił, nawet jeśli miał wybór. Ta odpowiedź to P / (1-P) = 1/2. Odpowiedź pozwalająca mu wybierać losowo to 2P = 2/3 dla prawdopodobieństwa wygranej zamiany.
W Problemie dwojga dzieci kolory w mojej analogii całkiem ładnie porównują się do płci. W czterech przypadkach P = 1/4. Aby odpowiedzieć na pytanie, musimy wiedzieć, w jaki sposób ustalono, że w rodzinie była dziewczyna. Jeśli tą metodą można było dowiedzieć się o chłopcu w rodzinie, odpowiedź brzmi 2P = 1/2, a nie P / (1-P) = 1/3. To trochę bardziej skomplikowane, jeśli weźmiesz pod uwagę nazwę Floryda lub „urodzony we wtorek”, ale wyniki są takie same. Odpowiedź jest dokładnie 1/2, jeśli był wybór, a większość stwierdzeń dotyczących problemu sugeruje taki wybór. Powód „zmiany” z 1/3 na 13/27 lub z 1/3 na „prawie 1/2” wydaje się paradoksalny i nieintuicyjny, ponieważ założenie braku wyboru jest nieintuicyjne.
W Zasadzie ograniczonego wyboru powiedz, że brakuje jakiegoś zestawu równoważnych kart - takich jak walet, królowa i król tego samego koloru. Szanse zaczynają się od tego, że jakaś konkretna karta należy do konkretnego przeciwnika. Ale po tym, jak przeciwnik zagra jedną, jego szanse na posiadanie jednego z pozostałych są zmniejszone, ponieważ mógłby zagrać tę kartę, gdyby ją miał.
Lubię następujące: Host używa nieznanego rozkładu na aby wybrać niezależnie dwie liczby . Jedyną rzeczą znaną graczowi na temat rozkładu jest to, że . Następnie gracz pokazuje liczbę i jest proszony o zgadnięcie, czy czy . Oczywiście, jeśli gracz zawsze zgaduje wówczas gracz ma rację z prawdopodobieństwem . Jednak, co najmniej zaskakujące, jeśli nie paradoksalne, gracz może ulepszyć tę strategię. Obawiam się, że nie mam linku do problemu (słyszałem to wiele lat temu podczas warsztatów).x , y ∈ [ 0 , 1 ] P ( x = y ) = 0 x y > x y < x y > x 0,5
Znajduję uproszczoną graficzną ilustrację błędu ekologicznego (tutaj paradoks głosowania w stanie bogatym / biednym) pomaga mi zrozumieć na poziomie intuicyjnym, dlaczego widzimy odwrócenie wzorców głosowania, gdy agregujemy populacje państwowe:
Załóżmy, że uzyskałeś dane dotyczące urodzeń w rodzinie królewskiej jakiegoś królestwa. W drzewie genealogicznym odnotowano każde narodziny. Osobliwą cechą tej rodziny było to, że rodzice próbowali mieć dziecko, gdy tylko urodził się pierwszy chłopiec, a potem nie mieli już dzieci.
Twoje dane potencjalnie wyglądają podobnie do tego:
G G B
B
G G B
G B
G G G G G G G G G B
etc.
Czy odsetek chłopców i dziewcząt w tej próbie odzwierciedla ogólne prawdopodobieństwo porodu chłopca (powiedzmy 0,5)? Odpowiedź i wyjaśnienie można znaleźć w tym wątku .
To znowu Paradoks Simpsona, ale „zarówno wstecz, jak i do przodu”, pochodzi z nowej książki Judei Pearl „ Causal Inference in Statistics: A primer” [^ 1]
Klasyczny paradoks Simpona działa w następujący sposób: rozważ próbę wyboru między dwoma lekarzami. Automatycznie wybierasz ten z najlepszymi wynikami. Ale przypuśćmy, że ten z najlepszymi wynikami wybiera najprostsze przypadki. Niższy rekord tego drugiego jest konsekwencją trudniejszej pracy.
Teraz kogo wybierasz? Lepiej spojrzeć na wyniki stratyfikowane według trudności, a następnie zdecydować.
Istnieje druga strona medalu (inny paradoks), która mówi, że stratyfikowane wyniki mogą również prowadzić do złego wyboru.
Tym razem zastanów się nad wyborem leku, czy nie. Lek ma toksyczne działanie niepożądane, ale jego terapeutyczny mechanizm działania polega na obniżeniu ciśnienia krwi. Ogólnie rzecz biorąc, lek poprawia wyniki w populacji, ale w przypadku stratyfikacji ciśnienia krwi po leczeniu wyniki są gorsze zarówno w grupach niskiego, jak i wysokiego ciśnienia krwi. Jak to może być prawda? Ponieważ mimowolnie rozwarstwiamy się na wyniku i w każdym wyniku pozostaje tylko toksyczny efekt uboczny.
Aby to wyjaśnić, wyobraź sobie, że lek jest przeznaczony do naprawy złamanych serc, i robi to poprzez obniżenie ciśnienia krwi, a zamiast stratyfikacji ciśnienia krwi rozwarstwiamy się na nieruchomych sercach. Kiedy lek działa, serce jest ustalone (a ciśnienie krwi będzie niższe), ale niektórzy pacjenci również dostaną toksyczny efekt uboczny. Ponieważ lek działa, grupa „utrwalonego serca” będzie miała więcej pacjentów, którzy wzięli lek, niż grupa pacjentów przyjmujących lek w grupie „złamanego serca”. Więcej pacjentów przyjmujących lek oznacza, że więcej pacjentów otrzymuje działania niepożądane i najwyraźniej (ale fałszywie) lepsze wyniki u pacjentów, którzy nie brali leku.
Pacjenci, którzy wracają do zdrowia bez przyjmowania leku, mają po prostu szczęście. Pacjenci, którzy wzięli lek i polepszyli się, to mieszanka tych, którzy potrzebowali go, aby polepszyć, i tych, którzy i tak mieliby szczęście. Badanie tylko pacjentów z „utrwalonymi sercami” oznacza wykluczanie pacjentów, którzy byliby naprawieni, gdyby zażyli lek. Wykluczenie takich pacjentów oznacza wykluczenie krzywdy z nieprzyjmowania leku, co z kolei oznacza, że widzimy szkodę tylko z powodu przyjmowania leku.
Paradoks Simpsona powstaje, gdy istnieje inny powód niż leczenie, na przykład fakt, że lekarz robi tylko trudne przypadki. Kontrolowanie wspólnej przyczyny (trudne i łatwe przypadki) pozwala nam zobaczyć prawdziwy efekt. W tym ostatnim przykładzie przypadkowo stratyfikowaliśmy wynik, a nie przyczynę, co oznacza, że prawdziwą odpowiedzią są dane zbiorcze, a nie stratyfikowane.
[^ 1]: Pearl J. Causal Wnioskowanie w statystyce. John Wiley & Sons; 2016 r
Jednym z moich „ulubionych”, co oznacza, że doprowadza mnie do szału interpretacja wielu badań (i często przez samych autorów, nie tylko media), to uprzedzenie przetrwania .
Można sobie wyobrazić, że istnieje pewien efekt, który jest bardzo szkodliwy dla badanych, tak bardzo, że ma bardzo duże szanse na ich zabicie. Jeśli osobnicy zostaną narażeni na ten efekt przed badaniem , to do czasu rozpoczęcia badania narażeni osobnicy, którzy wciąż żyją, mają bardzo duże prawdopodobieństwo, że będą niezwykle odporni. Dosłownie dobór naturalny w pracy. Gdy tak się dzieje, że badanie będzie obserwować eksponowane przedmioty są niezwykle zdrowe (ponieważ wszystkie te niezdrowe już zmarło lub zadbał, aby przestać być narażony na działanie) .To jest często błędnie interpretowane jako przyznanie, że ekspozycja jest faktycznie dobre dla badanych. Jest to wynikiem ignorowania obcięcia (tj. ignorowanie osób, które zmarły i nie dotarły do badania).
Podobnie, osoby, które przestają być narażone na działanie podczas badania, są często niezwykle niezdrowe: dzieje się tak, ponieważ zdają sobie sprawę, że ciągłe narażenie prawdopodobnie ich zabije. Ale w badaniu zauważono jedynie, że ci, którzy odeszli, są bardzo niezdrowi!
Odpowiedź @ Charliego na temat bombowców z II wojny światowej można traktować jako przykład tego, ale jest też wiele nowoczesnych przykładów. Niedawnym przykładem są badania, według których picie ponad 8 filiżanek kawy dziennie(!!) wiąże się ze znacznie wyższym zdrowiem serca u osób powyżej 55 roku życia. Wiele osób z doktoratem zinterpretowało to jako „picie kawy jest dobre dla twojego serca!”, W tym autorzy badania. Przeczytałem to, ponieważ musisz mieć niewiarygodnie zdrowe serce, aby nadal pić 8 filiżanek kawy dziennie po 55 roku życia i nie mieć zawału serca. Nawet jeśli cię to nie zabije, w momencie, gdy coś będzie niepokojące o twoje zdrowie, każdy, kto cię kocha (plus twój lekarz) natychmiast zachęci cię do zaprzestania picia kawy. Dalsze badania wykazały, że picie tak dużej ilości kawy nie miało korzystnego wpływu na młodsze grupy, co, jak sądzę, jest bardziej dowodem na to, że widzimy efekt przeżycia, niż pozytywny efekt przyczynowy. Mimo to wielu doktorów kręci się wokół i mówi „
Dziwię się, że nikt jeszcze nie wspominał o paradoksie Newcombe , chociaż jest on bardziej dyskutowany w teorii decyzji. To zdecydowanie jeden z moich ulubionych.
Niech x, y i z będą wektorami nieskorelowanymi. Jednak x / z oraz y / z będą skorelowane.