Zadano mi to pytanie z w wywiadzie. Czy istnieje „poprawna” odpowiedź?
Załóżmy, że rzuty są identyczne, a prawdopodobieństwo głów wynosi . Rozkład liczby głów w 400 rzutach powinien następnie być zbliżony do normalnego (200, 10 ^ 2), tak aby 220 głów było o 2 standardowe odchylenia od średniej. Prawdopodobieństwo zaobserwowania takiego wyniku (tj. Więcej 2 SD od średniej w obu kierunkach) wynosi nieco mniej niż 5%.
Ankieter powiedział mi zasadniczo: „jeśli zaobserwuję coś> = 2 SD od średniej, dochodzę do wniosku, że dzieje się coś innego. Obstawiłbym, że moneta jest uczciwa”. To rozsądne - w końcu to właśnie robi większość testów hipotez. Ale czy to koniec historii? Dla ankietera była to „poprawna” odpowiedź. Pytam tutaj, czy jakiś niuans jest uzasadniony.
Nie mogłem nie wspomnieć, że stwierdzenie, że moneta jest niesprawiedliwa, jest dziwnym wnioskiem w tym kontekście rzucania monetą. Czy mam rację, że tak mówię? Spróbuję wyjaśnić poniżej.
Przede wszystkim ja - i przypuszczam, że większość ludzi - mam mocne zdanie o monetach: najprawdopodobniej będą uczciwe. Oczywiście zależy to od tego, co rozumiemy przez „sprawiedliwy” - jedną z możliwości byłoby zdefiniowanie „sprawiedliwego” jako „o prawdopodobieństwie„ zbliżenia ”głów do 0,5, powiedzmy między 0,49 a 0,51”.
(Można również zdefiniować „fair” w ten sposób, że prawdopodobieństwo głowy jest dokładnie 0,50, w którym to przypadku konieczności doskonale sprawiedliwy moneta wydaje się raczej un prawdopodobne).
Twój przeor może zależeć nie tylko od twoich ogólnych przekonań na temat monet, ale także od kontekstu. Jeśli wyciągniesz monetę z własnej kieszeni, możesz być praktycznie pewien, że jest sprawiedliwa; jeśli twój przyjaciel magik wyciągnie go ze swojego, twój przeor może przyłożyć większą wagę do monet dwugłowych.
W każdym razie łatwo jest wymyślić rozsądne priory, które (i) stawiają duże prawdopodobieństwo uczciwości monety i (ii) prowadzą twój tyłek do całkiem podobnego, nawet po zaobserwowaniu 220 głów. Doszedłbyś do wniosku, że moneta najprawdopodobniej była sprawiedliwa, pomimo zaobserwowania wyniku 2 SD od średniej.
W rzeczywistości możesz również skonstruować przykłady, w których obserwowanie 220 głów w 400 rzutach sprawia, że twój tylny kładzie większy nacisk na uczciwość monety, na przykład jeśli wszystkie nieuczciwe monety mają prawdopodobieństwo głów w .
Czy ktoś może rzucić na to trochę światła?
Po napisaniu tego pytania przypomniałem sobie, że słyszałem wcześniej o tej ogólnej sytuacji - czy to nie „paradoks” Lindleya ?
Whuber umieścił w komentarzach bardzo interesujący link: możesz załadować kostkę , ale nie możesz nastawiać monety . Od strony 3:
Nie ma sensu stwierdzać, że moneta ma prawdopodobieństwo p głów, ponieważ można ją całkowicie określić na podstawie sposobu, w jaki jest rzucana - chyba że zostanie rzucona wysoko w powietrze z szybkim wirowaniem i złapana w powietrze za pomocą bez podskakiwania, w którym to przypadku p = 1/2.
Całkiem fajne! To wiąże się z moim pytaniem w ciekawy sposób: załóżmy, że wiemy, że moneta „jest rzucana wysoko w powietrze z gwałtownym obrotem i chwytana w powietrze bez podskakiwania”. Zatem zdecydowanie nie powinniśmy odrzucać hipotezy, że moneta jest uczciwa (gdzie „sprawiedliwy” oznacza teraz „posiadanie p = 1/2 przy rzuceniu w sposób opisany powyżej”), ponieważ faktycznie dysponujemy pierwszeństwem, które stawia wszelkie prawdopodobieństwo na monety są uczciwe. Może to w pewnym stopniu uzasadnia, dlaczego nie czuję się dobrze odrzucając zero po zaobserwowaniu 220 głów.