Jak nazywa się błąd statystyczny, w którym wyniki poprzednich rzutów monetą wpływają na przekonania o kolejnych rzutach monetą?

28

Jak wszyscy wiemy, jeśli rzucisz monetą, która ma równe szanse na wylądowanie głów, podobnie jak reszka, to jeśli rzucisz monetą wiele razy, w połowie przypadków dostaniesz głowy, a w połowie reszka.

Dyskutując o tym z przyjacielem, powiedzieli, że jeśli rzucisz monetą 1000 razy, i powiedzmy, że pierwsze 100 razy wylądował głów, wtedy szanse na wylądowanie ogona wzrosły (logika jest taka, że jeśli jest bezstronny, zanim przerzucisz go 1000 razy, będziesz miał około 500 głów i 500 ogonów, więc ogony muszą być bardziej prawdopodobne).

Wiem, że to błąd, ponieważ wcześniejsze wyniki nie mają wpływu na przyszłe wyniki. Czy istnieje nazwa tego konkretnego błędu? Czy jest też lepsze wyjaśnienie, dlaczego jest to błędne?

probability distributions sampling

— oggmonster
źródło

8

Jeśli rzucisz monetą 100 razy, a ona wyląduje 100 razy na głowie, istnieje prawdopodobieństwo, że nie jest to moneta bezstronna.

— Robert

1

@Robert Jak to zrobić? Ponieważ każde przerzucenie jest niezależne od siebie, szansa, że będzie to H 100x, jest taka sama, jakby to była niedopasowana sekwencja H & T lub 100x T

— yuritsuki

11

@ thinlyveiledquestionmark Chciałbym z tobą zagrać w pokera ... ale tylko jeśli pozwolę sobie na rozdanie. Myślę, że Robert oznacza, że realizacja 100 H w 100 próbach zmieni jego przekonanie z monety uczciwej na monetę niesprawiedliwą. Biorąc pod uwagę te dane 100 H w 100 próbach, musiałbyś być bardzo silny przed aby nie przesunąć znacznie tylnej części ciała.

Pr (H)

$\Pr(H)$

— Sycorax mówi Przywróć Monikę

5

@ thinlyveiledquestionmark Musisz być ostrożny. Biorąc pod uwagę niezależne przerzucanie, każda sekwencja 100 lub H przerzucenia jest równie prawdopodobna: 100H jest tak samo prawdopodobne, jak 50H 50T, jest równie prawdopodobne jak HTHTHTHT ... HT i tak dalej. Ale znacznie mniej prawdopodobne jest, że zdobędziesz 100H niż w sumie 50 głów, ponieważ istnieje

10^{29}

$10^{29}$ różnych sposobów, aby uzyskać 50 rzutów i 50 rzutów.

— Lagerbaer,

3

Pomysł Roberta jest całkowicie uzasadniony i może być przede wszystkim źródłem „błędu”. Nasze mózgi są połączone w bayesowskim, nieczęstym sensie. „Doskonała” informacja, taka jak „absolutnie uczciwa moneta” rzadko istnieje w naturze. Zatem 100 głów na 100 prób praktycznie doprowadzi nas do przekonania, że

P (H e a d s) > 0.5

$P(Heads) > 0.5$

— PA6OTA

41

Nazywa się to błędem Hazardzisty .

— abaumann
źródło

32

Pierwsze zdanie tego pytania zawiera inny (powiązany) błąd:

„Jak wszyscy wiemy, jeśli rzucisz monetą, która ma równe szanse na wylądowanie głów, tak jak reszka, to jeśli rzucisz monetą wiele razy, połowa czasu zdobędziesz głowy, a połowa raza reszki .”

Nie, nie dostaniemy tego, nie dostaniemy głów w połowie czasu i ogonów w połowie. Gdybyśmy to dostali, to Hazardzista wcale nie byłby tak bardzo w błędzie . Wyrażenie matematyczne dla tego wyrażenia słownego jest następujące: Dla niektórych „dużych” (ale skończonych) mamy , gdzie ewidentnie oznacza liczbę razy moneta ląduje w głowach. Ponieważ jest skończone, to jest również skończone i różni się od . Co dzieje się po wykonaniu przerzucenia ? Albo wylądował, albo nie. W obu przypadkach $n'$ $n_{h} = \frac {n'}{2}$ $n_{h}$ $n'$ $n'+1$ $n'$ $n'+1$ $n_h$ właśnie przestał być równy „połowie liczby rzutów”.

Ale może tak naprawdę chodziło nam o „niewyobrażalnie duży” ? Następnie stwierdzamy $n$

lim_{n \to \infty} n_{h} = \frac{n}{2}

$\lim_{n\rightarrow \infty}n_{h} = \frac n{2}$

Ale tutaj RHS („prawa strona”) zawiera które przez LHS („lewa strona”) przeszły w nieskończoność. Tak więc RHS jest również nieskończonością, a więc to stwierdzenie mówi, że liczba przypadków, w których moneta wyląduje, jest równa nieskończoności, jeśli podrzucimy monetę nieskończoną liczbę razy (podział przez jest pomijalny): $n$ $2$

lim_{n \to \infty} n_{h} = \frac{n}{2} = \infty

$\lim_{n\rightarrow \infty}n_{h} = \frac n{2} = \infty$

Jest to zasadniczo poprawne, ale bezużyteczne stwierdzenie i oczywiście nie to, co mamy na myśli.

Podsumowując, stwierdzenie w pytaniu nie ma zastosowania, niezależnie od tego, czy „całkowite podrzucenia” są uważane za skończone, czy nie.

Może więc powinniśmy powiedzieć

lim_{n \to \infty} \frac{n_{h}}{n} = \frac{1}{2} ?

$\lim_{n\rightarrow \infty}\frac {n_{h}}{n} = \frac 1{2} \;\;?$

Po pierwsze, przekłada się to na „Stosunek liczby wylądowanych głów do całkowitej liczby rzutów dąży do wartości gdy liczba rzutów dąży do nieskończoności”, co jest odmiennym stwierdzeniem - brak „połowy wszystkich rzutów” tutaj. Również w ten sposób czasami postrzegane jest prawdopodobieństwo - jako deterministyczna granica częstotliwości względnych. Problem z tym stwierdzeniem polega na tym, że zawiera on w LHS nieokreśloną formę: zarówno licznik, jak i mianownik idą w nieskończoność. $1/2$

Hmmm, weźmy losowy arsenał zmiennej . Zdefiniuj losową zmienną jako przyjmującą wartość jeśli podrzucenie pojawiło się w głowach, jeśli pojawiła się reszka. Mamy więc $X_i$ $1$ $i$ $0$

\frac{n_{h}}{n} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}

$\frac {n_{h}}{n} = \frac 1n \sum_{i=1}^nX_i$

Czy możemy teraz przynajmniej stwierdzić

lim_{n \to \infty} \frac{1}{n} \sum_{i = 1}^{n} X_{i} = \frac{1}{2} ?

$\lim_{n\rightarrow \infty}\frac 1n \sum_{i=1}^nX_i = \frac 1{2} \;\;?$

Nie . To jest deterministyczny limit. Pozwala na wszystkie możliwe realizacje sekwencji , a więc nawet nie gwarantuje, że limit będzie istniał, a tym bardziej, że będzie równy . W rzeczywistości takie stwierdzenie może być postrzegane jedynie jako ograniczenie sekwencji i zniszczyłoby to niezależność rzutów. $X$ $1/2$

Co nas może powiedzieć, że średnia ta zbiega suma prawdopodobieństwa ( „słabo”) do (Bernoulliego -Weak prawo wielkich liczb) $1/2$

lim_{n \to \infty} Pr (| \frac{1}{n} \sum_{i = 1}^{n} X_{i} - \frac{1}{2} | < ε) = 1, \forall ε > 0

$\lim_{n\rightarrow \infty}\text {Pr}\left(\left|\frac 1n \sum_{i=1}^nX_i-\frac 12 \right|<\varepsilon\right) =1 , \;\;\;\forall \varepsilon >0$

a w omawianym przypadku, że zbiega się on prawie na pewno („mocno”) (prawo dużych liczb Borela - mocne liczby)

Pr (lim_{n \to \infty} \frac{1}{n} \sum_{i = 1}^{n} X_{i} = \frac{1}{2}) = 1,

$\text {Pr}\left(\lim_{n\rightarrow \infty}\frac 1n \sum_{i=1}^nX_i=\frac 12 \right) =1 , \;\;\;$

Są to jednak twierdzenia probabilistyczne o prawdopodobieństwie związanym z różnicą między a , a nie o granicy różnicy (która zgodnie z fałszywym stwierdzeniem powinna wynosić zero - i nie jest). $n_h/n$ $1/2$ $n_h-n_t$

Trzeba jednak poświęcić trochę wysiłku intelektualnego, aby naprawdę zrozumieć te dwa stwierdzenia oraz to, jak różnią się one (w „teorii” i „praktyce”) od niektórych poprzednich - nie twierdzę jeszcze tak głębokiego zrozumienia dla siebie.

— Alecos Papadopoulos
źródło

1

Być może jedna z najlepszych, edukacyjnych odpowiedzi, które czytałem od dłuższego czasu. Dobra robota.

— Pete Mancini,

@AlecosPapadopoulos Myślę, że pomogłoby to udzielić odpowiedzi na pytanie, które możemy powiedzieć, w formule takiej jak ty przy fałszywych sformułowaniach. Myślę, że to coś w rodzaju \ lim P (\ frac {1} {n} \ sum X_i) = 1?

— kutschkem

@kutschkem Doskonała sugestia. Właśnie tak zrobiłem.

— Alecos Papadopoulos

12

Ten błąd ma wiele imion.

1) Prawdopodobnie najbardziej znany jest jako błąd Hazardzisty

2) czasami nazywany jest również „ prawem małych liczb ” (patrz także tutaj ) (ponieważ odnosi się do idei, że cechy populacji muszą być odzwierciedlone w małych próbkach) - co, moim zdaniem, jest fajną nazwą ze względu na kontrast z prawem dużych liczb, ale niestety ta sama nazwa jest stosowana do rozkładu Poissona (i czasami używana przez matematyków do oznaczania czegoś innego), więc może to być mylące.

3) wśród ludzi, którzy uważają, że błąd jest czasami nazywany „ prawem średnich ”, które w szczególności zwykle wywołuje się po biegu bez rezultatu, aby argumentować, że wynik jest „należny”, ale oczywiście nie ma takiego krótkiego terminu prawo istnieje - nic nie działa w celu „zrekompensowania” początkowej nierównowagi - jedynym sposobem na usunięcie pierwotnej rozbieżności jest objętość późniejszych wartości, które same mają średnio 1/2 .

Rozważ eksperyment, w którym rzetelna moneta jest wielokrotnie rzucana; niech będzie liczbą głów, a liczbą ogonów zaobserwowanych do końca tej próby. Zauważ, że $H_i$ $T_i$ $i$ $i=H_i+T_i$

Warto zauważyć, że na dłuższą metę (tj. ), podczas gdy prawdopodobnie zbiega się w ,rośnie wraz ze wzrostem - rzeczywiście rośnie bez ograniczeń; nic nie „popycha go z powrotem do 0”. $n\to\infty$ $\frac{H_n}{n}$ $\frac{_1}{^2}$ $E|H_n-T_n|$ $n$

— Glen_b - Przywróć Monikę
źródło

1

Czy myślisz o „stochastyce”? Trzepnięcie uczciwej monety (lub rzutu rzetelną kością) jest stochastyczne (tj. Niezależne) w tym sensie, że nie zależy od poprzedniego rzutu taką monetą. Przy założeniu uczciwego oszustwa fakt, że moneta została przewrócona sto razy w wyniku uzyskania stu głów, nie zmienia faktu, że następne przewrócenie ma szanse 50/50 na bycie główkami.

Natomiast prawdopodobieństwo wyciągnięcia określonej karty wyciągającej kartę z talii kart bez zamiany nie jest stochastyczne, ponieważ prawdopodobieństwo wyciągnięcia określonej karty zmieni prawdopodobieństwo wyciągnięcia karty przy następnym losowaniu (jeśli była to zamiana, byłoby stochastyczne).

— użytkownik63551
źródło

stochastyczny nie oznacza niezależnego

— Ben Voigt

1

„Zakładając uczciwe oszustwo ... kolejna klapka ma szansę 50/50 bycia główkami” , myślę, że masz tutaj głęboką filozoficzną prawdę. Możesz rozszerzyć odpowiedź, aby wyjaśnić, co się stanie, jeśli będzie to nieuczciwe (AKA regularne?) Oszustwo.

— hyde

0

Dodając do odpowiedzi Glen_b i Alecos, zdefiniujmy jako liczbę głów w pierwszych próbach. Znanym wynikiem używającym normalnego przybliżenia do dwumianu jest to, że wynosi w przybliżeniu . Teraz, przed obserwowaniem pierwszych 100 rzutów, twój przyjaciel ma rację, że istnieje duża szansa, że będzie bliski 500. W rzeczywistości, $X_n$ $n$ $X_n$ $N(n/2, \sqrt{n/4})$ $X_{1000}$

$P( 469 < X_{1000} < 531) \approx .95$ . .

Jednak po zaobserwowaniu , zdefiniujmy jako liczbę głów w ostatnich 900 próbach, a następnie $X_{100} =100$ $Y_{900}$

$P( 469 < X_{1000} < 531 \mid X_{100}=100) = P( 369 < Y_{900} < 431) \approx .1$

od około . $Y_{900}$ $N(450, 15)$

Zatem po zaobserwowaniu 100 głów w pierwszych 100 próbach nie ma już dużego prawdopodobieństwa zaobserwowania prawie 500 sukcesów w pierwszych 1000 próbach, zakładając oczywiście, że moneta jest uczciwa. Należy zauważyć, że jest to konkretny przykład ilustrujący, że początkowe zaburzenie równowagi prawdopodobnie nie zostanie zrekompensowane w krótkim okresie.

Ponadto zauważ, że jeśli , to $n=1,000,000$

$P(499,020 < X_{1,000,000} < 500,980) \approx .95$

ale wpływ nierównowagi w pierwszych 100 rzutach jest odtąd znikomy

$P(499,020 < X_{1,000,000} < 500,980 \mid X_{100} = 100) = P( 498,920 < Y_{999,900} < 500880) \approx .949$

— jsk
źródło

0

Odwołujesz się do błędu Hazardzisty , choć nie jest to całkowicie poprawne.

Rzeczywiście, jeśli sformułowane jako „biorąc pod uwagę założoną uczciwą monetę i obserwujemy określoną sekwencję wyników, jakie jest oszacowanie elementarnych prawdopodobieństw monety”, staje się to bardziej widoczne.

Rzeczywiście „ błąd ” dotyczy jedynie (zakładanych) uczciwych monet, w których różne produkty probów są równe. Wymaga to jednak interpretacji, która jest sprzeczna z (badaniem) podobnych przypadków z monetą mającą inny (niesymetryczny / tendencyjny) rozkład prawdopodobieństwa.

Aby dowiedzieć się więcej na ten temat (i nieco więcej), zobacz to pytanie .

Jest to dokładnie takie samo, jak błąd stosowany w wielu badaniach statystycznych, w których korelacja implikuje przyczynowość . Ale może to być wskazówka związku przyczynowego lub wspólnej przyczyny.

— Nikos M.
źródło

0

Należy tylko zauważyć, że jeśli dostaniesz ogromną liczbę głów lub reszek z rzędu, lepiej powrócić do wcześniejszego założenia, że moneta była uczciwa.

— Avraham
źródło