Koncepcja statystyczna wyjaśniająca, dlaczego rzadziej przewracasz tyle samo głów co ogony, gdy liczba przewrotów rośnie?


28

Pracuję nad nauką prawdopodobieństwa i statystyki, czytając kilka książek i pisząc kod, a podczas symulacji rzutu monetą zauważyłem coś, co uderzyło mnie nieco jako sprzeczne z naiwną intuicją. Jeśli rzucisz uczciwą monetę razy, stosunek główek do reszka zbiega się w kierunku 1, gdy wzrasta, dokładnie tak, jak można się spodziewać. Ale z drugiej strony, gdy wzrasta, wydaje się, że stajesz się mniej prawdopodobne, aby rzucić dokładnie taką samą liczbę głów jak ogony, uzyskując w ten sposób stosunek dokładnie 1.nnn

Na przykład (niektóre dane wyjściowe z mojego programu)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

Moje pytanie brzmi: czy istnieje koncepcja / zasada w statystyce / teorii prawdopodobieństwa, która to wyjaśnia? Jeśli tak, to jaka to zasada / koncepcja?

Link do kodu, jeśli ktoś jest zainteresowany tym, jak to wygenerowałem.

-- edytować --

Dla tego, co jest warte, oto, jak wcześniej sobie to tłumaczyłem. Jeśli uczciwą monetę razy i liczbę głów, generujesz w zasadzie liczbę losową. Podobnie, jeśli robisz to samo i liczysz ogony, generujesz także liczbę losową. Więc jeśli oba, tak naprawdę generujesz dwie liczby losowe, a gdy staje się większy, liczby losowe stają się większe. Im większe są generowane losowe liczby, tym większe są szanse, że się „zatęsknią”. Interesujące jest to, że dwie liczby są w pewnym sensie połączone, a ich stosunek zbliża się do jednej, gdy stają się większe, mimo że każda liczba jest losowa w oderwaniu. Może to tylko ja, ale uważam, że to miłe. nn


Czy szukasz intuicyjnych lub matematycznych wyjaśnień?
Glen_b

1
Oba naprawdę. Myślę, że jakby zrozumieć powód w intuicyjnym sensie, ale chciałbym zrozumieć formalne uzasadnienie niego.
mindcrime

1
Czy wiesz, jak obliczyć prawdopodobieństwa dwumianowe i zastosować je do tej sytuacji? Jeśli nie, sprawdź i oblicz obliczenia.
Mark L. Stone,

Wow, istnieje wiele dobrych odpowiedzi na to pytanie. Czuję się źle, że muszę zaakceptować jedno, a nie drugie. Powiem tylko, że doceniam wszystkie odpowiedzi i wszystkich, którzy poświęcili czas na podzielenie się swoimi spostrzeżeniami na ten temat.
mindcrime

Odpowiedzi:


31

Zauważ, że przypadek, w którym liczba głów i liczba ogonów są równe, jest taki sam jak „dokładnie połowa czasu, w którym dostajesz głowy”. Trzymajmy się więc liczenia liczby głów, aby sprawdzić, czy jest to połowa liczby rzutów, czy równoważne porównanie proporcji głów z 0,5.

Im więcej przerzucisz, tym większa liczba możliwych głowic, jakie możesz mieć - rozkład staje się bardziej rozłożony (np. Przedział liczby głowic zawierający 95% prawdopodobieństwa będzie się powiększał wraz ze wzrostem liczby rzutów) , więc prawdopodobieństwo, że dokładnie połowa głów spadnie, gdy będziemy rzucać więcej.

Odpowiednio, proporcja głowic przyjmie więcej możliwych wartości; patrz tutaj, gdzie przechodzimy od 100 rzutów do 200 rzutów:

wprowadź opis zdjęcia tutaj

Przy 100 rzutach możemy zaobserwować proporcję 0,49 głów lub 0,50 głów lub 0,51 głów (i tak dalej - ale nic pomiędzy tymi wartościami), ale przy 200 rzutach możemy zaobserwować 0,49 lub 0,495 lub 0,50 lub 0,505 lub 0,510 - prawdopodobieństwo ma więcej wartości do „pokrycia”, a więc każda będzie miała tendencję do uzyskania mniejszego udziału.

Zastanów się, czy masz rzuty z pewnym prawdopodobieństwem zdobycia główek (znamy te prawdopodobieństwa, ale nie jest to krytyczne dla tej części) i dodajesz jeszcze dwa rzuty. W rzutach najbardziej prawdopodobnym rezultatem jest głów ( i stamtąd spada).p i i 2 n n p n > p n ± 12npii2nnpn>pn±1

Jaka jest szansa, że główek na rzuty?2 n + 2n+12n+2

(Oznacz te prawdopodobieństwa , abyśmy nie pomylili ich z poprzednimi; niech również P (HH) będzie prawdopodobieństwem „Head, Head” w następnych dwóch rzutach i tak dalej)q

qn+1=pn1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

tzn. jeśli dodasz jeszcze dwa rzuty monetami, prawdopodobieństwo średniej wartości naturalnie spada, ponieważ uśrednia najbardziej prawdopodobną (środkową) wartość ze średnią mniejszych wartości po obu stronach)

Tak długo, jak czujesz się komfortowo, że szczyt będzie w środku (dla ), prawdopodobieństwo dokładnie połowy głów musi maleć wraz ze wzrostem .n2n=2,4,6,...n


W rzeczywistości możemy pokazać, że dla dużych , zmniejsza się proporcjonalnie z (co nie jest zaskoczeniem, ponieważ rozkład znormalizowanej liczby głów zbliża się do normalności, a wariancja proporcji głów zmniejsza się z ).p n 1npn n1nn


Zgodnie z życzeniem, oto kod R, który wytwarza coś zbliżonego do powyższego wykresu:

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)

1
Zgadzam się z powyższym @RustyStatistician odnośnie 1000 słów w twojej grafice. Dodatkowy kredyt na wskaźnik do kodu.
TomRoche,

Niesamowita figura i wyjaśnienie!

@Tom Dołączyłem kod, który robi wszystko oprócz koloru „200” w tytule zielonym.
Glen_b

1
@Glen_b Dziękujemy za kolejny świetny post i hojność udostępniania linii kodu. Piękna działka! Trudno się do tego przyznać, ale mam problemy z matematycznym wyrazem koncepcji w swoim poście, aw szczególności stosowanie wielkich liter . P
Antoni Parellada,

1
@Antoni oznacza po prostu „prawdopodobieństwo uzyskania„ Head, Head ”na dwóch dodatkowych rzutach”. Aby uzyskać n + 1 główek w 2n + 2 rzutach, do 2n rzutów musisz mieć albo n-1 głów (a następnie rzucił 2 głowy) lub n głów (a następnie rzucił 1 głowę) lub n + 1 główkę (a następnie rzucił 0 głów). P(HH)
Glen_b

19

Dobrze wiemy, że Prawo Dużych Liczb jest tym, co gwarantuje pierwsze zakończenie twojego eksperymentu, a mianowicie, że jeśli rzucisz uczciwą monetę razy, stosunek główek do reszek zbiegnie się w kierunku 1, gdy wzrasta. nnn

Więc nie ma problemów. Jednak to o całym prawie wielkich liczb mówi nam w tym scenariuszu.

Ale teraz pomyśl o tym problemie bardziej intuicyjnie. Pomyśl o rzucie monetą kilka razy, na przykład: .n=2,4,8,10

Kiedy rzucisz monetą dwa razy, tj. , pomyśl o możliwych scenariuszach dwóch rzutów. (Tutaj będzie oznaczać głowy, a będzie oznaczać ogony). Z drugiej pięści można zdobyć a na drugiej klapce można zdobyć . Ale to tylko jeden ze sposobów, w jaki mogły pojawić się dwa koziołki. Mógłbyś także dostać się na pierwszy rzut i drugi rzut oraz na wszystkie inne możliwe kombinacje. Na koniec dnia, gdy rzucisz 2 monety, możliwe kombinacje, które możesz zobaczyć na dwóch rzutach, to więc istnieją 4 możliwe scenariusze dla rzutu monetyH T H T T H S = { H H , H T , T H , T T } n = 2n=2HTHTTH

S={HH,HT,TH,TT}
n=2

Gdybyś 4 monetami, możliwą liczbą kombinacji, które można by zobaczyć, byłoby więc istnieje 16 możliwych scenariuszy przerzucania monet.n = 4

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}
n=4

Odrzucenie monet prowadzi do 256 kombinacji.n=8

Odrzucenie monet prowadzi do 1024 kombinacji.n=10

W szczególności przerzucenie dowolnej liczby monet prowadzi do możliwych kombinacji.2 nn2n

Teraz spróbujmy podejść do tego probabilistycznego punktu widzenia. Patrząc wstecz na przypadek, gdy , wiemy, że prawdopodobieństwo uzyskania dokładnie takiej samej liczby głów i ogonów (tj., Jak podajesz stosunek dokładnie 1), wynosi Gdy , wiemy, że prawdopodobieństwo uzyskania dokładnie takiej samej liczby głów i ogonów wynosi P r ( stosunek dokładnie 1 ) = 2n=2)n=4Pr(stosunek dokładnie 1)=6

P.r(Stosunek dokładnie 1)=2)4=0,5
n=4
P.r(Stosunek dokładnie 1)=616=0,375

Ogólnie rzecz biorąc, ponieważ ma tendencję do powiększania się, mamy prawdopodobieństwo, że prawdopodobieństwo uzyskania dokładnie takiej samej liczby głów i ogonów wynosi 0.n

Innymi słowy, jako , mamy ten n

P.r(Stosunek dokładnie 1)0

I tak, aby odpowiedzieć na twoje pytanie. Naprawdę to, co obserwujesz, jest tylko konsekwencją faktu, że będzie znacznie więcej kombinacji rzutów monetą, w których liczba głów i ogonów nie będzie równa w porównaniu z liczbą kombinacji, w których są one równe.



Jak sugeruje @Mark L. Stone, jeśli czujesz się swobodnie ze wzorem dwumianowym i dwumianowymi zmiennymi losowymi, możesz użyć tego, aby wyświetlić ten sam argument.

Niech będzie liczbą głów zarejestrowaną przy rzucie rzetelną monetą razy. możemy uznać za zmienną losową pochodzącą z rozkładu dwumianowego, tj. (tutaj przyjmujemy ponieważ mamy do czynienia z uczciwą monetą), a następnie prawdopodobieństwo uzyskania dokładnie taka sama liczba głów jak liczba ogonów (tj. stosunek dokładnie 1) wynosiXnXXbjan(n,p=0,5)p=0,5

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)nn/2=(nn/2)0.5n

Teraz ponownie, gdy ma tendencję do powiększania się, powyższe wyrażenie zmierza w kierunku 0, ponieważ jako .n(nn/2)0.5n0n


2
Musisz powiedzieć nieco więcej niż jako ... musisz także powiedzieć coś o . (Dla porównania: tylko dlatego, że , nie oznacza ). 0.5n0n(nn/2)0.5n0n!0.5n0
Silverfish,

@Glen_b Nie mam wystarczającej liczby punktów, aby skomentować Twój post, ale świetna grafika!

Dzięki @RustyStatistician, to bardzo pomaga. Pierwsza część twojego wyjaśnienia w zasadzie pasuje do tego, o czym myślałem, ale nie jestem jeszcze wystarczająco daleko wraz z moimi statystykami, aby wiedzieć, jak to rozwiązać za pomocą rozkładu dwumianowego. Zasadniczo przeczytałem swoją książkę raz, nie rozwiązując problemów ani nic, a teraz wracam od początku i piszę kod, aby eksplorować różne aspekty materiału.
Mindcrime

@mindcrime brzmi świetnie! Cieszę się, że mogłem pomóc.

5

Zobacz trójkąt Pascala .

Prawdopodobieństwo wyników rzutu monetą jest reprezentowane przez liczby wzdłuż dolnego rzędu. Wynik równych głów i ogonów to środkowa liczba. Gdy drzewo rośnie (tj. Więcej przewrotów), środkowa liczba staje się mniejszą częścią sumy dolnego rzędu.


1

Może pomaga to wyjaśnić, że jest to związane z prawem łuczniczym. Mówi, że dla jednej ścieżki wyników prawdopodobieństwo, że ścieżka pozostanie przez większość czasu w domenie dodatniej lub ujemnej, jest znacznie wyższe niż że idzie w górę i w dół, niż można się spodziewać po intuicji . Oto kilka linków:

http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml

https://en.wikipedia.org/wiki/Arcsine_law


1

Podczas gdy stosunek głów do ogonów jest zbieżny do 1, zakres możliwych liczb staje się szerszy. (Tworzę liczby). Powiedzmy, że na 100 rzutów prawdopodobieństwo wynosi 90%, że masz od 45% do 55% głów. To 90%, że masz od 45 do 55 głów. 11 możliwości dla liczby głowic. Około 9% mniej więcej tyle samo głów i ogonów.

Powiedzmy, że na 10 000 rzutów prawdopodobieństwo wynosi 95%, że dostaniesz od 49% do 51% głów. Więc stosunek ten zbliżył się znacznie do 1. Ale teraz masz od 4,900 do 5 100 główek. 201 możliwości. Szansa na równe liczby wynosi tylko około 0,5%.

A dzięki milionowi rzutów masz pewność, że masz od 49,9% do 50,1% głów. Jest to zakres od 499,000 do 501 000 sztuk. 2100 możliwości. Szansa jest teraz ograniczona do 0,05%.

Ok, matematyka została wymyślona. Ale to powinno dać ci wyobrażenie o tym „dlaczego”. Chociaż stosunek zbliża się do 1, liczba możliwości staje się większa, tak więc trafienie dokładnie w połowie głowy, w połowie ogona staje się coraz mniej prawdopodobne.

Kolejny praktyczny efekt: w praktyce jest mało prawdopodobne, abyś miał monetę, w której prawdopodobieństwo rzucenia głowami wynosi dokładnie 50%. Może to być 49,99371%, jeśli masz naprawdę dobrą monetę. W przypadku małej liczby rzutów nie ma to znaczenia. W przypadku dużych liczb odsetek głów zbiega się do 49,99371%, a nie 50%. Jeśli liczba rzutów jest wystarczająco duża, rzucanie 50% lub więcej głów stanie się bardzo, bardzo mało prawdopodobne.


0

Cóż, należy zauważyć, że przy parzystej liczbie przewrotów (w przeciwnym razie prawdopodobieństwo równych przewrotów głowami i ogonami wynosi oczywiście dokładnie zero), najbardziej prawdopodobnym rezultatem zawsze będzie ta, która ma tyle tylu przewrotów głowami, co przewrotów ogonów.

Rozkład rzutów jest podawany przez współczynniki wielomianu Zatem dla parzystego prawdopodobieństwo wynosi n

(1+x2))n.
n
pn=2)-n(nn/2)).

Używanie aproksymacji Stirlinga dla, dochodzisz do czegoś takiego jak dla prawdopodobieństwa dokładnie przewrotek (i odpowiednio ogonów) dla ogólnych rzutów. Tak więc absolutne prawdopodobieństwo tego wyniku jest zbieżne z 0, ale znacznie wolniejsze niż większość innych wyników, przy ekstremalnych przypadkach 0 przewrotek (lub alternatywnie 0 ogonów) wynosi .n!

p1πn/2)
n/2)n2)-n

2
Twoja odpowiedź może zostać poprawiona poprzez dokładne określenie ilości w wyrażeniach. Co to jest ? Co to jest ? np
Sycorax mówi Przywróć Monikę

0

Załóżmy, że rzucisz monetą dwa razy. Istnieją cztery możliwe wyniki: HH, HT, TH i TT. W dwóch z nich masz taką samą liczbę głów i ogonów, więc istnieje 50% szans, że otrzymasz taką samą liczbę głów i ogonów.

Załóżmy teraz, że rzuciłeś monetą 4 306 492 102 razy. Czy spodziewasz się 50 procent szans, że skończysz z dokładnie 2 153 246 051 głowami i 2 153 246 051 ogonami?


Nie, moja intuicja powiedziała mi, że szanse na dokładne dopasowanie są niskie, tylko dlatego, że liczby są coraz większe. Ale chciałem to zasymulować, żeby potwierdzić moją myśl. Kiedy zobaczyłem, że tak się stało, byłem zaintrygowany formalnym uzasadnieniem, dlaczego tak jest. Interesujące wydaje mi się to, że wynikowy stosunek zbliża się do 1, a jednocześnie staje się mniej prawdopodobne, że będzie dokładnie 1.
mindcrime

3
Jednym ze sposobów myślenia na ten temat jest to, że dla dużych istnieje znacznie więcej sposobów na zbliżenie się do 50-50 niż dla małych . nn
Daniel McLaury,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.