Oczekiwana wartość robaka i jabłka


8

Jabłko znajduje się na wierzchołku z pięciokąta , a robak znajduje się dwa wierzchołki z dala, na . Każdego dnia robak czołga się z jednakowym prawdopodobieństwem do jednego z dwóch sąsiadujących wierzchołków. Tak więc po jednym dniu robak znajduje się w wierzchołku lub , każdy z prawdopodobieństwem . Po dwóch dniach robak może wrócić do , ponieważ nie pamięta poprzednich pozycji. Kiedy osiągnie wierzchołek , przestaje jeść.ZAZAbdoremidobre1/2)doZA

(a) Jaka jest średnia liczba dni do kolacji?

(b) Niech p będzie prawdopodobieństwem, że liczba dni wynosi lub więcej. Co mówi nierówność Markowa o ?100p

Dla (a) niech będzie zmienną losową zdefiniowaną przez liczbę dni do obiadu. Więc P (X = 0) = 0 \\ P (X = 1) = 0 \\ P (X = 2) = \ frac {1} {\ binom {5} {2}} \\ \ vdotsX

P.(X=0)=0P.(X=1)=0P.(X=2))=1(52))

Jaka byłaby ogólna dystrybucja?

Dla (b), jeśli wiemy (a), to wiemy, że

P.(X100)mi(X)100

2
Czy mógłbyś wyjaśnić swój pierwszy zestaw równań? Wydaje się, że nie uwzględniają one możliwości zmiany kierunku robaka ani nie wydają się prawidłowe. W końcu jest znacznie mniejsze niż szansa ścieżki która ma prawdopodobieństwo Zauważ, że sedno tego pytania jest takie, że uzyskanie pełnego rozkładu może być trudniejsze niż obliczenie jego oczekiwań; a Nierówność Markowa pozwala jednak wydedukować użyteczne informacje z samego oczekiwania. 1/(52))=1/10ZAbdo(1/2))(1/2))=1/4
whuber

Odpowiedzi:


6

W doskonałej odpowiedzi Glen_b pokazuje, że można obliczyć wartość oczekiwaną analitycznie za pomocą prostego układu równań liniowych. Stosując tę ​​metodę analityczną można ustalić, że oczekiwana liczba ruchów do jabłka wynosi sześć. Inna doskonała odpowiedź Whubera pokazuje, jak uzyskać funkcję masy prawdopodobieństwa dla procesu po dowolnej liczbie ruchów, a tę metodę można również zastosować do uzyskania rozwiązania analitycznego dla oczekiwanej wartości. Jeśli chcesz dowiedzieć się więcej o tym problemie, powinieneś przeczytać kilka artykułów na temat przypadkowych spacerów po okręgu (patrz np. Stephens 1963 )

Aby dać alternatywne spojrzenie na problem, pokażę ci, jak możesz uzyskać ten sam wynik za pomocą metody brutalnej siły, po prostu obliczając łańcuch Markowa za pomocą obliczeń statystycznych. Ta metoda jest gorsza od analizy analitycznej pod wieloma względami, ale ma tę zaletę, że pozwala poradzić sobie z problemem bez konieczności posiadania większego wglądu matematycznego.


Metoda obliczeniowa siły brutalnej: przyjmowanie stanów w kolejności , przejścia łańcucha Markowa zgodnie z następującą macierzą przejścia:A,B,C,D,E

P=[100001201200012012000120121200120]

Pierwszym stanem jest stan wchłaniania którym robak znajduje się przy jabłku. Niech być liczba ruchów aż robak dostaje jabłko ze stanu . Zatem dla wszystkich prawdopodobieństwo, że robak znajdzie się na jabłku po tej liczbie ruchów, to więc oczekiwana liczba ruchów, aby dostać się do jabłka z tego stanu to:ZAT.dodonN.P.(T.don)={P.n}do,ZA

mi(T.do)=n=0P.(T.do>n)=n=0(1-{P.n}do,ZA).

Pojęcia sumy zmniejszają się wykładniczo dla dużej liczby dzięki czemu możemy obliczyć oczekiwaną wartość do dowolnego pożądanego poziomu dokładności poprzez obcięcie sumy o skończonej liczbie wyrazów. (Gwałtowny rozkład terminów gwarantuje, że możemy ograniczyć rozmiar usuniętych terminów do poziomu poniżej pożądanego poziomu.) W praktyce łatwo jest wziąć dużą liczbę terminów, dopóki rozmiar pozostałych terminów nie będzie wyjątkowo mały.n


Programowanie w R: Możesz zaprogramować to jako funkcję przy Rużyciu poniższego kodu. Ten kod został zektoryzowany w celu wygenerowania szeregu mocy macierzy przejściowej dla skończonej sekwencji ruchów. Generujemy również wykres prawdopodobieństwa, że ​​jabłko nie zostało osiągnięte, pokazując, że zmniejsza się on wykładniczo.

#Create function to give n-step transition matrix for n = 1,...,N
#N is the last value of n
PROB <- function(N) { P <- matrix(c(1, 0, 0, 0, 0, 
                                    1/2, 0, 1/2, 0, 0, 
                                    0, 1/2, 0, 1/2, 0,
                                    0, 0, 1/2, 0, 1/2,
                                    1/2, 0, 0, 1/2, 0),
                                  nrow = 5, ncol = 5, 
                                  byrow = TRUE);
                      PPP <- array(0, dim = c(5,5,N));
                      PPP[,,1] <- P;
                      for (n in 2:N) { PPP[,,n] <- PPP[,,n-1] %*% P; } 
                      PPP }

#Calculate probabilities of reaching apple for n = 1,...,100
N  <- 100;
DF <- data.frame(Probability = PROB(N)[3,1,], Moves = 1:N);

#Plot probability of not having reached apple
library(ggplot2);
FIGURE <- ggplot(DF, aes(x = Moves, y = 1-Probability)) +
          geom_point() +
          scale_y_log10(breaks = scales::trans_breaks("log10", function(x) 10^x),
                        labels = scales::trans_format("log10", 
                                 scales::math_format(10^.x))) +
          ggtitle('Probability that worm has not reached apple') +
          xlab('Number of Moves') + ylab('Probability');
FIGURE;

#Calculate expected number of moves to get to apple
#Calculation truncates the infinite sum at N = 100
#We add one to represent the term for n = 0
EXP <- 1 + sum(1-DF$Probability);
EXP;

[1] 6

Jak widać z tego obliczenia, spodziewana liczba ruchów, aby dostać się do jabłka, wynosi sześć. Obliczenia były niezwykle szybkie przy użyciu powyższego wektoryzowanego kodu dla łańcucha Markowa.

wprowadź opis zdjęcia tutaj


5

Wystarczy zilustrować prosty sposób patrzenia na część (a) bez przechodzenia przez całą procedurę łańcucha Markowa. Istnieją dwie klasy stanów, o które należy się martwić: bycie o krok i bycie o dwa kroki (C i D są identyczne pod względem oczekiwanych kroków, aż do osiągnięcia A, a B i E są identyczne). Niech „ ” reprezentuje liczbę kroków, jakie wykonuje od wierzchołka i tak dalej.S.bb

mi(S.do)=1+12)[mi(S.b)+mi(S.re)]=1+12)[mi(S.b)+mi(S.do)]

Podobnie napisz równanie dla oczekiwania na .mi(S.b)

drugi na pierwszy (i dla wygody wpisz dla ), a otrzymasz rozwiązanie dla kilku wierszach.domi(S.do)do


3
+1. Podoba mi się to, zastępując oczekiwania funkcjami generującymi prawdopodobieństwo, otrzymujesz podobne równanie, równie łatwo rozwiązane, pokazujące, że pgf dla stanu początkowego wynosi i to prowadzi do prostej formuły dla dowolnego prawdopodobieństwa. Lepiej: niech będzie liczbą kroków rozpoczynających się odZdefiniuj iRelacje to iPodstawienie tego drugiego do pierwszego daje dla Zatem jestt2/(42tt2),Xyy{A,B}.fn=2nPr(XA=n)gn=2nPr(XB=n).fn=fn1+gn1gn1=fn2.fn=fn1+fn2n3.fnn2ndLiczba Fibonacciego.
whuber

@whuber: Powinieneś zamienić swój komentarz w pełną odpowiedź - jest naprawdę dobra.
Ben - Przywróć Monikę

1
Zgadzam się, warto pisać jako odpowiedź, nawet w tej krótkiej formie.
Glen_b

3

Problem

Ten łańcuch Markowa ma trzy stany, w zależności od tego, czy robak znajduje się w odległości czy spacji od Niech będzie zmienną losową, podając ile kroków robak podejmie, aby osiągnąć ze stanu Ich funkcje generujące prawdopodobieństwo są wygodnym sposobem algebraicznym do kodowania prawdopodobieństw tych zmiennych. Nie trzeba się martwić o problemy analityczne, takie jak zbieżność: wystarczy spojrzeć na nie jako na formalne serie potęg w symbolu podanym przez0, 1,2)do.Xjadoja{0,1,2)}.t

faja(t)=Par(Xja=0)+Par(Xja=1)t1+Par(Xja=2))t2)++Par(Xja=n)tn+

Ponieważ trywialne jest, że Musimy znaleźćPar(X0=0)=1,fa0(t)=1.fa2).

Analiza i rozwiązanie

Od stanu ślimak ma równe prawdopodobieństwo poruszających się z powrotem do stanu lub osiągnięcia . Uwzględnienie tego kroku dodaje do wszystkich potęg , równoznacznych z pomnożeniem pgf przez , dając1,1/2)2)do1tt

fa1=12)t(fa2)+fa0).

Podobnie, od stanu robak ma równe szanse pozostania w stanie lub osiągnięcia stanu skąd2)2)1,

fa2)=12)t(fa2)+fa1).

Pojawienie się sugeruje, że nasza praca zostanie ułatwiona poprzez wprowadzenie zmiennej dająct/2)x=t/2),

fa1(x)=x(fa2)(x)+fa0(x));fa2)(x)=x(fa2)(x)+fa1(x)).

Podstawienie pierwszego do drugiego i przywołanie dajefa0=1

(*)fa2)(x)=x(fa2)(x)+x(fa2)(x)+1))

którego unikalnym rozwiązaniem jest

(**)fa2)(x)=x2)1-x-x2).

Podkreśliłem równanie aby podkreślić jego podstawową prostotę i formalne podobieństwo do równania, które uzyskalibyśmy, analizując tylko oczekiwane wartości w efekcie, przy takiej samej ilości pracy, jaką zajmuje znalezienie tej jednej liczby, otrzymujemy całą dystrybucję.()mi[Xja]:

Implikacje i uproszczenie

Równolegle, gdy jest wypisywane termin po terminie, a potęgi są dopasowane, to stwierdza, że ​​dla()tn4,

2)nPar(X2)=n)=2)n-1Par(X2)=n-1)+2)n-2)Par(X2)=n-2)).

Jest to powtórzenie słynnej sekwencji liczb Fibonacciego

(fan)=(1,1,2),3),5,8,13,21,34,55,89,144,)

(indeksowane od ). Dopasowaniem rozwiązania jest sekwencja przesunięta o dwa miejsca (ponieważ nie ma prawdopodobieństwa, że lub i łatwo sprawdzić, czy ).n=0()X2)=0X2)=12)2)Par(X2)=2))=1=2)3)Par(X2)=3))

w konsekwencji

Par(X2)=n)=2)-n-2)fan-2).

Dokładniej,

fa2)(t)=2)-2)fa0t2)+2)-3)fa1t3)+2)-4fa2)t4+=14t2)+18t3)+2)16t4+3)32t5+564t6+8128t7+13256t8+.

Oczekiwanie na można łatwo znaleźć, oceniając pochodną i podstawiając ponieważ (różnicując potęgi termin po termie) daje to wzórX2)fat=1,t

fa(1)=Par(X2)=0)(0)+Par(X2)=1)(1)10++Par(X2)=n)(n)1n-1+

które, jak suma prawdopodobieństw razy wartości właśnie określenie z Biorąc pochodną za pomocą tworzy prosty wzór na oczekiwanie.X2),mi[X2)].()


Kilka krótkich komentarzy

Rozwijając jako ułamki częściowe, można zapisać jako sumę dwóch szeregów geometrycznych. To natychmiast pokazuje prawdopodobieństwo, że spadnie wykładniczo. Daje również zamkniętą postać prawdopodobieństw ogona Korzystając z tego, możemy szybko obliczyć, że jest nieco mniejszy niż()fa2)Par(X2)=n)Par(X2)>n).Par(X2)100)10-9.

Wreszcie, te formuły obejmują Golden Ratio Liczba ta jest długością cięciwy pięciokąta zwykłego (od strony jednostki), co daje uderzające połączenie między czysto kombinatorycznym łańcuchem Markowa na pięciokącie (który „nic nie wie” o geometrii euklidesowej) i geometrią zwykłego pięciokąta w Samolot euklidesowy.ϕ=(1+5)/2)


1

Przez średnią liczbę dni do obiadu, warunek z kroku podjętego pierwszego dnia. Niech będzie liczbą dni, po których robak dostanie jabłko. Niech będzie pierwszym krokiem.Xfa

Potem będzie

mi[X]=mi[X|fa=b] [P.(fa=b)]+mi[X|fa=re] P.[fa=re]

Jeśli pierwszym krokiem jest wtedy albo robak dostaje jabłko w dniu 2 z prawdopodobieństwem o połowę, albo wraca do wierzchołka z prawdopodobieństwem o połowę i zaczyna od nowa. Możemy to napisać jakob,do

mi[X|fa=b]=2)(12))+(2)+mi[X])(12))=2)+mi[X]2)

Jeśli pierwszym krokiem jest to przez symetrię jest to to samo, co w wierzchołku tyle że robak zrobił jeden krok, więcre,do

mi[X|fa=re]=1+mi[X]

Łącząc to wszystko, otrzymujemy

mi[X]=(2)+mi[X]2))(12))+(1+mi[X])(12))

Rozwiązywanie dla dajemi[X]

mi[X]=6

1
To wydaje się podsumować odpowiedź @ Glen_b.
whuber
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.