Dlaczego rośnie wariancja chodzenia losowego?


28

Losowo w odległości , która jest określona jako gdzie jest szum biały. Oznacza, że ​​bieżąca pozycja jest sumą poprzedniej pozycji + nieprzewidziany termin.Yt=Yt1+etet

Możesz udowodnić, że średnia funkcja , ponieważμt=0E(Yt)=E(e1+e2+...+et)=E(e1)+E(e2)+...+E(et)=0+0+...+0

Ale dlaczego wariancja rośnie liniowo z czasem?

Czy ma to coś wspólnego z „czystą” losowością, ponieważ nowa pozycja jest bardzo skorelowana z poprzednią?

EDYTOWAĆ:

Teraz znacznie lepiej rozumiem, wizualizując dużą próbę losowych spacerów, i tutaj możemy łatwo zauważyć, że ogólna wariancja z czasem wzrasta ,

100 000 losowych spacerów

a średnia jest jak oczekiwano wokół zera.

Być może było to w końcu trywialne, ponieważ na bardzo wczesnych etapach szeregu czasowego (porównaj czas = 10, ze 100) przypadkowi wędrowcy nie mieli jeszcze czasu na eksplorację.


2
Trudno zrozumieć, w jaki sposób „średnia” dowolnego symulowanego losowego marszu byłaby taka sama, jak oczekiwanie określonego . Oczekiwanie to jest z definicji obliczane dla całego „zestawu” możliwych losowych spacerów, z których twój symulowany spacer jest tylko jednym przykładem. Kiedy symulujesz wiele spacerów - być może poprzez nałożenie ich wykresów na jeden wykres - zobaczysz, że są one rozmieszczone wokół osi poziomej. Jak ten spread różni się w zależności od ? tYtt
whuber

@ whuber, który ma większy sens! Oczywiście powinienem uznać to za jeden z przykładów wszystkich możliwych spacerów. A potem tak, można zobaczyć na wykresie, że ogólna wariancja wszystkich spacerów z czasem wzrasta. To jest poprawne?
Isbister

1
Tak to prawda. To dobry sposób, aby docenić to, co @Glen_b napisał w swojej odpowiedzi za pomocą matematyki. Odkryłem, że pomaga w wielu zastosowaniach losowych spacerów: oprócz klasycznej aplikacji ruchu Browna, opisują one dyfuzję, wycenę opcji, kumulację błędów pomiaru i wiele więcej. Weź jeden z nich, na przykład dyfuzję. Wyobraź sobie kroplę atramentu wpadającą do kałuży stacjonarnej wody. Chociaż jego pozycja jest stała, rozkłada się w miarę upływu czasu: w ten sposób możemy właściwie widzieć stałą zero i rosnącą wariancję.
whuber

@whuber Dziękuję bardzo, teraz całkowicie to rozumiem!
Isbister

Odpowiedzi:


37

W skrócie, ponieważ dodaje wariancję kolejnych przyrostów do zmienności, którą mamy w dotarciu do miejsca, w którym jesteśmy teraz.

Var(Yt)=Var(e1+e2+...+et)
=Var(e1)+Var(e2)+...+Var(et) (niezależność)
=σ2+σ2+...+σ2=tσ2,

i widzimy, że wzrasta liniowo wraz z .tσ2t


Średnia wynosi zero w każdym punkcie czasowym; jeśli symulowałeś serię wiele razy i uśredniłeś dla szeregu dla danego czasu, to średnia wyniosłaby około 0

500 symulowanych losowych spacerów ze średnią próbki i odchyleniem standardowym +/-

Figure: 500 simulated random walks with sample mean in white and 
± one standard deviation in red. Standard deviation increases with t.


Tak, każdy termin błędu jest niezależny tak. I na pewno ma to sens na papierze. Ale nadal nie mam przeczucia, że ​​„Jak wariancja może wzrosnąć liniowo”, ale średnia pozostaje zerowa? Brzmi dziwnie, prawie jak sprzeczność. Co powiesz na mniej matematyczne wyjaśnienie, które odpowiada na moje pytania?
Isbister

timpal0l - W każdym momencie dodajesz inny termin, który nie zmienia żadnej średniej, ale dodaje do „szumu” (wariancji względem średniej). Tak więc średnia pozostaje taka sama, ale wariancja wzrasta (rozkład „rozkłada się” bardziej później). Jest to zarówno intuicyjny pomysł, jak i ogólny sens tego, co pokazuje matematyka.
Glen_b

1
Dzięki za diagram, A.Webb . Bardzo dobrze.
Glen_b

15

Oto sposób, aby to sobie wyobrazić. Aby uprościć sprawę, zastąpmy twój biały szum monetąe jaeiei

ei={1 with Pr=.51 with Pr=.5

to po prostu upraszcza wizualizację, nie ma nic naprawdę fundamentalnego w przełączniku, oprócz zmniejszenia obciążenia naszej wyobraźni.

Załóżmy teraz, że zebrałeś armię płetw. Ich instrukcje mają, na twój rozkaz, rzucić monetą i sprawdzać, jakie były ich wyniki, a także podsumować wszystkie poprzednie wyniki. Każdy pojedynczy płetwa jest przykładem przypadkowego spaceru

W=e1+e2+

a zebranie całej armii powinno dać ci pogląd na oczekiwane zachowanie.

flip 1: Około połowa twojej armii przewraca głowy, a połowa przewraca ogony. Oczekiwana suma, obliczona dla całej armii, wynosi zero. Maksymalna wartość w całej armii wynosi a minimalna , więc całkowity zasięg to .1 - 1 2W112

flip 2: Około pół odwróconych głów i pół odwróconych ogonów. Oczekiwanie na ten obrót jest ponownie równe zero, więc oczekiwanie wszystkich przerzutów nie zmienia się. Część twojej armii przerzuciła , a inna przerzuciła , więc maksymalna wynosi a minimalna ; całkowity zakres wynosi .H H T T W 2 - 2 4WHHTTW224

...

flip n: Około pół odwróconych głów i pół odwróconych ogonów. Oczekiwanie na to przerzucenie wynosi ponownie zero, więc oczekiwanie na wszystkich przerzuceniach nie zmienia się, wciąż wynosi zero. Jeśli armia jest bardzo duża, niektóre bardzo szczęśliwy żołnierze przerzucony i inni . To znaczy, jest kilka z głowami, a kilka z ogonami (choć z czasem staje się to coraz rzadsze). Tak więc, przynajmniej w naszej wyobraźni, całkowity zasięg wynosi .H H H T T T n n 2 nWHHHTTTnn2n

Oto, co możesz zobaczyć z tego eksperymentu myślowego:

  • Oczekiwanie na marsz wynosi zero, ponieważ każdy krok marszu jest zrównoważony.
  • Całkowity zasięg marszu rośnie liniowo wraz z długością marszu.

Aby odzyskać intuicję, musieliśmy odrzucić standardowe odchylenie i zastosować w intuicyjny sposób zakres.


1
Odchylenie standardowe nie rośnie liniowo, więc końcowa uwaga jest wątpliwa.
Juho Kokkala,

Tak, próbuję przemyśleć coś do powiedzenia, aby rozwiązać ten problem, jakieś sugestie? Mogę tylko myśleć o odwołaniach do centralnego twierdzenia o granicy, które nie są zbyt intuicyjne.
Matthew Drury

@JuhoKokkala Zgadzam się z twoją krytyką, więc usunąłem ostatnią uwagę.
Matthew Drury,

3

Czy ma to coś wspólnego z „czystą” losowością, ponieważ nowa pozycja jest bardzo skorelowana z poprzednią?

Wydaje się, że przez „czysty” rozumiesz niezależność . W losowym marszu tylko kroki są losowe i niezależne od siebie. Jak zauważyłeś, „pozycje” są losowe, ale skorelowane , tj. Nie są niezależne .

Oczekiwanie na pozycję wciąż wynosi zero, tak jak napisałeś . Powodem, dla którego obserwujesz niezerowe pozycje, jest to, że pozycje są nadal losowe, tj. Wszystkie są niezerowymi liczbami losowymi. W rzeczywistości, gdy zwiększasz próbkę, od czasu do czasu będzie obserwowane większe , właśnie dlatego, jak zauważyłeś, wariancja rośnie wraz z rozmiarem próbki.Y t Y tE[Yt]=0YtYt

Różnica rośnie, ponieważ jeśli pozycję w następujący sposób: , możesz oczywiście zobaczyć, że pozycja jest sumą kroków. Rozbieżności sumują się ze wzrostem wielkości próby.Yt=Y0+i=0tεt

Nawiasem mówiąc, sumy błędów również się sumują, ale w losowym marszu zwykle zakładamy, że średnie są równe zero, więc dodanie wszystkich zer będzie nadal dawało zero. Istnieje losowy spacer z dryfem: , gdzie będzie dryfował od zera w tempie wraz z czasem próbkowania.Y t μ tYtYt1=μ+εtYtμt


2

Weźmy inny przykład intuicyjnego wyjaśnienia: rzucanie rzutkami w tarczę do rzutek. Mamy gracza, który próbuje celować w dziesiątkę, którą uważamy za współrzędną zwaną 0. Gracz rzuca kilka razy, a przecież średnia jego rzutów wynosi 0, ale nie jest zbyt dobry, więc wariancja wynosi 20 cm.

Prosimy gracza, aby rzucił jedną nową rzutką. Czy spodziewasz się, że trafi w dziesiątkę?

Nie. Chociaż średnia to dokładnie dziesiątka, kiedy próbujemy rzut, raczej nie jest to dziesiątka.

Podobnie w przypadku losowego marszu nie spodziewamy się, że pojedyncza próbka w czasie będzie w pobliżu 0. To w rzeczywistości wskazuje wariancja: jak daleko spodziewamy się próbki?t

Jednakże, jeśli weźmiemy dużo próbek, zobaczymy, że wyśrodkowuje się ono na 0. Podobnie jak nasz gracz w rzutki prawie nigdy nie trafi w dziesiątkę (duża wariancja), ale jeśli rzuci dużo rzutek, będzie je wyśrodkować wokół tarczy (średnia).

Jeśli rozszerzymy ten przykład na losowy marsz, możemy zauważyć, że wariancja rośnie z czasem, mimo że średnia pozostaje na poziomie 0. W przypadku przypadkowego chodzenia wydaje się dziwne, że średnia pozostaje na poziomie 0, nawet jeśli intuicyjnie wiesz że prawie nigdy nie kończy się dokładnie u źródła. To samo dotyczy naszej lotki: widzimy, że jakakolwiek pojedyncza strzałka prawie nigdy nie trafi w dziesiątkę z rosnącą wariancją, a jednak strzałki będą tworzyły ładną chmurę wokół tarczy - średnia pozostaje taka sama: 0.


1
Nie opisuje to fenomenu pytania, które dotyczy czasowego wzrostu spreadu. Ten wzrost nie jest funkcją liczby próbek. To jest nieodłączne.
whuber

1
@ whuber Wiem, że ta odpowiedź nie dotyczy tego i nie miałem zamiaru tego robić. OP wydawało się mieć problem z tym, że średnia była całkowicie niezależna od wariancji, chociaż intuicyjnie widzimy, że losowy spacer prawie nigdy nie skończy się u źródła, więc próbowałem wyjaśnić to na przykładzie bez trudnej zależności na . Jednak komentarz był zbyt długi, ale w rzeczywistości nie miał stanowić pełnej odpowiedzi. Rozszerzyłem odpowiedź, aby, mam nadzieję, odrobinę poradzić sobie z twoją troską. t
Sanchises

0

Oto inny sposób na uzyskanie intuicji, że wariancja rośnie liniowo z czasem.

Zwroty wzrastają liniowo z czasem. zwrotu na miesiąc przekłada się na zwrotu na rok - zwrotu na dzień generuje zwrotu na rok (przy założeniu niezależności)..1%1.2%X365X

Ma sens, że zakres zwrotów również wzrasta liniowo. Jeśli miesięczny zwrot wynosi średnio średnio , to intuicyjnie wydaje się, że rocznie wynosi on średnio ..1%±.05%1.2%±.6%

Cóż, jeśli intuicyjnie myślimy o wariancji jako zakresie, wówczas intuicyjnie ma sens, że wariancja wzrasta w taki sam sposób, jak powrót w czasie, to znaczy liniowo.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.