TRAKTOWANIE NIEformalne
Należy pamiętać, że notacja, w której warunkujemy zmienne losowe, jest niedokładna, choć ekonomiczna, jako notacja. W rzeczywistości warunkujemy na sigma-algebrze, że te losowe zmienne generują. Innymi słowy, oznacza . Ta uwaga może wydawać się nie na miejscu w „Nieformalnym traktowaniu”, ale przypomina nam, że nasze byty uwarunkowane są kolekcjami zbiorów (a kiedy warunkujemy na jednej wartości, to jest to zbiór singletonów). A co zawierają te zestawy? Zawierają one informacje , z którymi możliwe wartości zmiennej losowej dostarczyć nam o tym, co może się zdarzyć z realizacją .E[Y∣X]X Y σ ( X ) ⊆ σ ( X , Z ) Y σ ( X , Z ) σ ( X ) σ ( X ) ≡ I x σ ( X , Z ) ≡ I x zE[Y∣σ(X)]XY
Wprowadzając pojęcie Informacji, pozwala nam myśleć (i używać) Prawa Iterowanych Oczekiwań (czasami nazywanego „Właściwością Wieży”) w bardzo intuicyjny sposób:
sigma-algebra generowana przez dwie losowe zmienne jest przynajmniej tak duży jak wygenerowany przez jedną zmienną losową: w odpowiednim znaczeniu teoretycznym. Tak więc informacja o zawarta w jest co najmniej tak duża jak odpowiednia informacja w .
Teraz, jako notacja insynuacyjna, ustaw i . Następnie można zapisać LHS równania, na które patrzymyσ(X)⊆σ(X,Z)Yσ(X,Z)σ(X)
σ(X)≡Ixσ(X,Z)≡Ixz
Y I x z I x
E[E(Y|Ixz)|Ix]
Opisując słownie powyższe wyrażenie, które mamy: "jakie jest oczekiwanie na {oczekiwana wartość danej informacji } biorąc pod uwagę, że mamy dostępne informacje
tylko ? ”
YIxzIx
Czy możemy jakoś „wziąć pod uwagę” ? Nie - wiemy tylko . Ale jeśli użyjemy tego, co mamy (ponieważ jesteśmy zobowiązani wyrażeniem, które chcemy rozwiązać), to zasadniczo mówimy rzeczy o pod operatorem oczekiwań, tj. Mówimy „ ”, nie więcej - właśnie wyczerpaliśmy nasze informacje. I x Y E ( Y ∣ I x )IxzIxYE(Y∣Ix)
Stąd
E[E(Y|Ixz)|Ix]=E(Y|Ix)
Jeśli ktoś tego nie zrobi, wrócę na formalne leczenie.
(Nieco więcej) FORMALNE LECZENIE
Zobaczmy, jak dwie bardzo ważne książki teorii prawdopodobieństwa, P. Billingsley's Probability and Measure (3d ed.-1995) i D. Williams „Prawdopodobieństwo z Martingales” (1991), traktują kwestię udowodnienia „Law Of Iterated Expectations”:
Billingsley poświęca dokładnie trzy wiersze na dowód. Williams i ja cytuję, mówi
„(Właściwość Tower) jest praktycznie natychmiastowa od definicji warunkowego oczekiwania”.
To jedna linia tekstu. Dowód Billingsleya nie jest mniej nieprzejrzysty.
Mają oczywiście rację: ta ważna i bardzo intuicyjna właściwość warunkowego oczekiwania wywodzi się zasadniczo bezpośrednio (i prawie natychmiast) z jej definicji - jedynym problemem jest, podejrzewam, że tej definicji nie uczy się, a przynajmniej nie podkreśla, poza prawdopodobieństwem lub zmierz koła teoretyczne. Aby jednak przedstawić (prawie) trzy wiersze, które zawiera Prawo Iterowanych Oczekiwań, potrzebujemy definicji warunkowego oczekiwania, a raczej jego właściwości definiującej .
Niech przestrzeń prawdopodobieństwa , oraz do zabudowy zmienną losową . Niech być pod- -algebra o , . Następnie istnieje funkcja która jest -measurable, jest liczbą całkowitą i (jest to właściwość definiująca)Y G σ F G ⊆ F W G(Ω,F,P)YGσFG⊆FWG
E(W⋅1G)=E(Y⋅1G)∀G∈G[1]
gdzie jest funkcją wskaźnik zestawu . Mówimy, że jest („wersją”) warunkowym oczekiwaniem dla biorąc pod uwagę , i piszemy
Kluczowy szczegół, na który należy zwrócić uwagę, to to, że warunkowe oczekiwanie ma taką samą wartość oczekiwaną jako robi, a nie tylko w całym , ale w każdej podgrupie z . G W Y G W = E ( Y ∣ G )1GGWYGY G G GW=E(Y∣G)a.s.
YGGG
(Spróbuję teraz przedstawić, w jaki sposób właściwość Tower wywodzi się z definicji warunkowych oczekiwań).
G σ H ⊆ G G ∈ H ⇒ G ∈ G W H U = E ( W ∣ H )W jest matematyczną zmienną losową mierzalną. Rozpatrzmy kilka sub -algebra, np . Następnie . Tak więc, analogicznie jak poprzednio, mamy warunkowe oczekiwanie na biorąc pod uwagę , powiedzmy to charakteryzuje się GσH⊆GG∈H⇒G∈GWHU=E(W∣H)a.s.
E(U⋅1G)=E(W⋅1G)∀G∈H[2]
Ponieważ , dają nam równania i [ 1 ] [ 2 ]H⊆G[1][2]
E(U⋅1G)=E(Y⋅1G)∀G∈H[3]
Ale to jest własność zdefiniowanie warunkowego oczekiwaniu danego . HYHMamy więc prawo pisać
Ponieważ mamy również konstrukcję , właśnie udowodniliśmy właściwość Tower lub ogólna forma Prawa Iterowanych Oczekiwań - w ośmiu wierszach.U = E ( W ∣ H ) = E ( E [ Y ∣ G ] ∣ H )U=E(Y∣H)a.s.
U=E(W∣H)=E(E[Y∣G]∣H)