Nie mogę znaleźć referencji, więc naszkicuję tutaj dowód.
Twierdzenie. Niech będą prawdziwymi zmiennymi losowymi. Niech będą stałymi. Załóżmy, że dla wszystkich i wszystkich obsługujących , mamya 1 , ⋯ , a n , b 1 , ⋯ , b n i ∈ { 1 , ⋯ , n } ( x 1 , ⋯ , x i - 1 ) ( X 1 , ⋯ , X i - 1X1,⋯,Xna1,⋯,an,b1,⋯,bni∈{1,⋯,n}(x1,⋯,xi−1)(X1,⋯,Xi−1)
- E[Xi|X1=x1,⋯,Xi−1=xi−1]≤0 i
- P[Xi∈[ai,bi]]=1 .
Następnie, dla wszystkich ,P [ n ∑ i = 1 X i ≥ t ] ≤ exp ( - 2 t 2t≥0
P[∑i=1nXi≥t]≤exp(−2t2∑ni=1(bi−ai)2).
Dowód. Zdefiniuj . Twierdzimy, że Dla wszystkich i mamy
Z założenia i dla wszystkich w ramach wsparcia∀ i ∈ { 1 , ⋯ , n } ∀ λ ≥ 0 E [ e λ Y i ] ≤ eYi=∑ij=1XjiλE[eλYi]=E[eλYi-1⋅eλXi]=E[eλYi-1⋅E[e
∀i∈{1,⋯,n} ∀λ≥0 E[eλYi]≤e18λ2∑ij=1(bj−aj)2.(*)
iλμ(y i - 1 ):=E[Xi| Y i - 1 =y i - 1 ]≤0P[Xi∈[ai,bi]]=1y i - 1 Y i - 1 Y i X1+E[eλYi]=E[eλYi−1⋅eλXi]=E[eλYi−1⋅E[eλXi∣∣Yi−1]].
μ(yi−1):=E[Xi|Yi−1=yi−1]≤0P[Xi∈[ai,bi]]=1yi−1Yi−1. (Zauważ, że ). Tak więc, dzięki
lematowi Hoeffdinga , dla wszystkich w ramach wsparcia i wszystkich . Ponieważ , dla wszystkich ,
Teraz indukcja daje powyższe twierdzenie (*).
Yi−1=X1+⋯+Xi−1E[eλXi∣∣Yi−1=yi−1]≤eλμ(yi−1)+18λ2(bi−ai)2
yi−1Yi−1λ∈Rμ(yi−1)≤0λ≥0E[eλYi]≤E[eλYi−1⋅e0+18λ2(bi−ai)2].
Teraz stosujemy nierówność Markowa do i używamy naszego twierdzenia (*). Dla wszystkich ,
Na koniec ustaw aby zminimalizować wyrażenie prawej ręki i uzyskać wynik. eλYnt,λ>0
P[∑i=1nXi≥t]=P[Yn≥t]=P[eλYn≥eλt]≤E[eλYn]eλt≤e18λ2∑ni=1(bi−ai)2eλt.
λ=4t∑ni=1(bi−ai)2■
Jak wspomniałem w moim komentarzu, kluczową różnicą między tym a „zwykłym” stwierdzeniem nierówności Azumy jest wymóg , a nie . Ten pierwszy pozwala na większą elastyczność, co w niektórych przypadkach pozwala zaoszczędzić współczynnik 2.Xi∈[ai,bi]Xi∈[−a,a]
Zauważ, że losowe zmienne w dowodzie są . Zwykłą wersję nierówności Azumy można uzyskać, biorąc Martingale , ustawiając i (gdzie ), a następnie stosując powyższy wynik.Y 1 , ⋯ , Y n X i = Y i - Y i - 1 [ a i , b i ] = [ - c i , c i ] P [ | Y i - Y i - 1 | ≤ c i ] = 1YiY1,⋯,YnXi=Yi−Yi−1[ai,bi]=[−ci,ci]P[|Yi−Yi−1|≤ci]=1