Uogólnienie pytania wymaga rozkładu gdy rozkład X jest znany i poparty liczbami naturalnymi. (W pytaniu X ma rozkład Poissona parametru λ = λ 1 + λ 2 + ⋯ + λ n i m = n .)Y=⌊X/m⌋XXλ=λ1+λ2+⋯+λnm=n
Rozkład jest łatwo określana przez rozkład m Y , którego prawdopodobieństwo generowania funkcji (PGF) można określić w kategoriach PGF o X . Oto zarys pochodnej.YmYX
Napisz dla pgf X , gdzie (z definicji) p n = Pr ( X = n ) . m Y jest skonstruowane z X w taki sposób, że jego pgf, q , wynosip(x)=p0+p1x+⋯+pnxn+⋯Xpn=Pr(X=n)mYXq
q(x)=(p0+p1+⋯+pm−1)+(pm+pm+1+⋯+p2m−1)xm+⋯+(pnm+pnm+1+⋯+p(n+1)m−1)xnm+⋯.
Ponieważ jest to absolutnie zbieżne dla , możemy zmienić warunki na sumę części formularza|x|≤1
Dm,tp(x)=pt+pt+mxm+⋯+pt+nmxnm+⋯
dla t=0,1,…,m−1 . Seria zasilające funkcji składa się z co m th okres serii P , wychodząc z t p : jest czasami nazywany decymacji w p . Wyszukiwania Google obecnie nie wyświetlają użytecznych informacji o dziesiętnych, więc dla kompletności, oto pochodna wzoru.xtDm,tpmthptthp
Niech być dowolny prymitywny m th korzeni jedności; na przykład weź ω = exp ( 2 i π / m )ωmthω=exp(2iπ/m) . Następnie wynika z i ∑ m - 1 j = 0 ω j = 0 toωm=1∑m - 1j = 0ωjot= 0
xtrem , tp ( x ) = 1m∑j = 0m - 1ωt jp ( x / ωjot) .
Aby to zobaczyć, zauważ, że operator jest liniowy, więc wystarczy sprawdzić formułę na podstawie { 1 , x , x 2 , … , x n , … } . Zastosowanie prawej strony do x n dajextrem , t{ 1 , x , x2), … , Xn, … }xn
xtrem , t[ xn] = 1m∑j = 0m - 1ωt jxnω- n j= xnm∑j = 0m - 1ω( t - n ) j .
Gdy i n różnią się wielokrotnością m , każdy składnik w sumie jest równy 1 i otrzymujemy x n . W przeciwnym razie terminy przechodzą przez potęgi ω t - n i sumują się do zera. Skąd ten operator zachowuje wszystkie moce x przystające do t modulo m i zabija wszystkie pozostałe: jest to dokładnie pożądana projekcja.tnm1xnωt - nxtm
Wzór na następuje łatwo, zmieniając kolejność sumowania i rozpoznając jedną z sum jako geometryczną, zapisując ją w formie zamkniętej:q
q( x )= ∑t = 0m - 1( Dm , t[ p ] ) ( x )= ∑t = 0m - 1x- t1m∑j = 0m - 1ωt jp ( ω- jx )= 1m∑j = 0m - 1p ( ω- jx ) ∑t = 0m - 1( ωjot/ x )t= x ( 1 - x- m)m∑j = 0m - 1p ( ω- jx )x - ωjot.
Na przykład pgf rozkładu Poissona parametru to p ( x ) = exp ( λ ( x - 1 )λ . Przy m = 2 , ω = - 1 i pgf 2 Y będziep ( x ) = exp( λ ( x - 1 ) )m = 2ω = - 12 Y
q( x )= x ( 1 - x- 2)2)∑j = 02 - 1p ( ( - 1 )- jx )x - ( - 1 )jot= x - 1 / x2)( exp( λ ( x - 1 ) )x - 1+exp(λ(−x−1))x+1)=exp(−λ)(sinh(λx)x+cosh(λx)).
Jednym z zastosowań tej metody jest obliczenie momentów i m Y . Wartość k- tej pochodnej pgf oceniana przy x = 1 jest k- tym momentem czynnikowym. K th chwili jest kombinacją liniową pierwszych k moment silni. Korzystając z tych obserwacji, stwierdzamy na przykład, że dla Poissona rozproszonego X.XmYkthx=1kthkthkX jego średnia (która jest pierwszym momentem czynnikowym) wynosi , średnia 2 ⌊ ( X / 2 ) ⌋ jest równa λλ2⌊(X/2)⌋, a średnia z3⌊(X/3)⌋jest równaλ-1+e-3λ/2(sin ( √λ−12+12e−2λ3⌊(X/3)⌋:λ−1+e−3λ/2(sin(3√λ2)3√+cos(3√λ2))
Średnie dla pokazano odpowiednio na niebiesko, czerwono i żółto, jako funkcje λ : asymptotycznie, średnia spada o ( m - 1 ) / 2 w porównaniu z pierwotną średnią Poissona.m=1,2,3λ(m−1)/2
Podobne wzory dla wariancji można uzyskać. (Stają się niechlujne wraz ze wzrostem więc są pomijane. Jedną rzeczą, którą ostatecznie ustalają, jest to, że gdy m > 1 żadna wielokrotność Y nie jest Poissonem: nie ma ona charakterystycznej równości średniej i wariancji) Oto wykres wariancji jako funkcja λ dla m = 1 , 2 , 3 :mm>1Yλm=1,2,3
Interesujące jest to, że dla większych wartości wariancje rosną . Intuicyjnie wynika to z dwóch konkurujących ze sobą zjawisk: funkcja podłogi skutecznie grupuje grupy wartości, które pierwotnie były odrębne; musi to spowodować zmniejszenie wariancji . Jednocześnie, jak widzieliśmy, zmieniają się również środki (ponieważ każdy bin jest reprezentowany przez jego najmniejszą wartość); musi to spowodować dodanie z powrotem terminu równego kwadratowi różnicy średnich środków. Wzrost wariancji dla dużego λ staje się większy przy większych wartościach m .λλm
Zachowanie wariancji z m jest zaskakująco złożone. Zakończmy szybką symulacją (in ) pokazującą, co potrafi. Wykresy pokazują różnicę między wariancją m ⌊ X / m ⌋ a wariancją X dla Poissona o rozkładzie X z różnymi wartościami λ w zakresie od 1mYmR
m⌊X/m⌋XXλ1 do . We wszystkich przypadkach wykresy wydają się osiągać wartości asymptotyczne po prawej stronie.5000
set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
x <- rpois(20000, lambda)
v <- sapply(1:floor(lambda + 4*sqrt(lambda)),
function(m) var(floor(x/m)*m) - var(x))
plot(v, type="l", xlab="", ylab="Increased variance",
main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})