Dzięki informacjom podanym przez @Glen_b mogłem znaleźć odpowiedź. Używając tych samych notacji co pytanie
P.( Zk≤ x ) = ∑j = 0k + 1( k+1jot) (-1)jot( 1 - j x )k+,
gdzie jeśli i przeciwnym razie. Podaję również oczekiwanie i asymptotyczną zbieżność do rozkładu Gumbela ( NB : nie Beta)a > 0 0za+= aa > 00
mi( Zk) = 1k + 1∑i = 1k + 11ja∼ log( k + 1 )k + 1,P.( Zk≤ x ) ∼ exp( - e- ( k + 1 ) x + log( k + 1 )) .
Materiał dowodów pochodzi z kilku publikacji połączonych w odnośnikach. Są nieco długie, ale proste.
1. Dowód dokładnego podziału
Niech będą jednolitymi losowymi zmiennymi IID w przedziale . Zamawiając je, otrzymujemy oznaczonych statystyk zamówienia . Jednolite odstępy są zdefiniowane jako , przy czym i . Uporządkowane odstępy to odpowiednie uporządkowane statystyki . Zmienna zainteresowania to .( 0 , 1 ) k ( U ( 1 ) , ... , u ( k ) ) Δ I = U ( i ) - u ( i - 1 ) u ( 0 ) = 0 U ( k + 1 ) = 1 Δ ( 1 ) ≤( U1, … , Uk)(0,1)k(U(1),…,U(k))Δi=U(i)−U(i−1)U(0)=0U(k+1)=1 Δ ( k + 1 )Δ(1)≤…≤Δ(k+1)Δ(k+1)
Dla stałych definiujemy zmienną wskaźnikową . Przez symetrię losowy wektor jest wymienny, więc łączny rozkład podzbioru rozmiaru jest taki sam jak łączny rozkład pierwszy . W ten sposób uzyskujemy rozszerzenie produktu1 i = 1 { Δ i > x } ( 1 1 , … , 1 k + 1 ) j jx∈(0,1)1i=1{Δi>x}(11,…,1k+1)jj
P.( Δ( k + 1 )≤ x ) = E( ∏i = 1k + 1( 1 - 1ja) ) = 1 + ∑j = 1k + 1( k+1jot)(−1)jE(∏i=1j1i).
Udowodnimy teraz, że , co określi rozkład podany powyżej. Udowadniamy to dla , ponieważ ogólny przypadek udowodniono podobnie. j = 2E(∏ji=11i)=(1−jx)k+j=2
E(∏i=121i)=P(Δ1>x∩Δ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).
Jeśli , punktów przerwania znajduje się w przedziale . Warunkowo w przypadku tego zdarzenia punkty przerwania są nadal wymienne, więc prawdopodobieństwo, że odległość między drugim a pierwszym punktem przerwania jest większa niż jest takie samo, jak prawdopodobieństwo, że odległość między pierwszym punktem przerwania a lewą barierą (w pozycji ) jest większy niż . Więck ( x , 1 ) x x xΔ1>xk(x,1)xxx
P.( Δ2)> x | Δ1> x ) = P.(all points are in (2x,1)∣∣all points are in (x,1)),soP(Δ2>x∩Δ1>x)=P(all points are in (2x,1))=(1−2x)k+.
2. Oczekiwanie
Dla dystrybucji ze skończonym wsparciem mamy
E(X)=∫P(X>x)dx=1−∫P(X≤x)dx.
Łącząc dystrybucję otrzymujemyΔ(k+1)
E(Δ(k+1))=1k+1∑j=1k+1(k+1j)(−1)j+1j=1k+1∑j=1k+11j.
Ostatnia równość to klasyczna reprezentacja liczb harmonicznych , które pokazujemy poniżej.Hi=1+12+…+1i
Hk+1=∫101+x+…+xkdx=∫101−xk+11−xdx.
Wraz ze zmianą zmiennej i rozszerzeniem produktu otrzymujemyu=1−x
Hk+1=∫10∑j=1k+1(k+1j)(−1)j+1uj−1du=∑j=1k+1(k+1j)(−1)j+1j.
3. Alternatywna konstrukcja równomiernych odstępów
Aby uzyskać asymptotyczny rozkład największego fragmentu, będziemy musieli wykazać klasyczną konstrukcję równomiernych odstępów jako zmiennych wykładniczych podzielonych przez ich sumę. Gęstość prawdopodobieństwa powiązanych statystyk zamówień wynosi(U(1),…,U(k))
fU(1),…U(k)(u(1),…,u(k))=k!,0≤u(1)≤…≤u(k+1).
Jeśli oznaczymy jednolite odstępy , przy , otrzymamyΔi=U(i)−U(i−1)U(0)=0
fΔ1,…Δk(δ1,…,δk)=k!,0≤δi+…+δk≤1.
Definiując , otrzymujemy w ten sposóbU(k+1)=1
fΔ1,…Δk+1(δ1,…,δk+1)=k!,δ1+…+δk=1.
Teraz niech będzie wykładniczymi zmiennymi losowymi IID ze średnią 1, i niech . Po prostej zmianie zmiennej możemy to zobaczyć(X1,…,Xk+1)S=X1+…+Xk+1
fX1,…Xk,S(x1,…,xk,s)=e−s.
Zdefiniuj , tak że poprzez zmianę zmiennej otrzymujemyYi=Xi/S
fY1,…Yk,S(y1,…,yk,s)=ske−s.
Łącząc tę gęstość względem , otrzymujemy w ten sposóbs
fY1,…Yk,(y1,…,yk)=∫∞0ske−sds=k!,0≤yi+…+yk≤1,and thusfY1,…Yk+1,(y1,…,yk+1) = k ! ,y1+ … + Yk + 1= 1
Zatem łączny rozkład równomiernych odstępów w przedziale jest taki sam, jak wspólny rozkład losowych zmiennych podzielonych przez ich sumę. Dochodzimy do następującej równoważności dystrybucjik + 1(0,1)k+1
Δ(k+1)≡X(k+1)X1+…+Xk+1.
4. Dystrybucja asymptotyczna
Korzystając z powyższej równoważności, otrzymujemy
P((k+1)Δ(k+1)−log(k+1)≤x)=P(X(k+1)≤(x+log(k+1))X1+…+Xk+1k+1)=P(X(k+1)−log(k+1)≤x+(x+log(k+1))Tk+1),
gdzie . Ta zmienna znika z prawdopodobieństwem, ponieważ i . Asymptotycznie rozkład jest taki sam jak w przypadku . Ponieważ to IID, mamyTk+1=X1+…+Xk+1k+1−1E(Tk+1)=0Var(log(k+1)Tk+1)=(log( k + 1 ) )2)k + 1↓ 0X( k + 1 )- log( k + 1 )Xja
P.( X( k + 1 )- log( k + 1 ) ≤ x )= P( X1≤ x + log( k + 1 ) )k + 1= ( 1 - e- x - log( k + 1 ))k + 1= ( 1 - e- xk + 1)k + 1∼ exp{ - e- x} .
5. Przegląd graficzny
Poniższy wykres pokazuje rozkład największego fragmentu dla różnych wartości . Dla nałożyłem również asymptotyczny rozkład Gumbela (cienka linia). Gumbel jest bardzo złym przybliżeniem małych wartości więc pomijam je, aby nie przeciążały obrazu. Przybliżenie Gumbela jest dobre od .kk = 10 , 20 , 50kk ≈ 50
6. Referencje
Powyższe dowody pochodzą z odniesień 2 i 3. Cytowana literatura zawiera wiele innych wyników, takich jak rozkład uporządkowanych odstępów dowolnej rangi, ich rozkład graniczny i niektóre alternatywne konstrukcje uporządkowanych jednolitych odstępów. Najważniejsze odniesienia nie są łatwo dostępne, dlatego udostępniam również linki do pełnego tekstu.
- Bairamov i in. (2010) Ogranicz wyniki dla zamówionych jednolitych odstępów , dokumenty statystyczne, 51: 1, s. 227–240
- Holst (1980) O długości kawałków patyka przypadkowo złamanych , J. Appl. Prob., 17, str. 623-634
- Pyke (1965) Spacings , JRSS (B) 27: 3, ss. 395–449
- Renyi (1953) Na temat teorii statystyki zamówień Acta math Hung, 4, s. 191–231