Niniejsze pytanie jest szczególnym przypadkiem, w którym mamy do czynienia z wielkością, która jest funkcją liniową wielomianowej zmiennej losowej. Możliwe jest dokładne rozwiązanie problemu poprzez wyliczenie kombinacji wielomianowych, które spełniają wymaganą nierówność, i zsumowanie rozkładu w tym zakresie. W przypadku, gdy jest duży, może to stać się niewykonalne obliczeniowo. W takim przypadku możliwe jest uzyskanie przybliżonego rozkładu przy użyciu normalnego przybliżenia do wielomianu. Uogólniona wersja tego przybliżenia jest pokazana poniżej, a następnie jest stosowana do konkretnego przykładu.N
Ogólny problem aproksymacyjny: Załóżmy, że mamy ciąg wymiennych zmiennych losowych o zakresie . Dla dowolnego możemy utworzyć wektor liczenia , który liczy liczbę wystąpienia każdego wyniku w pierwszych wartościach sekwencji. Ponieważ sekwencja leżąca u podstaw jest wymienna, wektor zliczania jest dystrybuowany jako:n ∈ N X ≡ X ( n ) ≡ ( X 1 , X 2 , . . . , X m ) N1,2,...,mn∈NX≡X(n)≡(X1,X2,...,Xm)n
X ~ Mu(n,θ)θ=limn→∞X(n)/n.
Załóżmy teraz, że mamy jakiś wektor nieujemnych wag i używamy tych wag do zdefiniowania funkcji liniowej:w=(w1,w2,...,wm)
A(n)≡∑i=1mwiXi.
Ponieważ wagi nie są ujemne, ta nowa ilość nie zmniejsza się w . Następnie definiujemy liczbę , która jest najmniejszą liczbę obserwacji wymagane do uzyskania określonej minimalnej wartości naszym funkcją liniową. Chcemy aproksymować rozkład w przypadku, gdy ta wartość jest (stochastycznie) duża.N ( a ) ≡ min { n ∈ N | A ( n ) ⩾ a } N ( a )nN(a)≡min{n∈N|A(n)⩾a}N(a)
Rozwiązywanie ogólnego problemu aproksymacji: Po pierwsze, zauważamy, że ponieważ nie zmniejsza się w (co jest ważne, ponieważ przyjęliśmy, że wszystkie wagi są nieujemne), mamy:nA(n)n
P(N(a)⩾n)=P(N(a)>n−1)=P(A(n−1)<a).
W związku z tym, rozmieszczenie jest bezpośrednio związane z podziałem . Zakładając, że pierwsza wielkość jest duża, możemy w przybliżeniu rozmieścić tę drugą, zastępując dyskretny losowy wektor ciągłym przybliżeniem z wielowymiarowego rozkładu normalnego. Prowadzi to do normalnego przybliżenia kwantyfikacji liniowej i możemy bezpośrednio obliczyć momenty tej wielkości. W tym celu wykorzystujemy fakt, że , i dla . W przypadku podstawowej algebry daje to nam:A X A ( n ) E ( X i ) = n θ i V ( X i ) = n θ i ( 1 - θ i ) C ( X i , X j ) = - n θ i θ j i ≠ jNAXA(n)E(Xi)=nθiV(Xi)=nθi(1−θi)C(Xi,Xj)=−nθiθji≠j
μ≡E(1nA(n))=∑i=1mwiθi,
σ2≡V(1n−−√A(n))=∑i=1mwiθi−(∑i=1mwiθi)2=μ(1−μ).
Przyjęcie normalnego przybliżenia do wielomianu daje nam teraz przybliżony rozkład . Zastosowanie tego przybliżenia daje:A(n) ~ N(nμ,nμ(1−μ))
P(N( a ) ⩾ n ) = P ( A ( n - 1 ) < a ) ≈ Φ ( a−(n−1)μ( n - 1)μ(1−μ)−−−−−−−−−−−--√) .
(Symbol jest standardowym oznaczeniem standardowej funkcji rozkładu normalnego.) Można zastosować to przybliżenie, aby znaleźć prawdopodobieństwa dotyczące wielkości dla określonej wartości . Jest to podstawowe przybliżenie, które nie próbowało uwzględnić korekty ciągłości wartości leżących u podstaw wartości liczby wielomianowej. Uzyskuje się to przez przyjęcie normalnego przybliżenia przy użyciu tych samych pierwszych dwóch centralnych momentów, co dokładna funkcja liniowa.N ( a ) aΦN.( )za
Zastosowanie do twojego problemu: W twoim problemie masz prawdopodobieństwa , wagi , a wartość odcięcia . Masz zatem (zaokrąglając do sześciu miejsc po przecinku) . Stosując powyższe przybliżenie mamy (zaokrąglając do sześciu miejsc po przecinku):w=(0,ln2,ln3)a=ln100000μ=1θ = ( 12), 16, 13))w=(0,ln2,ln3)a=ln100000μ=16ln2+13ln3=0.481729
P(N(a)⩾25)≈Φ(ln100000−24⋅0.48172924−−√⋅0.499666)=Φ(−0.019838)=0.492086.
Stosując dokładny rozkład wielomianowy, sumując wszystkie kombinacje spełniające wymaganie , można wykazać, że dokładny wynik to . Stąd widzimy, że przybliżenie jest dość zbliżone do dokładnej odpowiedzi w niniejszej sprawie.P(A(24)<a)P(N(a)⩾25)=0.483500
Mam nadzieję, że ta odpowiedź daje odpowiedź na konkretne pytanie, jednocześnie umieszczając ją w bardziej ogólnych ramach wyników probabilistycznych, które dotyczą funkcji liniowych wielomianowych wektorów losowych. Niniejsza metoda powinna pozwolić na uzyskanie przybliżonych rozwiązań problemów ogólnego rodzaju, z którymi się mierzysz, umożliwiając zróżnicowanie konkretnych liczb w twoim przykładzie.