Streszczenie
Odkryłeś na nowo część konstrukcji opisanej w Central Limit Theorem for Sample Medians , która ilustruje analizę mediany próbki. (Analiza oczywiście dotyczy, mutatis mutandis , każdego kwantyla, nie tylko mediany). Dlatego nie jest zaskoczeniem, że dla dużych parametrów Beta (odpowiadających dużym próbkom) rozkład normalny powstaje w wyniku transformacji opisanej w pytaniu. Interesujące jest to, jak bliski jest rozkład normalny nawet dla małych parametrów Beta. To zasługuje na wyjaśnienie.
Naszkicuję analizę poniżej. Aby utrzymać ten post na rozsądnej długości, wymaga wiele sugestywnych machań ręką: staram się tylko wskazać kluczowe pomysły. Pozwolę sobie zatem streścić tutaj wyniki:
Kiedy jest bliskie β , wszystko jest symetryczne. Powoduje to, że przekształcony rozkład już wygląda normalnie.αβ
Funkcje postaci wyglądają dość normalnie, nawet dla małych wartości α i β (pod warunkiem, że oba przekraczają 1, a ich stosunek nie jest zbyt duży blisko 0 lub 1 ).Φα−1(x)(1−Φ(x))β−1αβ101
Pozorna normalność rozkładu transformowanego wynika z faktu, że jego gęstość składa się z gęstości normalnej pomnożonej przez funkcję w (2).
Gdy i β wzrosną, odstępstwo od normalności można zmierzyć w pozostałych kategoriach w szeregu Taylora dla gęstości logarytmicznej. Pojęcie rzędu n maleje proporcjonalnie do ( n - 2 ) / 2 mocy α i β . To implikuje, że ostatecznie, dla wystarczająco dużych α i β , wszystkie warunki mocy n = 3 lub większe stały się stosunkowo małe, pozostawiając jedynie kwadrat: to właśnie gęstość logarytmiczna rozkładu normalnego.αβn(n−2)/2αβαβn=3
Podsumowując, te zachowania ładnie wyjaśniają, dlaczego nawet dla małych i β nietradycyjne kwantyle z tej samej próbki Normalnej wyglądają w przybliżeniu Normalnie.αβ
Analiza
Ponieważ uogólnienie może być przydatne, niech będzie dowolną funkcją rozkładu, chociaż mamy na myśli F = Φ .FF=Φ
Funkcja gęstości z beta ( α , β ) zmienna z definicji jest proporcjonalna dog(y)(α,β)
yα−1(1−y)β−1dy.
Jeśli pozwolimy być całką prawdopodobieństwa przekształcenia x i zapisujemy f dla pochodnej F , to natychmiast, że x ma gęstość proporcjonalną doy=F(x)xfFx
G(x;α,β)=F(x)α−1(1−F(x))β−1f(x)dx.
Ponieważ jest to monotoniczna transformacja silnie nieimodalnego rozkładu (Beta), chyba że jest dość dziwny, transformowany rozkład również będzie unimodalny. Aby zbadać, jak blisko może być Normalny, przyjrzyjmy się logarytmowi jego gęstości,F
logG(x;α,β)=(α−1)logF(x)+(β−1)log(1−F(x))+logf(x)+C(1)
gdzie jest nieistotną stałą normalizacji.C
Rozwiń składowe w szeregu Taylora, aby uporządkować trzy wokół wartości x 0 (która będzie zbliżona do trybu). Na przykład możemy zapisać rozszerzenie dziennika F jakologG(x;α,β)x0logF
logF(x)=cF0+cF1(x−x0)+cF2(x−x0)2+cF3h3
jakiegoś z | h | ≤ | x - x 0 | . Użyj podobnej notacji dla log ( 1 - F ) i log f . h|h|≤|x−x0|log(1−F)logf
Warunki liniowe
W ten sposób staje się pojęcie liniowe w (1)
g1(α,β)=(α−1)cF1+(β−1)c1−F1+cf1.
Gdy jest trybem G (x0 , to wyrażenie wynosi zero. Zauważ, że ponieważ współczynniki są ciągłymi funkcjami x 0 , ponieważ α i β są zmienne, tryb x 0 będzie się również zmieniał w sposób ciągły. Ponadto, gdy α i β są wystarczająco duże, człon c f 1 staje się stosunkowo nieistotny. Jeśli chcemy zbadać granicę jako α → ∞ i β → ∞, dla których α : β pozostaje w stałym stosunku γG(;α,β)x0αβx0αβcf1α→∞β→∞ α:βγ, możemy zatem raz na zawsze wybrać punkt bazowy dla któregox0
γcF1+c1−F1=0.
Dobrym przykładem jest przypadek, w którym , gdzie α = β , a F jest symetryczny około 0 . W tym przypadku jest oczywiste, x 0 = C ( 0 ) = 1 / 2 .γ=1α=βF0x0=F(0)=1/2
Osiągnęliśmy metodę, w której (a) w limicie zanika termin pierwszego rzędu w serii Taylora i (b) w opisanym szczególnym przypadku, termin pierwszego rzędu jest zawsze równy zero.
Warunki kwadratowe
To jest suma
g2(α,β)=(α−1)cF2+(β−1)c1−F2+cf2.
Porównując z normalnym rozkładzie, który kwadratowej jest , można oszacować, że - 1 / ( 2 g 2 ( α , β ) ) wynosi około wariancja G . Standaryzujmy G poprzez przeskalowanie x o pierwiastek kwadratowy. tak naprawdę nie potrzebujemy szczegółów; wystarczy zrozumieć, że to przeskalowanie pomnoży współczynnik ( x−(1/2)(x−x0)2/σ2−1/(2g2(α,β))GGx we rozszerzeniu Taylora o ( - 1 / ( 2 g 2 ( α , β ) ) ) n / 2 .(x−x0)n(−1/(2g2(α,β)))n/2.
Termin pozostały
Oto punkt zwrotny: zgodnie z naszym zapisem termin porządkowy w rozwinięciu Taylora jest następujący:n
gn(α,β)=(α−1)cFn+(β−1)c1−Fn+cfn.
Po standaryzacji staje się
g′n(α,β)=gn(α,β)(−2g2(α,β))n/2).
Obu są afiniczne połączeniem alfa i beta . Podnosząc mianownik do potęgi n / 2 , zachowanie netto jest rzędu - ( n - 2 ) / 2 w każdym z α i β . Ponieważ parametry te rosną, każdy składnik w ekspansji Taylora po drugim spada asymptotycznie do zera. W szczególności pozostały termin trzeciego rzędu staje się arbitralnie mały.giαβn/2−(n−2)/2αβ
Przypadek, gdy jest normalnyF
Zniknięcie pozostałej części jest szczególnie szybkie, gdy jest standardową Normalną, ponieważ w tym przypadku f ( x ) jest czysto kwadratowe: nie przyczynia się do pozostałych reszt. W związku z tym odchylenie G od normalności zależy wyłącznie od odchylenia między F α - 1 ( 1 - F ) β - 1 a normalnością.Ff(x)GFα−1(1−F)β−1
This deviation is fairly small even for small α and β. To illustrate, consider the case α=β. G is symmetric, whence the order-3 term vanishes altogether. The remainder is of order 4 in x−x0=x.
Here is a plot showing how the standardized fourth order term changes with small values of α>1:
Wartość zaczyna się od dla α = β = 1 , ponieważ wówczas rozkład jest oczywiście Normalny ( Φ - 1 zastosowany do rozkładu równomiernego, którym jest Beta ( 1 , 1 ) , daje standardowy rozkład Normalny). Chociaż szybko rośnie, osiąga wartość poniżej 0,008 - co praktycznie jest nie do odróżnienia od zera. Następnie rozpoczyna się asymptotyczny rozpad wzajemny, dzięki czemu rozkład jest coraz bliższy wartości normalnej, gdy α wzrasta powyżej 2 .0α=β=1Φ−1(1,1)0.008α2