Pytanie dotyczy dwóch rzeczy: (1) jak pokazać, że maksymalna zbieżna w tym sensie, że zbiega (w rozkładzie) dla odpowiednio wybranych sekwencji i , do standardowego rozkładu Gumbela i (2) jak znaleźć takie sekwencje. ( X ( n ) - b n ) / a n ( a n ) ( b n )X( n )( X( n )- bn) / an(an)(bn)
Pierwszy jest dobrze znany i udokumentowany w oryginalnych pracach na temat twierdzenia Fishera-Tippetta-Gnedenko (FTG). Drugi wydaje się trudniejszy; to jest problem rozwiązany tutaj.
Pamiętaj, aby wyjaśnić niektóre twierdzenia pojawiające się gdzie indziej w tym wątku
To, co maksymalne, nie zbiega się do niczego: rozbiega się (choć bardzo wolno).
Wydaje się, że istnieją różne konwencje dotyczące dystrybucji Gumbela. Przyjmę konwencję, że CDF odwróconego rozkładu Gumbela jest, w odpowiedniej skali i lokalizacji, podane przez . Odpowiednio ustandaryzowane maksimum iid Normal zmienia się zbieżnie do odwróconego rozkładu Gumbela.1−exp(−exp(x))
Intuicja
Gdy mają tę samą funkcję wspólnej dystrybucji , rozkład maksymalnego wynosiXiFX(n)
Fn(x)=Pr(X(n)≤x)=Pr(X1≤x)Pr(X2≤x)⋯Pr(Xn≤x)=Fn(x).
Kiedy wsparcie nie ma górnej granicy, jak w przypadku rozkładu normalnego, sekwencja funkcji maszeruje na zawsze w prawo bez ograniczeń:FFn
częściowe wykresy dla .Fnn=1,2,22,24,28,216
Aby zbadać kształty tych rozkładów, możemy przesunąć każdy z powrotem w lewo o pewną wartość i przeskalować go o aby były porównywalne.bnan
Każdy z poprzednich wykresów został przesunięty, aby ustawić jego medianę na i uczynić przedział długości międzykwartylowej.0
FTG zapewnia, że sekwencje i można wybrać tak, aby te funkcje rozkładu zbiegały się punktowo przy każdym do pewnego ekstremalnego rozkładu wartości , aż do skali i lokalizacji. Gdy jest rozkładem normalnym, szczególnym ograniczającym rozkładem wartości ekstremalnych jest odwrócony Gumbel, aż do położenia i skali.(an)(bn)xF
Rozwiązanie
Kuszące jest naśladowanie centralnego twierdzenia granicznego poprzez standaryzację celu uzyskania średniej jednostki i wariancji jednostki. Jest to jednak częściowo niewłaściwe, ponieważ FTG ma zastosowanie nawet do (ciągłych) dystrybucji, które nie mają pierwszego ani drugiego momentu. Zamiast tego użyj percentyla (takiego jak mediana), aby określić lokalizację, a różnicę percentyli (takich jak IQR), aby określić spread. (To ogólne podejście powinno odszukać i dla dowolnego ciągłego rozkładu.)Fnanbn
W przypadku standardowego rozkładu normalnego okazuje się to łatwe! Niech . Kwantyl odpowiadający jest dowolną wartością dla której . Przywołując definicję , rozwiązaniem jest0<q<1FnqxqFn(xq)=qFn(x)=Fn(x)
xq;n=F−1(q1/n).
Dlatego możemy ustawić
bn=x1/2;n, an=x3/4;n−x1/4;n; Gn(x)=Fn(anx+bn).
Ponieważ z założenia mediana wynosi a jej IQR wynosi , mediana wartości granicznej (która jest pewną wersją odwróconego Gumbela) musi wynosić a jej IQR musi wynosić . Niech parametrem skali będzie a parametrem lokalizacji będzie . Ponieważ mediana to a IQR łatwo można znaleźć na , parametry muszą byćGn01Gn01βαα+βloglog(2)β(loglog(4)−loglog(4/3))
α=loglog2loglog(4/3)−loglog(4); β=1loglog(4)−loglog(4/3).
Nie jest konieczne, aby i były dokładnie tymi wartościami: muszą jedynie je przybliżać, pod warunkiem, że limit jest nadal odwróconym rozkładem . Prosta (ale uciążliwa) analiza dla standardowej normalnej wskazuje, że przybliżeniaanbnGnF
a′n=log((4log2(2))/(log2(43)))22log(n)−−−−−−√, b′n=2log(n)−−−−−−√−log(log(n))+log(4πlog2(2))22log(n)−−−−−−√
będzie działać dobrze (i są tak proste, jak to możliwe).
Jasnoniebieskie krzywe są częściowymi wykresami dla przy użyciu przybliżonych sekwencji i . Ciemnoczerwona linia przedstawia odwrócony rozkład Gumbela z parametrami i . Konwergencja jest wyraźna (chociaż szybkość konwergencji dla ujemnego jest zauważalnie wolniejsza).Gnn=2,26,211,216a′nb′nαβx
Bibliografia
BV Gnedenko, O ograniczeniu rozkładu maksymalnego terminu w losowej serii . W Kotz and Johnson, Breakthroughs in Statistics Tom I: Foundations and Basic Theory, Springer, 1992. Tłumaczone przez Normana Johnsona.