Jaki jest najsilniejszy wynik w maksymalnej liczbie Iid Gaussa? Najczęściej używany w praktyce?


9

Biorąc pod uwagę iid, rozważ zmienne losoweX1,,Xn,N(0,1)

Zn:=max1inXi.

Pytanie: Jaki jest „najważniejszy” wynik dotyczący tych zmiennych losowych?

Aby wyjaśnić „znaczenie”, który wynik ma najwięcej innych takich wyników jako logiczną konsekwencję? Który z wyników jest najczęściej wykorzystywany w praktyce?

Mówiąc ściślej, wydaje się, że wiedza (folklorystyczna) wśród statystycznych (teoretycznych) Zn że Z_n są „zasadniczo takie same jak” 2logn , przynajmniej asymptotycznie. (Zobacz to powiązane pytanie .)

Istnieje jednak wiele powiązanych wyników tego typu i wydaje się, że większość nie jest równoważna ani nie implikuje się nawzajem. Na przykład ,

(1)Zn2logna.s.1,

co, jeśli nic innego nie implikuje również odpowiednich wyników w prawdopodobieństwie i rozkładzie.

Jednak nie oznacza to nawet pozornie powiązanych wyników (patrz to inne pytanie )

(2)limnEZn2logn=1,

(to ćwiczenie 2.17 na s. 49 ) lub inny wynik folkloru :

(3)EZn=2logn+Θ(1).

Nie asymptotycznie wiadomo również, że dla każdego (patrz tutaj dowód),n

(4)clognEZn2logn

dla niektórych małych . Podobne wyniki można również wyświetlić dla, ponieważ jest mocno pochylony w prawo.c|Zn|Zn

Dowód tego ostatniego wyniku jest znacznie prostszy niż dowód innych wyników. Miałem nadzieję, że pierwszy asymptotyczny wynik oznaczałby wszystkie inne asymptotyczne, dzięki czemu mogłem czuć się pewnie, skupiając cały swój czas i energię na zrozumienie tego wyniku. Ale znowu to pozornie nieprawda , więc teraz nie jest dla mnie jasne, na czym powinienem się skupić.

Patrz str. 265-267 drugiego wydania Galambos, The Asymptotic Theory of Extreme Order Statistics , wydrukowanego w 1987 r. Prawdopodobnie jest to również określone gdzieś w pierwszym wydaniu.

Boucheron, Lugosi, Massart, Nierówności w koncentracji: nieasymptotyczna teoria niezależności . Poza tym: Ta książka faktycznie przytacza Galambos dla wyniku, o którym mowa, ale nie mogę znaleźć nigdzie w Galambos wspomnianego - tylko pierwszy wynik, o którym wspomniałem.


1
Czy wiesz, że kiedy używasz \ kropek w MathJax, wynik czasami wygląda tak, jakbyś używał \ ldots, a czasami jakbyś używał \ cdots, w zależności od kontekstu? W tym pytaniu zastąpiłem \ kropkami \ kropkami.
X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)
Michael Hardy,

@MichaelHardy Oh Myślałem, że zawsze było wyśrodkowane. Dzięki za poprawkę!
Chill2Macht,

Odpowiedzi:


4

W każdym zastosowaniu probabilistycznym najbardziej podstawowym przedmiotem jest rozkład, z którego można wywnioskować momenty i właściwości ograniczające. Stąd najbardziej „ważnym” wynikiem, w sensie, który opisałeś, jest pełna funkcja dystrybucji (równoważnie odpowiednia funkcja gęstości). W praktyce ten wynik dystrybucji może być mniej pouczający niż niektóre z bardziej podstawowych właściwości asymptotycznych, które już wymieniłeś. Chociaż logicznie implikuje to asymptotyczne wyniki, moim zdaniem wyniki te będą prawdopodobnie bardziej pouczające w zrozumieniu zmieniającej się natury wartości ekstremalnej, gdy zmieniamy .FZn(z)=Φn(z)n

Z twojego pytania jasno wynika, że ​​dobrze rozumiesz właściwości wartości ekstremalnej w przypadku maksimum standardowych zmiennych losowych IID. Wszystkie te właściwości można logicznie wyprowadzić z funkcji dystrybucji dla , więc jest to najbardziej podstawowy obiekt działający w tym problemie. Jak w wielu przypadkach, najbardziej fundamentalny obiekt niekoniecznie jest najbardziej pouczający, więc prawdopodobnie okaże się, że musisz pogodzić się ze znajomością wszystkich wyników i wiedząc, że oświetlają one różne aspekty problemu.Zn


Dzięki za tę odpowiedź - doceniam to. Czy znasz odniesienie do sposobu uzyskania wszystkich tych właściwości z funkcji dystrybucji dla ? Bardzo trudno mi znaleźć cokolwiek, co to wyjaśnia, ponieważ wszystko to jest „folklorem” lub „trzymaniem za rękę”. Zn
Chill2Macht

Dla przypomnienia przeczytałem linki i one nie pomagają. Dlatego zadałem pytanie.
Chill2Macht

1
Nie mam konkretnego odniesienia do rekomendacji, ale sądzę, że wyniki te zostaną uzyskane w książkach na temat teorii ekstremalnych wartości. Sugeruję, aby zacząć od wyszukania tekstów na ten temat na poziomie magisterskim i sprawdzenia, czy można znaleźć tam pochodne.
Ben - Przywróć Monikę

1

WIP: Prace w toku

Po p. 370 w Cramer's Mathematical Methods of Statistics 1946 , zdefiniujTutaj jest funkcją skumulowanego rozkładu standardowego rozkładu normalnego, . W wyniku jego definicji mamy gwarancję, że prawie na pewno.

Ξn=n(1Φ(Zn)).
ΦN(0,1)0Ξnn

Rozważ daną realizację z naszej przykładowej przestrzeni. Zatem w tym sensie jest zarówno funkcją i , a jest funkcją i . Do stałej można rozważyć deterministyczną funkcją i deterministyczną funkcją i , co upraszcza problemy. Naszym celem jest pokazanie wyników, które dotyczą prawie na pewno wszystkichωΩZnnωΞnZn,nωωZnnΞnZnnωΩ, co pozwala nam przenieść nasze wyniki z analizy niedeterministycznej do ustawień niedeterministycznych.

Po p. 374 Matematycznych Metod Statystycznych Cramera z 1946 r. , Załóżmy na chwilę (staram się wrócić i dostarczę dowód później), że jesteśmy w stanie wykazać (dla dowolnego ) następującą asymptotyczną ekspansję (używając integracja przez części i definicja ):ωΩΦ

(~)2πnΞn=1ZneZn22(1+O(1Zn2))  as  Zn.

Oczywiste jest, że dla dowolnego , a jest prawie na pewno funkcją rosnącą od jako , dlatego twierdzimy w dalszej części tego (prawie na pewno wszystkie) naprawione :Zn+1ZnnZnnnω

Znn.

Stąd wynika, że ​​mamy (gdzie oznacza asymptotyczną równoważność ):

2)πnΞn1Znmi-1Zn2)  zas  Znn.

Sposób, w jaki podążamy za tym, co następuje, jest w zasadzie metodą równowagi dominującej , a nasze manipulacje zostaną formalnie uzasadnione następującym lematem:

Lemat: Załóżmy, że jako , i (a zatem ). Następnie, biorąc pod uwagę dowolną funkcję która jest utworzona przez kompozycje, uzupełnienia i zwielokrotnienia logarytmów i praw mocy (zasadniczo dowolna funkcjapolylog ”), musimy również mieć tę funkcję jako :Innymi słowy, takie funkcje „polylog” zachowują asymptotyczną równoważność .fa(n)sol(n)nf(n)g(n)hn

h(fa(n))h(sol(n)).

Prawda tego lematu jest konsekwencją Twierdzenia 2.1. jak napisano tutaj . Zauważ też, że to, co następuje, jest w większości rozszerzoną (więcej szczegółów) wersją odpowiedzi na podobne pytanie znalezione tutaj .

Biorąc logarytmy obu stron, otrzymujemy:

(1)log(2)πΞn)-logn-logZn-Zn2)2).

W tym przypadku Cramer jest nieco klatkowy; po prostu mówi „zakładając, że jest ograniczony”, możemy dojść do wniosku, bla bla bla. Ale pokazanie, że jest odpowiednio ograniczone prawie na pewno wydaje się w rzeczywistości nieco trywialne. Wydaje się, że dowód na to może być zasadniczo częścią tego, co omówiono na stronach 265–267 Galambos, ale nie jestem pewien, biorąc pod uwagę, że wciąż pracuję nad zrozumieniem treści tej książki.ΞnΞn

W każdym razie, zakładająclogΞn=o(logn) , że można wykazać, że , to wynika (ponieważ dominuje termin ), że:Zn2/2logZn

lognZn22Zn2logn.

Jest to całkiem miłe, ponieważ jest to już większość tego, co chcemy pokazać, chociaż ponownie warto zauważyć, że w zasadzie to tylko kopanie puszki w dół drogi, ponieważ teraz musimy wykazać pewną, prawie na pewno ograniczoną . Z drugiej strony, ma taki sam rozkład dla każdego maksimum ciągłych zmiennych losowych, więc może to być możliwe.ΞnΞn

W każdym razie, jeśli as, to oczywiście można również stwierdzić, że dla dowolnego czyli jako . Używając powyższego lematu o funkcjach polilogu zachowujących asymptotyczną równoważność, możemy zastąpić to wyrażenie z powrotem do aby uzyskać:Zn2lognZn2logn(1+α(n))α(n)o(1)n(1)

log(2πΞn)lognlog(1+α)12log212loglognlogn2αlognα2logn.

log(Ξn2π)log(1+α)+12log2+12loglogn+2αlogn+α2logn.

Tutaj musimy pójść jeszcze dalej i założyć, że prawie na pewnologΞn=o(loglogn)  as  n . Ponownie wszystko, co mówi Cramer, to „zakładając, że jest ograniczony”. Ale ponieważ wszystko, co można powiedzieć a priori o to że as, nie wydaje się jasne, że należy mieć prawie na pewno, co wydaje się być treścią roszczenia Cramera.ΞnΞn0XinnΞn=O(1)

Ale w każdym razie, zakładając, że w to wierzysz, z powyższego wynika, że ​​dominującym terminem, który nie zawiera jest . Ponieważ , wynika z tego, że i wyraźnie , więc dominującym terminem zawierającym jest . Dlatego możemy zmienić kolejność i (dzieląc wszystko przez lub )α12loglognα=o(1)α2=o(α)log(1+α)=o(α)=o(o(αlogn))α2αlogn12loglogn2αlogn

12loglogn2αlognαloglogn4logn.

Dlatego podstawiając to z powrotem do powyższego, otrzymujemy:

Zn2lognloglogn22logn,

ponownie, zakładając, że wierzymy w pewne rzeczy o .Ξn

Ponownie wykorzystujemy tę samą technikę; ponieważ , to również wynika z tego, żeZn2lognloglogn22logn

Zn2lognloglogn22logn(1+β(n))=2logn(1loglogn8logn(1+β(n))),

kiedy . Uprośćmy trochę przed podstawieniem bezpośrednio z powrotem do (1); otrzymujemy to:β(n)=o(1)

logZnlog(2logn)+log(1loglogn8logn(1+β(n)))log(O(1))=o(logn)log(2logn).

Zn22logn12loglogn(1+β)+(loglogn)28logn(1β)2o((1+β)loglogn)logn12(1+β)loglogn.

Zastępując to z powrotem do (1), stwierdzamy, że:

log(2πΞn)lognlog(2logn)logn+12(1+β)loglognβlog(4πΞn2)loglogn.

Dlatego stwierdzamy, że prawie na pewno

Zn2lognloglogn22logn(1+log(4π)+2log(Ξn)loglogn)=2lognloglogn+log(4π)22lognlog(Ξn)2logn.

Odpowiada to końcowemu wynikowi na str. 374 Matematycznych metod statystycznych Cramera z 1946 roku, z tym wyjątkiem, że nie podano tutaj dokładnej kolejności terminu błędu. Najwyraźniej zastosowanie tego jednego terminu daje dokładną kolejność terminu błędu, ale w każdym razie nie wydaje się konieczne, aby udowodnić wyniki dotyczące maksimów standardowych wartości normalnych, którymi jesteśmy zainteresowani.


Biorąc pod uwagę wynik powyższego, a mianowicie, że prawie na pewno:

()Zn2lognloglogn+log(4π)22lognlog(Ξn)2lognZn=2lognloglogn+log(4π)22lognlog(Ξn)2logn+o(1).

2. Następnie z liniowości oczekiwań wynika, że:

EZn=2lognloglogn+log(4π)22lognE[log(Ξn)]2logn+o(1)EZn2logn=1E[logΞn]2logn+o(1).

Dlatego pokazaliśmy to

limnEZn2logn=1,

tak długo, jak możemy to pokazać

E[logΞn]=o(logn).

To może nie być trudne do pokazania, ponieważ ponownie ma taki sam rozkład dla każdej ciągłej zmiennej losowej. Mamy więc drugi wynik z góry.Ξn

1. Podobnie mamy z powyższego, że prawie na pewno:

Zn2logn=1log(Ξn)2logn+o(1),.

Dlatego jeśli możemy pokazać, że:

(*)log(Ξn)=o(logn) almost surely,

wtedy pokażemy pierwszy wynik z góry. Wynik (*) również wyraźnie implikuje tym bardziej, że , dając w ten sposób również pierwszy wynik z góry.E[log(Ξn)]=o(logn)

Zauważ również, że w powyższym dowodzie ( ) i tak musieliśmy założyć, że prawie na pewno (lub przynajmniej coś podobnego), więc jeśli jesteśmy w stanie pokazać ( ), to najprawdopodobniej będziemy mieć w procesie potrzebnym prawie na pewno pokazanie , a zatem jeśli uda nam się udowodnić , najprawdopodobniej będziemy w stanie natychmiast wyciągnąć wszystkie poniższe wnioski.Ξn=o(logn)Ξn=o(logn)()

3. Jednakże, jeśli otrzymamy ten wynik, to nie rozumiem, jak można by to zrobić, że , ponieważ . Ale przynajmniej wydaje się prawdą, żeEZn=2logn+Θ(1)o(1)Θ(1)

EZn=2logn+O(1).


Wygląda więc na to, że możemy skupić się na odpowiedzi na pytanie, jak pokazać, że

Ξn=o(logn) almost surely.

Będziemy też musieli wykonać cholerną robotę, dostarczając dowodu na (~), ale według mojej najlepszej wiedzy, która jest tylko rachunkiem i nie zawiera teorii prawdopodobieństwa, chociaż muszę jeszcze usiąść i spróbować.

Najpierw przejdźmy przez łańcuch aby sformułować problem w sposób ułatwiający jego rozwiązanie (zwróć uwagę, że z definicji ):Ξn0

Ξn=o(logn)limnΞnlogn=0ε>0,Ξnlogn>ε only finitely many timesε>0,Ξn>εlogn only finitely many times.

Jeden ma również to:

Ξn>εlognn(1F(Zn))>εlogn1F(Zn)>εlognnF(Zn)<1εlognnZninf{y:F(y)1εlognn}.

Odpowiednio zdefiniuj dla wszystkich :n

un(ε)=inf{y:F(y)1εlognn}.

Dlatego powyższe kroki pokazują nam, że:

Ξn=o(logn) a.s.P(Ξn=o(logn))=1P(ε>0,Ξn>εlogn only finitely many times)=1P(ε>0,Znun(ε) only finitely many times)=1P(ε>0,Znun(ε) infinitely often)=0.

Zauważ, że możemy napisać:

{ε>0,Znun(ε) infinitely often}=ε>0{Znun(ε) infinitely often}.

Sekwencje stają się jednolicie większe, gdy maleje, więc możemy stwierdzić, że zdarzenia maleją (lub przynajmniej jakoś monotoniczna) jako idzie do . Dlatego aksjomat prawdopodobieństwa dotyczący monotonicznych sekwencji zdarzeń pozwala nam stwierdzić, że:un(ε)ε

{Znun(ε) infinitely often}
ε0

P(ε>0,Znun(ε) infinitely often)=P(ε>0{Znun(ε) infinitely often})=P(limε0{Znun(ε) infinitely often})=limε0P(Znun(ε) infinitely often).

Dlatego wystarczy pokazać, że dla wszystkich ,ε>0

P(Znun(ε) infinitely often)=0

ponieważ oczywiście granicą dowolnej stałej sekwencji jest stała.

Oto nieco wynik młota:

Twierdzenie 4.3.1., Str. 252 Galambos, The Asymptotic Theory of Extreme Order Statistics , 2nd edition. Niech będą zmiennymi ididowymi ze wspólną funkcją niedegeneracji i ciągłego rozkładu , i niech będzie sekwencją nie malejącą, tak że również nie maleje. Następnie, dla , zgodnie z X1,X2,F(x)unn(1F(un))un<sup{x:F(x)<1}

P(Znun infinitely often)=0 or 1
j=1+[1F(uj)]exp(j[1F(uj)])<+ or =+.

Dowód jest techniczny i zajmuje około pięciu stron, ale ostatecznie okazuje się, że jest następstwem jednego z lematów Borela-Cantellego. Mogę zająć się próbą zagęszczenia dowodu, aby użyć tylko części wymaganej do tej analizy, a także tylko założeń, które mają miejsce w przypadku Gaussa, które mogą być krótsze (ale być może nie są) i wpisać tutaj, ale wstrzymywanie oddechu nie jest zalecane. Zauważ, że w tym przypadku , więc warunek jest pusty, a to zatem wyraźnie nie maleje.ω(F)=+n(1F(n))εlogn

W każdym razie chodzi o to, odwołując się do tego twierdzenia, jeśli możemy wykazać, że:

j=1+[1F(uj(ε))]exp(j[1F(uj(ε))])=j=1+[εlogjj]exp(εlogj)=εj=1+logjj1+ε<+.

Zauważ, że ponieważ wzrost logarytmiczny jest wolniejszy niż jakikolwiek wzrost prawa mocy dla dowolnego wykładnika prawa dodatniego (logarytmy i wykładniki zachowują monotoniczność, więc i poprzednia nierówność mogą być zawsze widoczne dla wszystkich wystarczająco dużych ze względu na fakt, że i zmiana zmiennych):loglognαlognlognnαnlognn

j=1+logjj1+εj=1+jε/2j1+ε=j=1+1j1+ε/2<+,

ponieważ wiadomo, że seria p jest zbieżna dla wszystkich , a oczywiście oznacza .p>1ε>01+ε/2>1

Zatem używając powyższego twierdzenia pokazaliśmy, że dla wszystkich , , co podsumowując powinno oznaczać, że prawie na pewno.ε>0P(Znun(ε) i.o.)=0Ξn=o(logn)

Musimy nadal pokazywać, że . Nie wynika to z powyższego, ponieważ np.logΞn=o(loglogn)

1nlogn=o(logn),logn+loglogno(logn).

Jednak biorąc pod uwagę sekwencję , jeśli można pokazać, że dla dowolnego , oznacza to, że . Idealnie chciałbym móc to pokazać dla przy użyciu powyższego lematu (zakładając, że to nawet prawda), ale nie jestem w stanie (na razie).xnxn=o((logn)δ)δ>0log(xn)=o(loglogn)Ξn

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.