Jaka jest różnica między wariancją skończoną a nieskończoną


33

Jaka jest różnica między wariancją skończoną a nieskończoną? Moja wiedza na temat statystyk jest raczej podstawowa; Wikipedia / Google niewiele tu pomogło.


8
Rozkłady z nieskończoną wariancją są ciężkie ; istnieje wiele wartości odstających i mogą mieć właściwości, które różnią się od tego, do czego się przyzwyczaja. Na przykład średnia próbki próbek pobranych z rozkładu Cauchy'ego ma taki sam rozkład (Cauchy'ego) jak poszczególne próbki. Jest to całkiem odmienne od zwykłego przekonania, że ​​średnia próbki jest lepszym „estymatorem” niż jakakolwiek pojedyncza próbka.
Dilip Sarwate

4
Nie, gruby ogon to nie to samo, co nieskończona wariancja, a przynajmniej nie, moim zdaniem. Jednak nie jestem statystykiem i dlatego powinieneś poczekać na bardziej autorytatywną odpowiedź od wysoko ocenianych użytkowników na tym forum.
Dilip Sarwate

4
Nieskończona wariancja ma miejsce, gdy całka (suma) definiująca wariancję populacyjną wzrośnie poza jakąkolwiek skończoną granicę, gdy limit zostanie przekroczony. Trochę dyskusji o przykładach tutaj
Glen_b

2
Myślę, że co najważniejsze, większość centralnych twierdzeń granicznych nie zachowuje się dla takiej populacji, a zatem niektóre typowe wyniki upadną.
Henry.L

1
Ważna uwaga: jeśli wariancja populacji jest nieskończona, ale wariancja próbki jest skończona, wówczas wszelkie oszacowanie wariancji populacji lub odchylenia standardowego przy użyciu statystyki próby takiej jak lub , to będzie raczej mocno stronniczy. Ponieważ tak wiele statystyk testowych opiera się na miary efektu znormalizowanej względem szacowanego błędu standardowego efektu, a ponieważ tak wiele CI opiera się na skalowaniu przez szacowany błąd standardowy, oznacza to, że wnioskowanie statystyczne na temat zmiennych o nieskończonej wariancji prawdopodobnie być raczej bardzo stronniczym . s ss2)ssn
Alexis,

Odpowiedzi:


48

Co to znaczy, że zmienna losowa ma „nieskończoną wariancję”? Co to znaczy, że zmienna losowa ma nieskończone oczekiwania? Wyjaśnienie w obu przypadkach jest raczej podobne, więc zacznijmy od przypadku oczekiwania, a następnie wariancji.

Niech będzie ciągłą zmienną losową (RV) (nasze wnioski będą obowiązywały bardziej ogólnie, dla przypadku dyskretnego zamień całkę na sumę). Aby uprościć ekspozycję, załóżmy, że .X 0XX0

Oczekiwania zdefiniowane są przez całkę gdy ta całka istnieje, to znaczy jest skończona. W przeciwnym razie mówimy, że oczekiwanie nie istnieje. Jest to niepoprawna całka i z definicji jest to Aby ograniczenie było skończone, wkład z ogona musi zniknąć, to znaczy musimy mieć Warunek konieczny (ale niewystarczający), aby tak się stało is . Powyżej pokazany warunek mówi, że wkład w oczekiwanie na (prawy) ogon musi zniknąć0 x f ( x )

miX=0xfa(x)rex
lim a a x f ( x )
0xfa(x)rex=limza0zaxfa(x)rex
lim x x f ( x ) = 0
limzazaxfa(x)rex=0
limxxfa(x)=0. Jeśli tak nie jest, oczekiwania są zdominowane przez wkład z arbitralnie dużych zrealizowanych wartości . W praktyce będzie to oznaczać, że środki empiryczne będą bardzo niestabilne, ponieważ będą zdominowane przez rzadkie, bardzo duże zrealizowane wartości . I zauważ, że ta niestabilność środków próbkowania nie zniknie przy dużych próbkach --- jest to wbudowana część modelu!

W wielu sytuacjach wydaje się to nierealne. Powiedzmy, że jest to model ubezpieczenia (na życie), więc modeluje okres życia (człowieka). Wiemy, że powiedzmy, że nie występuje, ale w praktyce używamy modeli bez górnej granicy. Powód jest jasny: No trudno górna granica wiadomo, czy dana osoba jest (powiedzmy) 110 lat, nie ma powodu, że nie może żyć jeszcze jeden rok! Model z twardą górną granicą wydaje się więc sztuczny. Nadal nie chcemy, aby ekstremalny górny ogon miał duży wpływ.X > 1000XX>1000

Jeśli ma skończone oczekiwania, możemy zmienić model, aby mieć twardą górną granicę bez niepożądanego wpływu na model. W sytuacjach z rozmytą górną granicą, która wydaje się dobra. Jeśli model ma nieskończone oczekiwania, każda twarda górna granica, którą wprowadzimy do modelu, będzie miała dramatyczne konsekwencje! To jest prawdziwe znaczenie nieskończonych oczekiwań.X

Mając skończone oczekiwania, możemy mieć wątpliwości co do górnych granic. Z nieskończonymi oczekiwaniami nie możemy .

Teraz to samo można powiedzieć o nieskończonej wariancji, mutatis mutandi.

Aby to wyjaśnić, zobaczmy na przykładzie. W tym przykładzie wykorzystujemy rozkład Pareto, zaimplementowany w pakiecie R (na CRAN) aktuar jako pareto1 --- jednoparametrowy rozkład Pareto znany również jako rozkład Pareto typu 1. Posiada funkcję gęstości prawdopodobieństwa podaną przez dla niektórych parametrów . Gdy oczekiwanie istnieje i podaje je . Kiedy oczekiwanie nie istnieje, lub, jak mówimy, jest nieskończone, ponieważ całka definiująca je rozchodzi się w nieskończoność. Możemy zdefiniować rozkład w pierwszej chwilim>0,α>0α>1α

fa(x)={αmαxα+1,xm0,x<m
m>0,α>0α>1α1E(M)= M m xf(x)αα1mα1(patrz post Kiedy użyjemy tantilów i medialnych zamiast kwantyli i mediany? w celu uzyskania niektórych informacji i odniesień) jako (istnieje bez względu na to, czy istnieje oczekiwanie). (Późniejsza edycja: wymyśliłem nazwę „rozkład pierwszej chwili, później dowiedziałem się, że jest to związane z czymś, co jest„ oficjalnie ” nazwane momentami częściowymi ).
E(M)=mMxf(x)dx=αα1(mmαMα1)

Gdy oczekiwanie istnieje ( ), możemy go podzielić, aby uzyskać względny rozkład pierwszego momentu, podany przez Gdy jest tylko trochę większy niż jeden, więc oczekiwanie „ledwo istnieje”, całka definiująca oczekiwanie będzie się powoli zbiegać. Spójrzmy na przykład z . Wykreślmy zatem za pomocą R:E r ( M ) = E ( m ) / E ( ) = 1 - ( mα>1

Er(M)=mi(m)/mi()=1-(mM.)α-1
αm=1,α=1.2mir(M.)
### Function for opening new plot file:
open_png  <-  function(filename) png(filename=filename,
                                     type="cairo-png")

library(actuar) # from CRAN
### Code for Pareto type I distribution:
# First plotting density and "graphical moments" using ideas from http://www.quantdec.com/envstats/notes/class_06/properties.htm   and used some times at cross validated

m  <-  1.0
alpha <- 1.2
# Expectation:
E   <-  m * (alpha/(alpha-1))
# upper limit for plots:
upper  <- qpareto1(0.99, alpha, m)   
#
open_png("first_moment_dist1.png")
Er  <- function(M, m, alpha) 1.0 - (m/M)^(alpha-1.0)
### Inverse relative first moment distribution function,  giving
#   what we may call "expectation quantiles":
Er_inv  <-   function(eq, m, alpha) m*exp(log(1.0-eq)/(1-alpha))     

plot(function(M) Er(M, m, alpha), from=1.0,  to=upper)
plot(function(M) ppareto1(M, alpha, m), from=1.0,  to=upper, add=TRUE,  col="red")
dev.off()

który produkuje tę działkę:

wprowadź opis zdjęcia tutaj

Na przykład z tego wykresu można przeczytać, że około 50% udziału w oczekiwaniach pochodzi z obserwacji powyżej około 40. Biorąc pod uwagę, że oczekiwanie tego rozkładu wynosi 6, to jest zdumiewające! (ten rozkład nie ma istniejącej wariancji. W tym celu potrzebujemy ).μα>2)

Zdefiniowana powyżej funkcja Er_inv jest odwrotnym względnym rozkładem pierwszego momentu, analogiem do funkcji kwantylu. Mamy:

> ### What this plot shows very clearly is that most of the contribution to the expectation come from the very extreme right tail!
# Example   
eq  <-  Er_inv(0.5, m, alpha)
ppareto1(eq, alpha, m)
eq

> > > [1] 0.984375
> [1] 32
> 

To pokazuje, że 50% udziału w oczekiwaniach pochodzi z górnej 1,5% ogona rozkładu! Tak więc, szczególnie w małych próbkach, w których istnieje duże prawdopodobieństwo, że skrajny ogon nie jest reprezentowany, średnia arytmetyczna, choć wciąż jest obiektywnym estymatorem oczekiwań , musi mieć bardzo skośny rozkład. Zbadamy to poprzez symulację: Najpierw używamy wielkości próbki .μn=5

set.seed(1234)
n  <-  5
N  <-  10000000  # Number of simulation replicas
means  <-  replicate(N,  mean(rpareto1(n, alpha, m) ))


> mean(means)
[1] 5.846645
> median(means)
[1] 2.658925
> min(means)
[1] 1.014836
> max(means)
[1] 633004.5
length(means[means <=100])
[1] 9970136

Aby uzyskać czytelny wykres, pokazujemy histogram tylko dla części próbki o wartościach poniżej 100, co stanowi bardzo dużą część próbki.

open_png("mean_sim_hist1.png")
hist(means[means<=100],  breaks=100, probability=TRUE)
dev.off()

wprowadź opis zdjęcia tutaj

Rozkład średnich arytmetycznych jest bardzo przekrzywiony,

> sum(means <= 6)/N
[1] 0.8596413
> 

prawie 86% średnich empirycznych jest mniejszych lub równych średniej teoretycznej - oczekiwaniu. Tego należy się spodziewać, ponieważ większość wkładu w średnią pochodzi z ekstremalnego górnego ogona, który nie jest reprezentowany w większości próbek .

Musimy wrócić do ponownej oceny naszych wcześniejszych wniosków. Chociaż istnienie środka umożliwia rozmywanie w zakresie górnych granic, widzimy, że kiedy „środek po prostu ledwo istnieje”, co oznacza, że ​​całka powoli zbieżna, nie możemy być tak rozmyślni w kwestii górnych granic . Powolnie zbieżne całki powodują, że lepiej byłoby zastosować metody, które nie zakładają istnienia oczekiwań . Kiedy całka bardzo powoli zbiega się, dzieje się tak, jakby wcale się nie zbiegała. Praktyczne korzyści wynikające ze zbieżnej całki to chimera w wolno zbieżnym przypadku! To jeden ze sposobów na zrozumienie wniosku NN Taleb w http://fooledbyrandomness.com/complexityAugust-06.pdf


2
Fantastyczna odpowiedź.
Karl

2

Wariancja jest miarą rozproszenia rozkładu wartości zmiennej losowej. Nie jest to jedyna taka miara, np. Średnie bezwzględne odchylenie jest jedną z alternatyw.

Nieskończona wariancja oznacza, że ​​wartości losowe nie koncentrują się zbytnio wokół średniej . Może to oznaczać, że istnieje wystarczająco duże prawdopodobieństwo, że następna losowa liczba będzie bardzo daleko od średniej.

Rozkłady takie jak Normalny (Gaussa) mogą wytwarzać liczby losowe bardzo daleko od średniej, ale prawdopodobieństwo takich zdarzeń maleje bardzo gwałtownie wraz ze skalą odchylenia.

W związku z tym, gdy spojrzysz na wykres rozkładu Cauchy'ego lub Gaussa (normalny) rozkład, nie wyglądają one bardzo różnie wizualnie. Jeśli jednak spróbujesz obliczyć wariancję rozkładu Cauchy'ego, będzie ona nieskończona, podczas gdy rozkład Gaussa jest skończony. Tak więc rozkład normalny jest ściślejszy wokół jego średniej w porównaniu do rozkładu Cauchy'ego.

Przy okazji, jeśli porozmawiasz z matematykami, będą nalegać, że rozkład Cauchy'ego nie ma dobrze określonego środka, że ​​jest nieskończony. To brzmi absurdalnie dla fizyków, którzy zwracają uwagę na fakt, że Cauchy jest symetryczny, a zatem musi mieć jakiś sens. W takim przypadku twierdzą, że problem dotyczy twojej definicji średniej, a nie rozkładu Cauchyego.


2
Czy jesteś pewien matematyków i fizyków? Mam wrażenie, że physisicst może być bardzo rygorystyczny w takich sprawach! Zobacz moją odpowiedź, powolna konwergencja sprawia, że ​​wartość ma niewielką wartość! Również żaden matematyk nie powiedziałby, że Cauchy ma nieskończoną średnią, właściwa granica definiująca całkę po prostu nie istnieje, ponieważ rozbiega się ona na oba ogony. Mówienie o tym, że oczekiwanie jest lub ma sens tylko wtedy, gdy rozbieżność występuje tylko w jednym ogonie. -
kjetil b halvorsen

1
@kjetilbhalvorsen, „żaden matematyk nie powiedziałby, że Cauchy ma nieskończony środek” - ten środek nie jest dobrze zdefiniowany, to jest dokładnie to, co powiedział mi mój profesor statystyk, podczas gdy mój teoretyk Physcis był zaskoczony, że jest nawet pytanie o środek, „oczywiście wynosi zero, a jeśli się nie zgadzasz, to coś jest nie tak z twoją definicją podła”
Aksakal

Czy zapytałeś go o jego definicję średniej?
kjetil b halvorsen

@kjetilbhalvorsen, całka Riemanna, jeśli mówisz o matematyce prof. Jego argumentem jest to, że w sumie Riemanna nie definiujesz określonej kolejności sumy ani podziału sumy, więc twoja suma będzie nieskończona. Punkt fizyków to symetria, oczywiście „musi być zero”
Aksakal

1
Może więc możesz mu powiedzieć, że zdefiniował medianę, a nie średnią.
kjetil b halvorsen

2

Alternatywnym sposobem patrzenia jest funkcja kwantyli.

Q(fa(x))=x

Następnie możemy obliczyć moment lub oczekiwanie

mi(T.(x))=-T.(x)fa(x)rex

fa(x)rex=refa

mi(T.(x))=01T.(Q(fa))refa

T.(x)=xx=0T.(x)<0x=0π

Cauchy kontra Normalny

Krzywe na obrazie pokazują, ile każdy kwantyl bierze udział w obliczeniach.

T.(Q(fa))

Ta nieskończoność może nie być tak dziwna, ponieważ sama całka odległość (średnia) lub odległość kwadratowa (wariancja) mogą stać się nieskończone. To tylko pytanie, ile waży , ile procent F ma te nieskończone ogony.

W sumowaniu / całkowaniu odległości od zera (średnia) lub do kwadratu odległość od średniej (wariancja) pojedynczy punkt, który jest bardzo daleko, będzie miał większy wpływ na średnią odległość (lub odległość do kwadratu) niż wiele punktów w pobliżu.

Kiedy więc zbliżamy się do nieskończoności, gęstość może się zmniejszyć, ale wpływ na sumę pewnej (rosnącej) ilości, np. Odległości lub odległości w kwadracie, niekoniecznie się zmienia.

x2)x12)n((2)x)n)2)12)n


1

X

p(k)=do/|k|3)kZ{0}p(0)=0do=(2)ζ(3)))-1: =(2)k=11/k3))-1<miX∣ <2)k=1k2)/|k|3)=2)k=1k-1=

ζ(x): =k=1k-x


4
0-
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.