Czy są jakieś przykłady normalnej dystrybucji zmiennej, która * nie * jest spowodowana twierdzeniem o granicy centralnej?

Normalny rozkład wydaje się nieintuicyjny, dopóki nie nauczysz się CLT, co wyjaśnia, dlaczego jest tak powszechny w prawdziwym życiu. Ale czy kiedykolwiek powstaje jako „naturalny” rozkład dla pewnej ilości?

normal-distribution central-limit-theorem

— ogrodnik
źródło

Fizyczna teoria dyfuzji, w zakresie, w jakim ma zastosowanie do dowolnego układu, przewiduje normalne rozkłady wielkości (takich jak temperatura lub stężenie), które powstają w jednym punkcie. Rzeczywiście, wiele systemów ma charakter dyfuzyjny (ceny opcji, transport cząstek w homogenicznych mediach itp.), Co sugeruje, że przykłady są obfite, zakładając, że jeden nie jest tak naiwny, aby przypuszczać, że rozkład normalny musi dokładnie obejmować nierealistycznie duże lub małe wartości - byłoby to nieporozumienie z całą teorią fizyczną.

— whuber

Rozkład normalny wydaje się nieintuicyjny, dopóki nie dowiesz się, że maksymalizuje entropię pod warunkiem stałej wariancji.

— leonbloy

Odpowiedzi:

W pewnym stopniu myślę, że może to być kwestia zarówno filozoficzna, jak i statystyczna.

Wiele naturalnie występujących zjawisk jest w przybliżeniu normalnie rozmieszczonych. Można spierać się, czy przyczyną tego może być coś takiego jak CLT:

Wysokości ludzi mogą być uważane za sumę wielu mniejszych przyczyn (być może niezależnych, mało prawdopodobnych identycznie rozmieszczonych): długości różnych kości lub wyniki różnych ekspresji genów lub wyniki wielu wpływów dietetycznych lub kombinacja wszystkich powyższych .
Wyniki testu mogą być traktowane jako sumy wyników wielu indywidualnych pytań testowych (możliwie identycznie rozłożonych, mało prawdopodobne całkowicie niezależnych).
Odległość, jaką cząstka przemieszcza się w jednym wymiarze w wyniku ruchu Browna w płynie: Ruch można uznać abstrakcyjnie za losowy spacer wynikający z przypadkowych uderzeń IID przez cząsteczki.

Jednym z przykładów, w którym CLT niekoniecznie jest zaangażowany, jest rozrzut strzał wokół oka byka: Odległość od oka byka można modelować jako rozkład Rayleigha (proporcjonalny do pierwiastka kwadratowego chi-sq z 2 DF) i kąt przeciwny do ruchu wskazówek zegara od dodatnia oś pozioma może być modelowana jako jednolita naNastępnie po zmianie współrzędnych biegunowych na prostokątne odległości w kierunkach poziomym (x) i pionowym (y) okazują się nieskorelowane dwuwymiarowe normalne. [To jest istota transformacji Boxa-Mullera, którą możesz znaleźć w Google.] Jednak normalne współrzędne xiy można uznać za sumę wielu małych niedokładności w celowaniu, co może uzasadniać mechanizm związany z CLT w tle . $(0, 2\pi).$

W sensie historycznym powszechne stosowanie rozkładów normalnych (gaussowskich) zamiast rozkładów podwójnie wykładniczych (Laplace'a) do modelowych obserwacji astronomicznych może częściowo wynikać z CLT. We wczesnych dniach błędów modelowania takich spostrzeżeń toczyła się debata między Gaussem a Laplace'em , z których każdy opowiadał się za swoim ulubionym rozkładem. Z różnych powodów wygrał normalny model. Można argumentować, że jednym z powodów ostatecznego sukcesu rozkładu normalnego była wygoda matematyczna oparta na normalnych granicach CLT. Wydaje się, że jest to prawdą, nawet jeśli nie jest jasne, która rodzina dystrybucji zapewnia lepsze dopasowanie. (Nawet teraz wciąż istnieją astronomowie, którzy uważają, że „jedna najlepsza obserwacja”dokonane przez skrupulatnego, szanowanego astronoma z pewnością będzie lepszą wartością niż średnia z wielu obserwacji dokonanych przez przypuszczalnie mniej utalentowanych obserwatorów. W rezultacie statystycy w ogóle nie preferowaliby żadnej interwencji).

— BruceET
źródło

Tak. Wciąż naprawiam literówki. Dzięki za zauważenie tego. Naprawiono również ten sam błąd w „wynikach testu”.

— BruceET,

-3

Wiele naturalnie występujących zmiennych jest zwykle rozmieszczonych. Wysokości ludzi? Wielkość kolonii zwierząt?

— Szczęśliwy
źródło

@Happy Właściwie żaden z podanych tutaj przykładów nie jest normalnie rozłożony, ponieważ obsługa rozkładu normalnego to-nieskończoność do + nieskończoności, a podane przykłady nigdy nie mogą wynosić zero lub mniej. W każdym przypadku rozkład normalny może być przydatnym przybliżeniem, ale nie, jeśli interesują cię ogony rozkładu.

— JeremyC,

Wzrost człowieka jest wynikiem sumy (w przybliżeniu) niezależnych genów, więc w rzeczywistości są one spowodowane CLT.

— ogrodnik

@ArtemMavrin: uzyskanie ujemnej wysokości byłoby czymś w rodzaju ponad 8 odchyleń standardowych. Jeśli ktoś sprzeciwia się nieważności normalnego przybliżenia, ponieważ stawia zerową masę prawdopodobieństwa powyżej 8 sd, możesz również narzekać, że prawdziwie normalnie rozłożona wartość jest nieracjonalna z prawdopodobieństwem 1, ale wszystkie nasze pomiary są liczbami wymiernymi.

— Cliff AB,

@ArtemMavrin: cóż, jeśli pytanie dotyczy czegoś dokładnie normalnie dystrybuowanego, odpowiedź jest prosta: nie. Nawet nie rnorm(1). To samo dotyczy wszystkich dystrybucji, innych niż wielomianowe.

— Cliff AB,

@gardenhead przeczytał wypowiedź centralnego twierdzenia o limicie i zauważył, że nie pasuje on do tego, co powiedziałeś (liczba genów jest skończona, podczas gdy CLT dotyczy ograniczającego rozkładu znormalizowanej sumy od . tak przy okazji, istnieje inne twierdzenie, które mówi, że skończona suma zmiennych nietypowych iid nie może być normalna; twierdzenie to nie jest sprzeczne z rzeczywistym CLT!)

n \to \infty

$n\to\infty$

— Glen_b