Normalny rozkład wydaje się nieintuicyjny, dopóki nie nauczysz się CLT, co wyjaśnia, dlaczego jest tak powszechny w prawdziwym życiu. Ale czy kiedykolwiek powstaje jako „naturalny” rozkład dla pewnej ilości?
Normalny rozkład wydaje się nieintuicyjny, dopóki nie nauczysz się CLT, co wyjaśnia, dlaczego jest tak powszechny w prawdziwym życiu. Ale czy kiedykolwiek powstaje jako „naturalny” rozkład dla pewnej ilości?
Odpowiedzi:
W pewnym stopniu myślę, że może to być kwestia zarówno filozoficzna, jak i statystyczna.
Wiele naturalnie występujących zjawisk jest w przybliżeniu normalnie rozmieszczonych. Można spierać się, czy przyczyną tego może być coś takiego jak CLT:
Wysokości ludzi mogą być uważane za sumę wielu mniejszych przyczyn (być może niezależnych, mało prawdopodobnych identycznie rozmieszczonych): długości różnych kości lub wyniki różnych ekspresji genów lub wyniki wielu wpływów dietetycznych lub kombinacja wszystkich powyższych .
Wyniki testu mogą być traktowane jako sumy wyników wielu indywidualnych pytań testowych (możliwie identycznie rozłożonych, mało prawdopodobne całkowicie niezależnych).
Odległość, jaką cząstka przemieszcza się w jednym wymiarze w wyniku ruchu Browna w płynie: Ruch można uznać abstrakcyjnie za losowy spacer wynikający z przypadkowych uderzeń IID przez cząsteczki.
Jednym z przykładów, w którym CLT niekoniecznie jest zaangażowany, jest rozrzut strzał wokół oka byka: Odległość od oka byka można modelować jako rozkład Rayleigha (proporcjonalny do pierwiastka kwadratowego chi-sq z 2 DF) i kąt przeciwny do ruchu wskazówek zegara od dodatnia oś pozioma może być modelowana jako jednolita naNastępnie po zmianie współrzędnych biegunowych na prostokątne odległości w kierunkach poziomym (x) i pionowym (y) okazują się nieskorelowane dwuwymiarowe normalne. [To jest istota transformacji Boxa-Mullera, którą możesz znaleźć w Google.] Jednak normalne współrzędne xiy można uznać za sumę wielu małych niedokładności w celowaniu, co może uzasadniać mechanizm związany z CLT w tle .
W sensie historycznym powszechne stosowanie rozkładów normalnych (gaussowskich) zamiast rozkładów podwójnie wykładniczych (Laplace'a) do modelowych obserwacji astronomicznych może częściowo wynikać z CLT. We wczesnych dniach błędów modelowania takich spostrzeżeń toczyła się debata między Gaussem a Laplace'em , z których każdy opowiadał się za swoim ulubionym rozkładem. Z różnych powodów wygrał normalny model. Można argumentować, że jednym z powodów ostatecznego sukcesu rozkładu normalnego była wygoda matematyczna oparta na normalnych granicach CLT. Wydaje się, że jest to prawdą, nawet jeśli nie jest jasne, która rodzina dystrybucji zapewnia lepsze dopasowanie. (Nawet teraz wciąż istnieją astronomowie, którzy uważają, że „jedna najlepsza obserwacja”dokonane przez skrupulatnego, szanowanego astronoma z pewnością będzie lepszą wartością niż średnia z wielu obserwacji dokonanych przez przypuszczalnie mniej utalentowanych obserwatorów. W rezultacie statystycy w ogóle nie preferowaliby żadnej interwencji).
Wiele naturalnie występujących zmiennych jest zwykle rozmieszczonych. Wysokości ludzi? Wielkość kolonii zwierząt?
rnorm(1)
. To samo dotyczy wszystkich dystrybucji, innych niż wielomianowe.