Jedną naiwną metodą aproksymacji rozkładu normalnego jest dodanie razem może zmiennych losowych IID równomiernie rozmieszczonych na , a następnie recenter i przeskalowanie, w oparciu o centralne twierdzenie graniczne. ( Uwaga dodatkowa : Istnieją dokładniejsze metody, takie jak transformacja Boxa-Mullera ). Suma zmiennych losowych IID jest znana jako rozkład sumy jednolitej lub rozkład Irwina-Halla .
Jak duży jest błąd w przybliżeniu jednolitego rozkładu sumy przez rozkład normalny?
Ilekroć pojawia się ten rodzaj pytania w celu przybliżenia sumy zmiennych losowych IID, ludzie (w tym ja) przywołują twierdzenie Berry'ego-Esseena , które jest skuteczną wersją centralnego twierdzenia granicznego, biorąc pod uwagę, że istnieje trzeci moment:
gdzie jest funkcją rozkładu skumulowanego dla przeskalowanej sumy zmiennych losowych IID, \ rho jest absolutnym trzecim centralnym momentem E | (X-EX) ^ 3 | , \ sigma jest odchyleniem standardowym, a C jest absolutną stałą, którą można przyjąć jako 1, a nawet 1/2 .
To jest niezadowalające. Wydaje mi się, że oszacowanie Berry'ego-Esseena jest najbliższe ostrym rozkładom dwumianowym, które są dyskretne, z największym błędem przy dla symetrycznego rozkładu dwumianowego. Największy błąd występuje przy największym skoku. Jednak rozkład jednolitej sumy nie ma skoków.
Testy numeryczne sugerują, że błąd zmniejsza się szybciej niż .
Przy zastosowaniu 1/2, oszacowanie Berry – Esseena wynosi
który dla około , i , odpowiednio. Rzeczywiste maksymalne różnice dla wydają się wynosić odpowiednio około , i , które są znacznie mniejsze i wydają się spadać jako zamiast .