Niektóre książki podać przykładowy rozmiar rozmiarze 30 lub wyższy jest niezbędne do centralnego twierdzenia granicznego dać dobre przybliżenie .X¯
Ta powszechna zasada jest praktycznie całkowicie bezużyteczna. Istnieją rozkłady niestandardowe, dla których n = 2 da się dobrze, a rozkłady niestandardowe, dla których znacznie większe jest niewystarczające - więc bez wyraźnego ograniczenia okoliczności, reguła jest myląca. W każdym razie, nawet gdyby to była prawda, wymagane n będzie się różnić w zależności od tego, co robisz. Często otrzymujesz dobre przybliżenia w pobliżu środka rozkładu przy małym n , ale potrzebujesz znacznie większego n, aby uzyskać przyzwoite przybliżenie w ogonie.nnnn
Edycja: zapoznaj się z odpowiedziami na to pytanie, aby uzyskać wiele, ale pozornie jednomyślnych opinii na ten temat, oraz kilka dobrych linków. Nie będę jednak pracował nad tym, skoro już to wyraźnie rozumiesz.
Chcę zobaczyć przykłady rozkładów, w których nawet przy dużej wielkości próbki (może 100 lub 1000 lub wyższej) rozkład średniej próbki jest nadal dość wypaczony.
Przykłady są stosunkowo łatwe do skonstruowania; jednym prostym sposobem jest znalezienie nieskończenie podzielnego rozkładu, który jest nienormalny, i podzielenie go. Jeśli masz taki, który zbliży się do normy po uśrednieniu lub podsumowaniu, zacznij od granicy „zbliżonej do normalnej” i podziel ją tak, jak chcesz. Na przykład:
Rozważ rozkład gamma z parametrem kształtu . Weź skalę jako 1 (skala nie ma znaczenia). Powiedzmy, że uważasz za po prostu „wystarczająco normalne”. Następnie rozkład, dla którego musisz uzyskać 1000 obserwacji, aby być wystarczająco normalnym, ma rozkład .gamma ( α 0 , 1 ), gamma ( α 0 / 1000 , 1 )αGamma ( α0, 1 )Gamma ( α0/ 1000,1)
Więc jeśli uważasz, że Gamma z jest po prostu „wystarczająco normalna” -α = 20
Następnie podziel przez 1000, aby uzyskać :α = 0,02α = 20α = 0,02
Średnio 1000 z nich będzie miało kształt pierwszego pliku pdf (ale nie jego skali).
Jeśli zamiast tego wybierzesz nieskończenie podzielny rozkład, który nie zbliża się do normy, jak powiedzmy Cauchy, wówczas może nie być wielkości próby, przy której średnie próbki mają w przybliżeniu rozkład normalny (lub, w niektórych przypadkach, mogą nadal zbliżać się do normalności, ale nie masz efektu dla standardowego błędu).σ/ n--√
@ punkt Whubera na temat zanieczyszczonych dystrybucji jest bardzo dobry; warto wypróbować trochę symulacji z tym przypadkiem i zobaczyć, jak zachowuje się wiele takich próbek.