Zmienność, która maleje wraz ze wzrostem N, jest zmiennością średniej próbki, często wyrażaną jako błąd standardowy. Lub, innymi słowy, rośnie pewność prawdziwości średniej próby.
Wyobraź sobie, że prowadzisz eksperyment, w którym zbierasz 3 mężczyzn i 3 kobiety i mierzysz ich wysokości. Czy jesteś pewien, że średnie wysokości każdej grupy są prawdziwym środkiem oddzielnych populacji mężczyzn i kobiet? Powinienem pomyśleć, że wcale nie byłbyś bardzo pewien. Możesz łatwo zebrać nowe próbki 3 i znaleźć nowe środki kilka cali od pierwszych. Kilka takich powtarzanych eksperymentów może nawet sprawić, że kobiety będą wyraźnie wyższe niż mężczyźni, ponieważ środki będą się tak bardzo różnić. Przy niskiej wartości N nie masz dużej pewności w średniej z próbki i różni się ona znacznie w zależności od próbki.
Teraz wyobraź sobie 10 000 obserwacji w każdej grupie. Trudno będzie znaleźć nowe próbki 10 000, które mają znacznie różniące się od siebie środki. Będą znacznie mniej zmienne, a będziesz bardziej pewny ich dokładności.
Jeśli możesz zaakceptować ten tok myślenia, możemy wprowadzić go do obliczeń statystyk jako błąd standardowy. Jak widać z jego równania, jest to oszacowanie parametru (który powinien stać się bardziej dokładny w miarę wzrostu n) podzielonego przez wartość, która zawsze wzrasta z n, . Ten błąd standardowy reprezentuje zmienność średnich lub efektów w twoich obliczeniach. Im jest mniejszy, tym silniejszy jest twój test statystyczny.σn−−√
Oto mała symulacja w R, aby wykazać związek między błędem standardowym a odchyleniem standardowym średnich z wielu wielu powtórzeń początkowego eksperymentu. W tym przypadku zaczniemy od średniej populacji 100 i odchylenia standardowego 15.
mu <- 100
s <- 50
n <- 5
nsim <- 10000 # number of simulations
# theoretical standard error
s / sqrt(n)
# simulation of experiment and the standard deviations of their means
y <- replicate( nsim, mean( rnorm(n, mu, s) ) )
sd(y)
Zwróć uwagę, że końcowe odchylenie standardowe jest zbliżone do teoretycznego błędu standardowego. Grając tutaj zmienną n, możesz zobaczyć, że miara zmienności będzie się zmniejszać wraz ze wzrostem n.
[Nawiasem mówiąc, kurtoza na wykresach tak naprawdę się nie zmienia (zakładając, że są to rozkłady normalne). Obniżenie wariancji nie zmienia kurtozy, ale rozkład będzie wyglądał na węższy. Jedynym sposobem na wizualne zbadanie zmian kurtozy jest umieszczenie rozkładów w tej samej skali.]