Jak działa standardowy błąd?

17

Ostatnio przyglądałem się wewnętrznym działaniom standardowego błędu i nie byłem w stanie zrozumieć, jak to działa. Rozumiem błąd standardowy, ponieważ jest to standardowe odchylenie rozkładu średnich próbek. Moje pytania to:

• skąd wiemy, że błąd standardowy oznacza odchylenie standardowe próbki, gdy zwykle pobieramy tylko jedną próbkę?

• dlaczego równanie do obliczenia błędu standardowego nie odzwierciedla równania odchylenia standardowego dla pojedynczej próbki?

standard-error

— luciano
źródło

Kiedy mówisz „pojedyncza próbka”, masz na myśli jeden zestaw próbek, czy tak naprawdę próbkę o wielkości 1?

— Erik

1

Wyjaśniono je dla prostego, ale interesującego problemu (odpowiedź trójskładnikowa) w prostym, niestatystycznym języku na stronie stats.stackexchange.com/a/18609 .

— whuber

13

Tak, błąd standardowy średniej (SEM) to odchylenie standardowe (SD) średniej. (Błąd standardowy to inny sposób określenia SD rozkładu próbkowania. W tym przypadku rozkład próbkowania jest średnim dla próbek o ustalonym rozmiarze, powiedzmy N.) Istnieje matematyczny związek między SEM a populacją SD: SEM = populacja SD / pierwiastek kwadratowy z N. Ten związek matematyczny jest bardzo pomocny, ponieważ prawie nigdy nie mamy bezpośredniego oszacowania SEM, ale mamy oszacowanie SD populacji (mianowicie SD naszej próby). Jeśli chodzi o twoje drugie pytanie, jeśli chcesz zebrać wiele próbek o rozmiarze N i obliczyć średnią dla każdej próbki, możesz oszacować SEM po prostu przez obliczenie SD średnich. Tak więc wzór na SEM rzeczywiście odzwierciedla wzór na SD pojedynczej próbki.

— Joel W.
źródło

13

Załóżmy, że są niezależne i identycznie rozmieszczone. Z taką sytuacją jestem pewien, że masz na myśli. Niech ich wspólna średnia będzie a ich wspólna wariancja będzie . $X_1, X_2, \ldots, X_n$ $\mu$ $\sigma^2$

Teraz średnia próbki wynosi . Liniowość oczekiwań pokazuje, że średnia wynosi również . Z założenia niezależności wynika, że wariancja jest sumą wariancji jej składników. Każdy taki termin ma wariancję (ponieważ wariancja stałej razy zmienna losowa jest stałą kwadratową razy wariancja zmiennej losowej). Mamy $X_b=\sum_i X_i/n$ $X_b$ $\mu$ $X_b$ $X_i/n$ $\sigma^2/n^2$ $n$ identycznie rozłożył takie zmienne, aby sumować, więc każdy termin ma tę samą wariancję. W rezultacie otrzymujemy dla wariancji średniej próbki. $n \sigma^2/n^2 = \sigma^2/n$

Zwykle nie znamy i dlatego musimy oszacować to na podstawie danych. W zależności od ustawienia można to zrobić na różne sposoby. Dwa najczęstsze oszacowania ogólnego przeznaczenia to wariancja próbki $\sigma^2$ $\sigma^2$ $s^2 = \frac{1}{n}\sum_i(X_i-X_b)^2$ $s_u^2 = \frac{n}{n-1}s^2$ $\sigma^2$ $\sigma^2$ $s/\sqrt{n}$ $s_u/\sqrt{n}$

— Michael R. Chernick
źródło

1

To jest bardzo dobre. Czy masz sugestie dotyczące książek lub czytania, aby rozwinąć podobną linię umiejętności myślenia? Dzięki.

— q126y

Elegancka odpowiedź!

— Jinhua Wang

7

σ_{\bar{x}}^{2} = \frac{σ_{p o p}^{2}}{n_{j}},

$\sigma^2_{\bar x}=\frac{\sigma^2_{pop}}{n_j},$

σ_{p o p}^{2}

$\sigma^2_{pop}$

n_{j}

$n_j$

F

$F$

F = \frac{n_{j} \times s_{\bar{x}}^{2}}{s_{pooled within group}^{2}}

$F=\frac{n_j\times s^2_{\bar x}}{s^2_{\text{pooled within group}}}$

s_{\bar{x}}^{2} = \frac{\sum_{j = 1}^{n_{j}} ({\bar{x}}_{j} - {\bar{x}}_{.})^{2}}{n_{j} - 1},

$s^2_{\bar x}=\frac{\sum_{j=1}^{n_j}(\bar x_j-\bar x_.)^2}{n_j-1},$

x_{.}

$x_.$

Ponieważ zazwyczaj uważamy, że hipoteza zerowa nie jest prawdziwa, punkt @ JoelW. Ma rację, ale pracuję nad tym, ponieważ uważam, że jasność, jaką zapewnia, jest pomocna w zrozumieniu tych problemów.

— gung - Przywróć Monikę
źródło

2

Myślę, że twój komentarz jest w zasadzie taki sam jak ten, który został napisany z mniejszym zapisem matematycznym: stats.stackexchange.com/questions/32206/…

— Joel W.