Jak działa standardowy błąd?


17

Ostatnio przyglądałem się wewnętrznym działaniom standardowego błędu i nie byłem w stanie zrozumieć, jak to działa. Rozumiem błąd standardowy, ponieważ jest to standardowe odchylenie rozkładu średnich próbek. Moje pytania to:

• skąd wiemy, że błąd standardowy oznacza odchylenie standardowe próbki, gdy zwykle pobieramy tylko jedną próbkę?

• dlaczego równanie do obliczenia błędu standardowego nie odzwierciedla równania odchylenia standardowego dla pojedynczej próbki?


Kiedy mówisz „pojedyncza próbka”, masz na myśli jeden zestaw próbek, czy tak naprawdę próbkę o wielkości 1?
Erik

1
Wyjaśniono je dla prostego, ale interesującego problemu (odpowiedź trójskładnikowa) w prostym, niestatystycznym języku na stronie stats.stackexchange.com/a/18609 .
whuber

Odpowiedzi:


13

Tak, błąd standardowy średniej (SEM) to odchylenie standardowe (SD) średniej. (Błąd standardowy to inny sposób określenia SD rozkładu próbkowania. W tym przypadku rozkład próbkowania jest średnim dla próbek o ustalonym rozmiarze, powiedzmy N.) Istnieje matematyczny związek między SEM a populacją SD: SEM = populacja SD / pierwiastek kwadratowy z N. Ten związek matematyczny jest bardzo pomocny, ponieważ prawie nigdy nie mamy bezpośredniego oszacowania SEM, ale mamy oszacowanie SD populacji (mianowicie SD naszej próby). Jeśli chodzi o twoje drugie pytanie, jeśli chcesz zebrać wiele próbek o rozmiarze N i obliczyć średnią dla każdej próbki, możesz oszacować SEM po prostu przez obliczenie SD średnich. Tak więc wzór na SEM rzeczywiście odzwierciedla wzór na SD pojedynczej próbki.


13

Załóżmy, że są niezależne i identycznie rozmieszczone. Z taką sytuacją jestem pewien, że masz na myśli. Niech ich wspólna średnia będzie μ, a ich wspólna wariancja będzie σ 2 .X1,X2,,Xnμσ2

Teraz średnia próbki wynosi . Liniowość oczekiwań pokazuje, że średnia X b wynosi również μ . Z założenia niezależności wynika, że wariancja X b jest sumą wariancji jej składników. Każdy taki termin X i / n ma wariancję σ 2 / n 2 (ponieważ wariancja stałej razy zmienna losowa jest stałą kwadratową razy wariancja zmiennej losowej). Mamy nXb=iXi/nXbμXbXi/nσ2/n2nidentycznie rozłożył takie zmienne, aby sumować, więc każdy termin ma tę samą wariancję. W rezultacie otrzymujemy dla wariancji średniej próbki.nσ2/n2=σ2/n

Zwykle nie znamy i dlatego musimy oszacować to na podstawie danych. W zależności od ustawienia można to zrobić na różne sposoby. Dwa najczęstsze oszacowania σ 2 ogólnego przeznaczenia to wariancja próbki s 2 = 1σ2σ2 s2=1ni(XiXb)2su2=nn1s2σ2σ2s/nsu/n


1
To jest bardzo dobre. Czy masz sugestie dotyczące książek lub czytania, aby rozwinąć podobną linię umiejętności myślenia? Dzięki.
q126y

Elegancka odpowiedź!
Jinhua Wang

7

σx¯2=σpop2nj,
σpop2njF
F=nj×sx¯2spooled within group2
sx¯2=j=1nj(x¯jx¯.)2nj1,
x.

Ponieważ zazwyczaj uważamy, że hipoteza zerowa nie jest prawdziwa, punkt @ JoelW. Ma rację, ale pracuję nad tym, ponieważ uważam, że jasność, jaką zapewnia, jest pomocna w zrozumieniu tych problemów.


2
Myślę, że twój komentarz jest w zasadzie taki sam jak ten, który został napisany z mniejszym zapisem matematycznym: stats.stackexchange.com/questions/32206/…
Joel W.
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.