Próbuję nauczyć się statystyki, ponieważ uważam, że jest tak powszechna, że zabrania mi uczenia się niektórych rzeczy, jeśli nie rozumiem jej poprawnie. Mam problem ze zrozumieniem tego pojęcia rozkładu próbkowania średnich próbek. Nie rozumiem, w jaki sposób niektóre książki i strony to wyjaśniły. Myślę, że rozumiem, ale nie jestem pewien, czy jest poprawny. Poniżej moja próba zrozumienia tego.
Kiedy mówimy o pewnym zjawisku przyjmującym rozkład normalny, dotyczy to zasadniczo (nie zawsze) populacji.
Chcemy użyć statystyk wnioskowania, aby przewidzieć pewne rzeczy na temat pewnej populacji, ale nie mamy wszystkich danych. Używamy losowego próbkowania i każda próbka o wielkości n jest równie prawdopodobna do wybrania.
Pobieramy więc wiele próbek, powiedzmy 100, a następnie rozkład średnich z tych próbek będzie w przybliżeniu normalny zgodnie z centralnym twierdzeniem granicznym. Średnia średnich z próby przybliży średnią populacji.
Teraz nie rozumiem wielu razy, kiedy widzisz „Próbkę 100 osób…” Czy nie potrzebowalibyśmy 10 lub 100 próbek 100 osób, aby przybliżyć średnią populacji? Czy może jest tak, że możemy pobrać pojedynczą próbkę, która jest wystarczająco duża, powiedzmy 1000, a następnie powiedzmy, że średnia przybliża średnią populacji? LUB czy pobieramy próbkę 1000 osób, a następnie pobieramy 100 losowych próbek 100 osób w każdej próbce z pierwotnego 1000 osób, które pobraliśmy, a następnie wykorzystujemy to jako przybliżenie?
Czy pobranie wystarczająco dużej próbki w celu przybliżenia średniej (prawie) zawsze działa? Czy populacja musi być normalna, aby to działało?